熱門文章
信息流的未來與人工智能的機(jī)會
發(fā)布時間:2019-07-26 分類:趨勢研究
在當(dāng)今社會,尤其是融合了社交內(nèi)容的移動互聯(lián)網(wǎng)時代,如何更好地連接人與信息,已成為人類社會的一個重要基礎(chǔ)命題。個性化的信息流已經(jīng)成為一種新的連接方式,人與信息、萬物互聯(lián)。
那么,在信息流產(chǎn)品平臺與服務(wù)這個領(lǐng)域里,如何高效地處理、分析、挖掘、理解和組織海量文字、圖片(視頻),更好地連接人與信息呢?并根據(jù)對用戶的深度理解,來進(jìn)行信息的智能推送呢?無疑,人工智能具有巨大的潛力。從內(nèi)容創(chuàng)作、過濾、分發(fā)、消費(fèi)以及互動的每個環(huán)節(jié),我們都可以使用大規(guī)模機(jī)器學(xué)習(xí),包括文本分析、自然語言理解、計算機(jī)視覺和數(shù)據(jù)挖掘等技術(shù),向用戶進(jìn)行智能推送。同時,我們還可以基于信息流豐富多樣的應(yīng)用場景和用戶,持續(xù)累積大量的訓(xùn)練樣本和數(shù)據(jù),讓機(jī)器學(xué)習(xí)系統(tǒng)形成閉環(huán),不斷地改善和進(jìn)化,在機(jī)器人輔助內(nèi)容創(chuàng)作、自動視頻分析與理解,個性化推薦和問答等方面發(fā)展人工智能核心技術(shù)。本文將分享筆者對人工智能發(fā)展前景的一些看法,包括人工智能的本質(zhì)、近幾年重要的技術(shù)發(fā)展,以及企業(yè)應(yīng)該如何建立人工智能的核心戰(zhàn)略競爭力。
連接人與信息:從結(jié)繩記事到超級智能
自古以來,人類社會一個最重要的基礎(chǔ)需求,就是人與信息的連接。最早的信息傳遞用的是“結(jié)繩記事”技術(shù)。那時候還沒有語言,有大的事情就結(jié)一個大的結(jié),小的事情就結(jié)一個小的結(jié)。公元100年左右,蔡倫發(fā)明了紙,后來有了書。11世紀(jì)40年代,畢昇發(fā)明了活字印刷術(shù),為印書提供了便利,讓書實(shí)現(xiàn)了比較廣泛的傳播。在很長一段時間內(nèi),書和紙是人類社會傳播信息的主要工具。20世紀(jì)90年代,數(shù)字圖書館出現(xiàn),美國開始把全國的圖書數(shù)字化,開始出現(xiàn)搜索、管理、影像分析等。在互聯(lián)網(wǎng)時代,網(wǎng)站成為紙張之外的另一個主要信息來源。但人只能定點(diǎn)于個人電腦(PC)上。雖然有了搜索引擎和相對應(yīng)的廣告引擎,但大部分搜索還受限于它的不能移動性。當(dāng)我們走路或者外出時,往往還會隨身攜帶雜志或報紙。
最近十年,移動互聯(lián)網(wǎng)與智能手機(jī)不再受限于固定的地理位置,這讓紙制印刷品進(jìn)一步減少。尤其在近幾年,這一趨勢明顯,很多傳統(tǒng)媒體、傳統(tǒng)出版社都轉(zhuǎn)型為網(wǎng)絡(luò)媒體。
在PC互聯(lián)網(wǎng)時代,搜索引擎可以借著爬蟲軟件在網(wǎng)頁上抓取信息,但到了移動互聯(lián)網(wǎng)時代,很多信息都藏在應(yīng)用里面,雖然不能利用搜索引擎將每個App里的信息輕松“爬出”,但是在這股潮流中涌現(xiàn)出一些新的應(yīng)用,讓我們能夠重新定義信息的源頭。例如今日頭條有“頭條號”。我們可以與很多信息供應(yīng)商、內(nèi)容提供商、媒體創(chuàng)作者一起來構(gòu)建新的內(nèi)容平臺和生態(tài)系統(tǒng)。以前我們需要做很多信息抽取的工作,現(xiàn)在可以直接拿到結(jié)構(gòu)化的數(shù)據(jù)。
到了今天,更多的公司開始大規(guī)模使用人工智能做個性化推薦。因?yàn)槿藗兪褂弥悄苁謾C(jī)有了很多碎片化時間,產(chǎn)生了學(xué)習(xí)、娛樂等需求。這些需求也產(chǎn)生了各式各樣的應(yīng)用場景。我們發(fā)現(xiàn),在推薦引擎領(lǐng)域有了一個將人與信息相連接的新機(jī)會。搜索引擎里所有的排序算法、內(nèi)容分析等技術(shù),都可用于進(jìn)一步的個性化精準(zhǔn)推薦,從而變成信息流?!靶畔⒘鳌笔且环N新的、更智能的方式,讓人能夠隨時隨地在需要時得到所需要的信息。人工智能不但能夠做個性化推薦,還能夠不受地域限制享受服務(wù)。我們的目標(biāo)就是——用無所不在的超級機(jī)器智能幫助人類創(chuàng)作、發(fā)現(xiàn)、使用、分發(fā)信息,并進(jìn)行社交場景的互動。
隨著技術(shù)的進(jìn)一步發(fā)展,會出現(xiàn)超級智能,人工智能與人可以互相幫助,從而讓彼此變得更聰明。人工智能需要很多標(biāo)注數(shù)據(jù)和訓(xùn)練樣本,在信息流的場景,人們有更多機(jī)會拿到更多標(biāo)注數(shù)據(jù)以及更細(xì)顆粒度的標(biāo)注,來幫助人們做自然語言理解、自然語言生成、圖像視頻理解和圖像視頻生成。人將與人工智能進(jìn)一步共同進(jìn)化。這是一個非常值得期待的未來。
人工智能的本質(zhì)是軟件產(chǎn)業(yè)革命
在過去五年,人工智能快速發(fā)展。之前,人工智能雖然有機(jī)器學(xué)習(xí),但往往受限于傳統(tǒng)思維?,F(xiàn)在,研究人員不再受限過去20年的經(jīng)驗(yàn)和成就,而是更大膽地開始創(chuàng)新。
今天人工智能的本質(zhì)其實(shí)是軟件產(chǎn)業(yè)的革命。軟件正在改變?nèi)澜?Software is eating the world),而軟件產(chǎn)業(yè)本身正在被人工智能的發(fā)展所顛覆。越來越多的軟件開發(fā)不再只是依靠軟件工程師的想法、邏輯和認(rèn)知,而這些軟件的核心已變成非常大的模型,有上千億的參數(shù),有各式各樣的大數(shù)據(jù)。通過訓(xùn)練各種各樣的模型,包含統(tǒng)計模型、符號、邏輯、知識表達(dá),軟件產(chǎn)業(yè)已被人工智能化。
今天,視頻、圖像、文字都已經(jīng)被數(shù)字化,下一個階段就是語義化,比如圖像理解。在數(shù)字原始表達(dá)空間,計算機(jī)很難做語義理解,我們需要深度學(xué)習(xí)模型來學(xué)習(xí)非線性的轉(zhuǎn)化。機(jī)器跟人的思維方式不一樣,機(jī)器算得快,任何問題只要能表達(dá),使用加減乘除就能完成得很好。今天的人工智能的本質(zhì)其實(shí)是軟件產(chǎn)業(yè)的革命,借由大數(shù)據(jù)、大計算和機(jī)器學(xué)習(xí)來訓(xùn)練大模型,“編寫”越來越智能的軟件。
從數(shù)據(jù)學(xué)習(xí)機(jī)器能理解的語義表達(dá)
我們已經(jīng)到了這樣一個時代,有了更好的技術(shù),能夠直接從數(shù)據(jù)中學(xué)習(xí)機(jī)器能理解的表達(dá)方式。使用深層神經(jīng)網(wǎng)絡(luò)從數(shù)據(jù)本身直接學(xué)習(xí)機(jī)器能夠“理解”的語義表達(dá)空間。輸入是原始的數(shù)據(jù)空間,是信息化和數(shù)字化之后的結(jié)果,例如數(shù)字圖片和它的語義標(biāo)注,在輸入的數(shù)字化原始數(shù)據(jù)空間里,它們的向量表達(dá)和分布一般是非常復(fù)雜的。
但借由深度學(xué)習(xí),我們可以學(xué)到所需要的非線性轉(zhuǎn)換函數(shù)來把它們變換或映射到一個機(jī)器能理解的新的語義表達(dá)空間里。在這個新的空間里,機(jī)器能借著計算來處理許多需要人類智能的復(fù)雜工作。數(shù)據(jù)量越大,學(xué)習(xí)出來的表達(dá)方式越好,從而帶來更高的識別精度。這將構(gòu)成一個正向循環(huán)。
我們希望能訓(xùn)練更大、更深的網(wǎng)絡(luò)。但這也帶來一定的挑戰(zhàn),因?yàn)樾枰蟮臄?shù)據(jù)和更大的計算平臺,這也讓分布式機(jī)器學(xué)習(xí)的平臺變得非常重要。盡管今天的大部分應(yīng)用還依賴于監(jiān)督學(xué)習(xí),但是也還有很多研究,比如對抗學(xué)習(xí)(GAN),是生成模型與辨別模型互相對抗,在博弈論的框架里面彼此學(xué)習(xí)。這就好像訓(xùn)練兩個模型,一個是學(xué)生模型,一個是教練模型,教練不斷出更好、更難的題目來測試學(xué)生,學(xué)生也借由這些更難的題目被訓(xùn)練得更好。學(xué)生的進(jìn)步又使得教練必須不斷加強(qiáng)他的能力。
例如,一個花樣滑冰選手在大部分的場景都跳得很好,但是三周跳需要改善動作,教練就需要有好的生成模型來產(chǎn)生更多的這方面的訓(xùn)練樣本。學(xué)生在進(jìn)行大量的針對性的訓(xùn)練之后,才能不斷進(jìn)步。另外,非監(jiān)督學(xué)習(xí)、弱監(jiān)督學(xué)習(xí),還有人機(jī)互動學(xué)習(xí)也是一個很重要的新方向。