熱門文章
第三波人工智能潮與以往有何不同?
發(fā)布時間:2019-06-26 分類:趨勢研究
[本輪人工智能主要算法的靈感來源于認(rèn)知科學(xué)、博弈論和量子力學(xué)等廣闊的領(lǐng)域,大數(shù)據(jù)驅(qū)動的算法主導(dǎo)的科學(xué)研究范式(第四范式)被應(yīng)用于各個學(xué)科的研究,他山之石可以攻玉,其他學(xué)科的進展也能反哺人工智能的創(chuàng)新,并可能起到至關(guān)重要的革命性作用,特別是腦科學(xué)、心理學(xué)等學(xué)科發(fā)展可能與AI的發(fā)展形成閉環(huán)和相互促進的良性關(guān)系。]
[由于受當(dāng)時歷史條件所限,AI能做的事情很有限,大眾對AI前景不切實際的樂觀和AI所承諾的能力均未能兌現(xiàn),引發(fā)上世紀(jì)70年代長達10年的首次AI寒冬。]
[摩爾定律驅(qū)動算力在過去30年提升了百萬倍,為數(shù)據(jù)驅(qū)動的人工智能提供了強勁的動力。]
人工智能(AI)自1956年誕生以來,60多年來經(jīng)歷了“三起二落”的波折的發(fā)展歷程。
2016年,隨著谷歌圍棋機器人AlphaGo的一戰(zhàn)成名,從國家到企業(yè)層面,隨處都能見到人工智能的身影。隨著經(jīng)濟增速的放緩以及資本的退潮,人工智能的“寒冬論”又開始甚囂塵上,“一哄而上,一哄而散”帶來了一地雞毛,人工智能的未來,究竟何去何從?
人工智能歷史會重演嗎
AI之父、圖靈獎獲得者約翰·麥卡錫在1956年的達特茅斯夏季研討會締造“人工智能”一詞時,曾有不同的聲音。在英語中,Artificial(人工、人造)一詞略帶貶義,如人造革、人造絲等,暗藏著一點“假”的意思,當(dāng)時英國的一些學(xué)者更愿意使用“思考機器”的提法。阿蘭·圖靈憑借他的“謎一樣的機器”(enigma)破解了德軍密碼,大大加速了二戰(zhàn)結(jié)束的進程,減少了上千萬人的傷亡,居功至偉,他提出了著名問題:機器可以思考嗎?
從這個角度看,其實人工智能這個術(shù)語還是貼切的。今天,AI的核心支柱——機器學(xué)習(xí)并不是在進行主動的學(xué)習(xí),而只是在被“訓(xùn)練”,更本質(zhì)的來說,只是通過尋找最小誤差值的方法來進行參數(shù)擬合(Fitting),并不具有任何意識。在小數(shù)據(jù)等需要人類認(rèn)知能力的領(lǐng)域,今天的AI就連5歲的孩子都比不上,例如,兒童在看到幾張照片后,就能輕松地學(xué)習(xí)到“貓”的概念,而“先進的”卷積神經(jīng)網(wǎng)絡(luò)需要對大量的標(biāo)簽數(shù)據(jù)進行學(xué)習(xí)才能完成類似的任務(wù)。即便如是,得益于算法的改進和指數(shù)增長的計算能力,在特定的場景中,AI已經(jīng)展現(xiàn)出令人驚嘆的能力,并且對部分行業(yè)的創(chuàng)新產(chǎn)生了關(guān)鍵影響。
麥卡錫對人工智能的定義是:制造智能機器的科學(xué)與工程。在人工智能誕生后的十多年里,科學(xué)家們致力于通過模仿人的思維來實現(xiàn)智能。今天的人工智能算法,例如神經(jīng)網(wǎng)絡(luò)、知識圖譜和對話機器人的雛形在那時都已經(jīng)出現(xiàn),由于受當(dāng)時歷史條件所限,AI能做的事情很有限,大眾對AI前景不切實際的樂觀和AI所承諾的能力均未能兌現(xiàn),引發(fā)上世紀(jì)70年代長達10年的首次AI寒冬。
80年代初,日本成為了當(dāng)時全球第二大經(jīng)濟體,在技術(shù)上也積極謀求世界領(lǐng)先的地位,提出了“五代機”(第五代計算機,前四代計算機代表性技術(shù)分別是:電子管、晶體管、大規(guī)模集成電路和超大規(guī)模集成電路)的設(shè)想,英美等政府也被迫跟進,對相關(guān)技術(shù)進行了大量投資,同時,機器學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)算法也出現(xiàn)了兩項突破。基于物理學(xué)能量概念的霍普費爾德網(wǎng)絡(luò)被提出;在今天深度學(xué)習(xí)中仍然具有重要作用的“反向傳播”的方法被廣泛應(yīng)用于神經(jīng)網(wǎng)絡(luò)的參數(shù)訓(xùn)練中,取得了不錯的效果,并成為今年(2019)圖靈獎得主杰弗瑞·辛頓(JefferyHinton)獲獎的重要依據(jù)之一;90年代初,時任貝爾實驗室負(fù)責(zé)人的楊力昆(YannLeCun,紐約大學(xué)教授,2019年圖靈獎得主,美國工程院院士,原FacebookAI研究院主任)實現(xiàn)了商用的手寫數(shù)字識別,美國有10%的支票的識別使用了該算法,1992年,采用簡單神經(jīng)網(wǎng)絡(luò)控制的卡內(nèi)基梅隆大學(xué)的首輛無人駕駛的裝甲車也上路了。盡管如此,但是受制于當(dāng)時的計算力和數(shù)據(jù)量,人工智能逐漸湮沒于快速崛起的互聯(lián)網(wǎng)的奪目光芒中,但是,這個階段的理論儲備為今天的AI發(fā)展提供了重要的源泉(知識儲備)。
前兩次AI的繁榮具有兩個特點:一是從參與者來看,主要政府投資主導(dǎo),企業(yè)參與度低,落地應(yīng)用極為有限;二是技術(shù)上均是以邏輯推理為核心的符號主義占據(jù)了主導(dǎo)地位,神經(jīng)網(wǎng)絡(luò)學(xué)派的發(fā)展長期被壓抑,客觀上,神經(jīng)網(wǎng)絡(luò)所需要的數(shù)據(jù)量和算力條件當(dāng)時也不成熟,AI的主要形式也因此表現(xiàn)為確定的推理,難以處理現(xiàn)實中遇到的大量不確定性問題。
當(dāng)下處在第三波人工智能浪潮之上
互聯(lián)網(wǎng)30年的快速發(fā)展,社交網(wǎng)絡(luò)、物聯(lián)網(wǎng)和云計算所產(chǎn)生的海量數(shù)據(jù)為本輪人工智能的繁榮提供了燃料。摩爾定律驅(qū)動算力在過去30年提升了百萬倍,為數(shù)據(jù)驅(qū)動的人工智能提供了強勁的動力。2006年,加拿大科學(xué)家杰弗里·辛頓(GeoffreyHinton)教授等人一年之內(nèi)連發(fā)三篇重量級論文,標(biāo)志著深度學(xué)習(xí)時代的開啟。自2016年AlphaGo引爆了媒體以來,AI得到整個社會的關(guān)注。
與前兩次人工智能浪潮不同,很多和業(yè)務(wù)緊密結(jié)合的AI應(yīng)用場景已經(jīng)或正在落地,企業(yè)成為了最主要的推動者。技術(shù)上,深度學(xué)習(xí)作為機器學(xué)習(xí)的一種,放棄了之前符號主義的機械推理,而采用了基于概率的范式,使得應(yīng)用場景得以大幅度地拓展。符號主義則以知識圖譜的形式延續(xù)下來,成為新一代搜索引擎的核心技術(shù)。
同時,繁榮之下的局限也是顯而易見的。首先,深度學(xué)習(xí)技術(shù)上缺乏理論的支撐,目前是模型的結(jié)構(gòu)和訓(xùn)練是經(jīng)驗主義主導(dǎo),未來深度學(xué)習(xí)理論的誕生將能減少算法對算力和數(shù)據(jù)的依賴;其次缺乏突破性的算法思想。深度學(xué)習(xí)中大紅大紫的卷積神經(jīng)網(wǎng)絡(luò)(CNN)和長短時記憶網(wǎng)絡(luò)(LSTM)都是在上世紀(jì)八九十年代就被提出了的,只是囿于當(dāng)時數(shù)據(jù)量和算力,才沒有流行。本輪人工智能繁榮中真正令人眼前一亮的創(chuàng)新點乏善可陳,對抗神經(jīng)網(wǎng)絡(luò)(GAN)引入博弈論的思想、AlphaGo強化學(xué)習(xí)結(jié)合深度學(xué)習(xí)、自然語言處理中的詞向量等技術(shù)可以算是為數(shù)不多的重要創(chuàng)新。
經(jīng)典力學(xué)和量子力學(xué)的發(fā)展過程與今天的深度學(xué)習(xí)近似:第谷收集了大量行星運動數(shù)據(jù),他的助手開普勒在這些數(shù)據(jù)中發(fā)現(xiàn)了行星運動三大定律,但未能指出背后的原理,直到牛頓在三大定律基礎(chǔ)上提出萬有引力定律;在量子力學(xué)領(lǐng)域,人們很早就獲得了氫原子的光譜數(shù)據(jù),但是無法解釋。今天,我們擁有大數(shù)據(jù),也有一些不錯的深度學(xué)習(xí)模型,但是還缺乏理論的支撐。
本輪人工智能主要算法的靈感來源于認(rèn)知科學(xué)、博弈論和量子力學(xué)等廣闊的領(lǐng)域,大數(shù)據(jù)驅(qū)動的算法主導(dǎo)的科學(xué)研究范式(第四范式)被應(yīng)用于各個學(xué)科的研究,他山之石可以攻玉,其他學(xué)科的進展也能反哺人工智能的創(chuàng)新,并可能起到至關(guān)重要的革命性作用,特別是腦科學(xué)、心理學(xué)等學(xué)科發(fā)展可能與AI的發(fā)展形成閉環(huán)和相互促進的良性關(guān)系。
在工業(yè)界,除了金融、零售等少數(shù)數(shù)據(jù)條件好而且“離錢近”的行業(yè),傳統(tǒng)行業(yè)在數(shù)字化轉(zhuǎn)型過程中,面臨數(shù)據(jù)采集、數(shù)據(jù)治理和缺乏人才等一系列挑戰(zhàn)、直接利用人工智能變現(xiàn)具有一定難度。換個角度看,這些行業(yè)也具有極大的潛力,可以先從一些簡單的“速贏”場景切入,逐步培育數(shù)據(jù)文化和人才,先對已有業(yè)務(wù)進行優(yōu)化。
本輪人工智能的上半場在C端衣食住行方面都已普及,接下來的主戰(zhàn)場將在B端,企業(yè)不要總是想著風(fēng)口,踏踏實實地將一個個AI場景落地才是王道。整個社會各行業(yè)的數(shù)字化轉(zhuǎn)型將持續(xù)數(shù)十年,即便學(xué)術(shù)界在未來十年在AI理論上沒有大的突破,對于行業(yè)的AI場景落地并不會產(chǎn)生太大的瓶頸效應(yīng),大部分企業(yè)AI場景并非一定要使用最酷炫的技術(shù),合適的技術(shù)才是最好的。
根據(jù)Gartner的估計,未來企業(yè)對于預(yù)測算法的需求將指數(shù)增長,其中大部分場景并不需要追求極致的預(yù)測準(zhǔn)確率,使用目前流行的框架和工具,普通程序員和商業(yè)分析師就能滿足大部分這類需求,對于少數(shù)核心場景,例如金融行業(yè)的風(fēng)控,零售行業(yè)商品推薦,1%的準(zhǔn)確率的提升都會帶來巨大的價值,企業(yè)自然會在這些領(lǐng)域不遺余力地進行投入,數(shù)據(jù)科學(xué)家未來的用武之地也將轉(zhuǎn)移到這些領(lǐng)域。
今天,AI的主要目標(biāo)不再是讓它像大腦一樣思考,而是利用其獨特的能力,做好人類的助手,如同工業(yè)革命解放我們的體力那樣,AI解放我們重復(fù)性工作所需的腦力,讓我們有更多的時間和精力從事更有價值的創(chuàng)造性工作。雖然,今天對于沒有意識的AI統(tǒng)治人類的擔(dān)心如同杞人憂天,但是我們已經(jīng)看到大量的行業(yè)正在數(shù)字化轉(zhuǎn)型的進程中,現(xiàn)實物理世界被逐漸映射到虛擬的數(shù)字空間之中,主宰虛擬世界的算法如同法律,其在虛擬世界中的決策作用在現(xiàn)實生活中不斷顯現(xiàn),電影《黑客帝國》所預(yù)言的時代似乎已經(jīng)觸手可及。AI正在成為人類新的潛意識,替我們進行著各項決定,雖然我們好像擁有最終決策權(quán),卻對我們正生活在自己編織的信息繭房之中常常不自知。
(作者鄔學(xué)寧系數(shù)據(jù)科學(xué)50人成員、復(fù)旦大學(xué)人工智能客座講師)