首頁 > AI資訊 > 行業動態 > Facebook人工智能掌門楊立昆:AI最缺乏的是常識

Facebook人工智能掌門楊立昆:AI最缺乏的是常識

新火種    2023-11-03

乍一看Facebook人工智能研究掌門人Yann LeCun的名字,不少人可能懷疑這是個華人。也因為這個名字十分接近中文發音,江湖上流傳著“燕樂存”、“楊樂昆”等不同版本的音譯中文名。

7月4日,這位人工智能的法國大牛走上上海交通大學的講壇的時候,千人級禮堂“菁菁堂”幾乎座無虛席。或許是要終結譯名的混亂現狀,他的第一張PPT,無關人工智能,竟是宣布了自己的官方中文名字:楊立昆。

“我叫楊立昆”

楊立昆和他的老師Geoffrey Hinton、蒙特利爾大學的Yoshua Bengio并稱“深度學習三巨頭”,而這三人又分別效力于Facebook、谷歌和微軟,堪稱三足鼎立。這三巨頭有一個共同點:對高校感情很深。

2013年底,楊立昆受扎克伯格之邀出山,提出的條件是保留他在紐約大學的工作。這次做演講,他首先提到,他已經參觀過紐約大學在上海與華東師范大學合辦的上海紐約大學。楊立昆稱贊上海是一座匯集創新的城市,食物也很美味。

畫風高冷的FAIR

隨著楊立昆的到來,Facebook結束了沒有專門的人工智能研究室的時代,而且一設就是兩個:由楊立昆執掌的人工智能研究(FAIR)和負責對接應用場景的機器學習應用部門(AML)。

據FAIR成員、圍棋AI項目負責人田淵棟介紹,楊立昆領銜的FAIR學術氛圍十分濃厚,目標是發高質量的文章。“FAIR的研究方向相對自由寬松,沒有近期的產品壓力,可以著眼長遠做困難和本質的研究問題。”田淵棟認為,這樣的學術氛圍在各大公司極其少見。

FAIR的畫風也因此顯得有點“高冷”,Facebook旗下那些熱門產品,如Instagram和WhatsApp,與FAIR都沒有直接關系。楊立昆在一張PPT上展示了FAIR目前的開源項目,排在前三位的是Torch(Lua語言的深度學習框架)、PyTorch(Python語言的深度學習框架)和Darkforest(圍棋系統)。

出于對劉慈欣的科幻小說《三體》的喜愛,田淵棟取了Darkforest(黑暗森林)這個名字。眾所周知,谷歌旗下DeepMind公司的圍棋人工智能程序AlphaGo,在今年5月底3:0完勝“當今第一人”柯潔,站在世界棋壇的巔峰光榮退役。當澎湃新聞(www.thepaper.cn)問及“黑暗森林”的研發計劃是否會受到AlphaGo退役的影響,田淵棟說道,“談不上什么影響,還是該干嘛干嘛唄。”

卷積神經網絡之父

AlphaGo的橫空出世與震驚世界,是眼下如火如荼的人工智能“盛夏”的最好注腳。而這個夏天,早在幾十年前就被楊立昆埋下了一個伏筆。伏筆就是楊立昆的成名作:卷積神經網絡(Convolutional Neural Networks,CNN)。AlphaGo下棋時的策略網絡就是基于卷積神經網絡構建的。

在今天,我們已經習慣于計算機能夠“看到”這個世界,識別出靜態和動態的物體,并在此基礎上,挑戰自動駕駛等更高級別的任務。然而,在楊立昆讀大學的1980年代,計算機基本上是一個“瞎子”。

楊立昆從一開始就相信他能讓計算機“開眼看世界”。在他的理解里,圖像是由很多很多小的部分、小的特征組合而成。而卷積神經網絡,就是把圖像拆解成小塊,從中提取出特征,每一層提取的特征組合,都可被用于下一層更具體的特征識別。譬如,計算機可以先提取出最基本的輪廓和紋理,再利用輪廓和紋理提取類別。隨著深度的增加,算法可以提取出更高層級的抽象特征。

1998年,楊立昆提出了LeNet-5模型,是世界上第一個正式的卷積神經網絡。他現場展現了一段珍貴的視頻資料:依靠一個7層的卷積神經網絡識別屏幕上不斷變化著的手寫數字。

楊立昆的神經網絡在這個人工智能盛夏有多火熱,在他的研究初始階段就有多冷門。他見過真正的人工智能寒冬:技術進展停滯,資金和關注度下降,理論從本質上受到質疑。雪上加霜的是,主流學術圈更偏愛其他一些圖像識別方法,雖然這些方法后來都湮滅在時光中,但在當時卻結結實實令楊立昆坐了好久的冷板凳。

90年代中期,楊立昆在大名鼎鼎的貝爾實驗室工作,他的小組因內部斗爭被取締——那時候,他研發的利用神經網絡進行支票識別的ATM,差一點就要成功了。

到了21世紀頭幾年,其他一些競爭者甚至阻止他在學術會議上展示論文。Geoffrey Hinton回憶道:“計算機視覺圈子基本上不待見他,他們覺得他做的事情在80年代還有潛力,但是在2000年就過時了。”

“深度學習三巨頭”:Geoffrey Hinton、Yann LeCun、Yoshua Bengio

風水輪流轉得很快。隨著互聯網時代計算能力和數據量的大幅度提高,神經網絡迅速變得靈活、簡便而準確。楊立昆從邊緣人物一躍成為行業領軍人。“一年之內,所有人都在研究這個。真是太瘋狂了。”

人工智能最缺的是常識

而觀察這個世界,只是計算機理解這個世界的第一步。楊立昆在演講的后半部分,著重介紹了真正的“智能”所面臨的障礙。

目前,人工智能最缺乏的是常識。什么是常識呢?比方說,“這個獎杯放不進箱子,它太小了”,和“這個獎杯放不進箱子,它太大了”,這兩句話,人類從常識就可以知道,前面一個“它”指的是箱子,而后一個“它”指的是獎杯。這對計算機來說卻不是直觀的。

再比如說,在“湯姆拿起包離開房間”這個小視頻中,人類可以很自然地理解這一連串動作背后的邏輯:手碰到包就要抓住,不然是拿不起來的;離開房間要先開門再關門。但計算機只看到了一系列單個動作。

因此,楊立昆總結道,“常識就是靠預測填補空白的能力。”人類在生活的耳濡目染中接收了大量信息,由此形成了常識。在信心不足的時候,靠因果邏輯就能補上空檔。只有預測到行為的后果,才能談得上“規劃”。理性=預測+規劃,這是楊立昆給出的公式。

計算機想要獲得媲美人類的預測能力,必然需要海量的數據。這就是“無監督學習”想要實現的目標。

楊立昆使用了“蛋糕”比喻,描述機器學習的三大流派。純粹的強化學習可以根據少量樣本預測出一個分數,監督學習可以用人類給定的樣本預測一個特定的類別,而無監督學習需要用大量樣本,對任何被觀察的物體給出任意方向上的預測,比如通過視頻的上半段預測視頻的下半段。

強化學習是蛋糕頂上綴著的一顆櫻桃,監督學習是蛋糕表面的糖霜,雖然現在的人工智能看起來很漂亮,但人類對如何制作蛋糕胚本身——無監督學習,還是摸不著門路。

這個比喻看上去對強化學習不夠尊重,因此楊立昆強調,這個蛋糕是黑森林蛋糕——黑森林蛋糕是一定有櫻桃的。目前,強化學習在游戲程序領域,比如圍棋和星際爭霸,扮演著很重要的角色。

圖說:“蛋糕”比喻

對抗訓練(adversarial training)在無監督學習方面取得了一些成績。即由一個生成網絡,隨機創造正確或錯誤的數據,再由一個鑒別網絡鑒別數據與正確答案的區別。兩個網絡互相博弈,交互學習,逐漸向最優演進。不過,楊立昆認為,這離實現完全的無監督學習還很遙遠。

那么,人工智能離人類的“理性”到底有多遠呢?楊立昆的態度比較謹慎。雖然卷積神經網絡最早的靈感雛形來源于對貓大腦皮層的研究,楊立昆并不感冒仿生學。鳥類對于飛機來說,最大的價值是證明了飛行是可行的,激勵人類探索飛行。但最后造出飛機的原理,卻和鳥類并不是一回事——振翅并不重要。大腦這臺完美的“機器”激勵人類去探索人工智能,但是需要多少時間、怎樣的方式才能接近這個藍圖,誰也說不好。

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章