超人類感知如何實現(xiàn)?專家:站在AI肩上,眼鏡是入口
由北京圖書大廈、北京大學(xué)出版社主辦,北大博雅講壇、文匯講堂工作室承辦的北大博雅講壇624期“Sora帶來的超人類時空感知暨《對話時代》新書研討講座(北京專場)”現(xiàn)場 ,李淼、李祖希和倪賢豪就朱嘉明視頻里提出的話題展開熱烈討論
【導(dǎo)讀】12月初,由“AI教母”之稱的斯坦福大學(xué)李飛飛在今年4月組建的World Labs發(fā)布首個空間智能項目成果,讓人咋舌:僅憑一張圖,就能生成一個3D游戲世界的AI系統(tǒng)。與生成式大模型預(yù)測的是像素相比,更進一步的是,AI系統(tǒng)可以預(yù)測3D場景。這就涉及李飛飛的首個創(chuàng)業(yè)公司W(wǎng)orld Labs的方向——空間智能,即視覺化為洞察,看見成為理解,理解導(dǎo)致行動。該公司3個月就突破10億美元估值。李飛飛近日也宣稱,理解世界運作的方式是AI的下一步,我們需要從大語言模型轉(zhuǎn)向大世界模型。
空間智能,通俗來講,就是AI感受到并創(chuàng)造出的三維空間。
在文匯講堂第八本新書《對話時代——鑄造新質(zhì)生產(chǎn)力的強國之路》7月寫就的長篇序言里,作者朱嘉明教授就在“不斷加速推進的人工智能前沿”一節(jié)里詳盡介紹了這個領(lǐng)域的新發(fā)展。他認(rèn)為,基于AI大模型的空間智能,可引導(dǎo)人類進入“一種全新的存在”,而具身智能可能是這里的“原住民”。
今年10月底,在京滬兩地展開了本書研討講座,在北京圖書大廈舉辦的講座主題就是空間智能。由清博智能副總裁、創(chuàng)新院院長李祖希主持,橫琴粵澳深度合作區(qū)數(shù)鏈數(shù)字金融研究院學(xué)術(shù)與技術(shù)委員會主席朱嘉明、北京智源人工智能研究院戰(zhàn)略研究中心負(fù)責(zé)人倪賢豪、中山大學(xué)天文與空間科學(xué)研究院教授兼著名科普作家李淼,展開了一場非常前沿也很專業(yè)又有豐富視角的對話講座。
現(xiàn)分三篇整理后予以分享。兩篇為內(nèi)容,第三篇為互動。此為內(nèi)容下。
“AI教母”李飛飛11月底提出大語言模型應(yīng)轉(zhuǎn)向大世界模型 圖源:投資界微信公號
AI提升超人類感知
李祖希:AI能否提升人類對于時空或空間的感知?比如說現(xiàn)在我們能看到的很有限,所以借助一些監(jiān)測設(shè)備、儀器幫助我們感知這個世界,這已經(jīng)是一種拓展。AI出現(xiàn)之后能不能進一步地拓展人類的超能力,無論是朱老師剛剛提到的多維的空間,還是更多超日常的感知體驗?
*可嘗試用元宇宙憑空訓(xùn)練出第四維空間
李淼:這個問題應(yīng)當(dāng)分成兩部分。
第一,我們生活的這個世界叫作三維空間,它有前后、左右、上下三個方向,非常具體且真實存在。例如,人們向前走路,飛機向上空飛,鳥兒也向天空飛,魚往水里游,這些都與我們的日常生活經(jīng)驗有關(guān)。
科幻作家艾勃特(Edwin A.Abbott)曾寫了一本書《平面國》(Flatland),假設(shè)存在一個只有前后和左右的二維世界,有一些生物生活在其中。它們只有二維的生活經(jīng)驗,認(rèn)為這個世界是一條線的,因為看不到其他生活現(xiàn)象。那么,人工智能是否能讓我們體會到更高維度的空間,比如四維空間?
科幻作家艾勃特(Edwin A.Abbott)和《平面國》(Flatland)
如何用二維展現(xiàn)三維?例如,通過繪畫、手機就可以看到三維的世界,因為利用了視覺原理或透視原理。但透視原理無法用三維展示四維,或用二維展示四維。比如,用二維展示四維,可以畫一個像魔方一樣的正立方體。有的人甚至能夠想象出一個超立方體。但我們對此沒有四維的感知,僅僅知道這是超立方體。
問題是,能否用元宇宙憑空訓(xùn)練出第四維空間的事物?我非常希望存在這種可能性。這也值得期待,因為四維空間比三維空間更加奇妙,就像兩個圖片比一張紙奇妙,一張紙又比一條線奇妙。關(guān)于能否體會到量子世界的問題,我認(rèn)為一方面沒必要,另一方面通過我們的五感難以呈現(xiàn)。
*自動駕駛可視為一種超視距,超越人類感知
倪賢豪:人類的超時空感知是一個非常前沿甚至科幻的理解,但確實可以通過AI的方式實現(xiàn)逼近的過程。純粹從人的五感來說,人類看到、聽到的范圍有限,但AI已經(jīng)實現(xiàn)了超人類的時空感知。
以自動駕駛為例,借助衛(wèi)星的定位,借助車載傳感器、超聲波、毫米波等視覺傳感器,已經(jīng)有一些超視距的駕駛。目前這些也算是AI的一部分,也是具身智能、自動駕駛的一部分。這種超時空感知與我們想象的“上天入地”的模式還有距離,但它確實是一種嘗試的狀態(tài)。
看到一張二維圖片,想要模擬或設(shè)想出一種四維的物體,這對于人類來說是非常困難的。換句話說,我們從二維的一張圖到三維或四維,中間丟失了許多信息。這有點類似于一元線性方程,突然變成了一元二次甚至二元多次方程,這個方程組僅有目前的數(shù)據(jù)可能無法解開。但是通過AI的方式,就能夠在它算力可接受的范圍內(nèi)提供各種可能的求解,可以通過基于我們模擬或設(shè)想這一三維、四維物體的目的,篩選出最合適的結(jié)果。
現(xiàn)在有很多類似的嘗試。比如在圖像方向給你一個描述,或給你一個被遮住半張臉的人臉,我們用AI的方式可以模擬出整張臉應(yīng)該有的樣子。這種技術(shù)目前已非常成熟,包括今年的各種圖片擴展,比如我們隨手拍了展廳里的兩根立柱照片,把它放進AI模型里,它可能會自動延展開,在整個廣角鏡頭下出現(xiàn)一個完整的展廳。這也是AI對超人類時空感知的一個模擬。
12月下旬,李飛飛、謝賽寧發(fā)文正在全力推進空間智能對邊界的感知 圖源:量子位
*實現(xiàn)科幻里的超人類感知,需要硬件和內(nèi)容改進
至于未來能否實現(xiàn)科幻作品中的超人類時空感知,這就需要我們的模型出現(xiàn)更大的變化,同時要用現(xiàn)在不斷進化的模型幫助我們的基礎(chǔ)科學(xué)領(lǐng)域進行發(fā)現(xiàn)或者研究。目前主要的研究方向是用AI做半導(dǎo)體設(shè)計、藥物研發(fā),以及各種材料設(shè)計。
在硬件設(shè)備方面,可能需要很多傳感器方向的一些革新,不能只涉及人類的聽覺或視覺,還需要更廣域的頻率。除了超聲波、毫米波,也需要一些紅外傳感器等共同演化。這么多的數(shù)據(jù)能夠放到一起融合,本身肯定已經(jīng)超出人類能夠感知的范圍的極限了。
這些數(shù)據(jù)全部輸進去訓(xùn)練一個模型,它能夠生成的東西肯定不只是三維。因此,軟硬件應(yīng)當(dāng)一起推進。
李祖希:您認(rèn)為AI空間是否能夠推動人類對多維時空的認(rèn)識?
主持人分享上海場“最新AI算力”的信息,該場來自商湯的嘉賓劉遠輝期待聽到超人類感知的討論
李淼:現(xiàn)在談第三世界的基本規(guī)律還過早,因為它處于相對初級階段。現(xiàn)在才開始有元宇宙、大模型、Sora,以后或許還會有層出不窮的東西。我總結(jié)三個不同階段:第三世界處于初級階段,第二世界(精神世界)處于第二階段,第一世界(物質(zhì)世界)已快完結(jié)。
*“第三種存在”未來或通過一副眼鏡實現(xiàn)
倪賢豪:現(xiàn)在還不太清楚第三種存在最后實現(xiàn)的方式,它有虛擬的世界,也有對現(xiàn)實世界的增強,但最后我們的載具,按照目前的發(fā)展,可能是以眼鏡的形態(tài)出現(xiàn),但具體什么時候到來還不好判斷,只能說快了。
那么這個世界應(yīng)該符合怎樣的基本規(guī)律?如果說涉及與人類正常生活的第一存在、第二存在相關(guān)聯(lián)的一個密切的點,那就是需要符合物理規(guī)律,比如宏觀要符合牛頓定律,微觀要符合量子力學(xué),否則很難在現(xiàn)實中使用,尤其是與我們自己生活、工作最為密切相關(guān)的一些場景。
至于其他一些特定場景,可能就像小說家所希望的,在未來的元宇宙或者AI空間的這種第三種存在中做一些靈感的迸發(fā),作家本人可能需要親自設(shè)定一些不限制的場景,可以不符合物理規(guī)律,或者說他自己編寫出了一套規(guī)律、假設(shè),在這個空間里做一些實現(xiàn)。這是一種任務(wù)型的場景,可以更加天馬行空。
蘋果公司推出的Vision Pro頭顯已能實現(xiàn)和手機互動 圖源:蘋果公司官網(wǎng)
對于未來暢想的基本規(guī)律,更多的是在通用場景下符合物理規(guī)律的要求。站在今天的視角,AI空間與元宇宙是相互融合的,并且在有限的時間如10年之內(nèi)能到來,那它的入門設(shè)備應(yīng)該是一副眼鏡,因為它能像手機那樣成為人類延展的一部分,又不會帶來太多的攜帶壓力,同時交互起來又比較容易。比如去年年底,蘋果公司推出的Vision Pro頭顯,其實已經(jīng)能夠?qū)崿F(xiàn)手動直接交互,追蹤的準(zhǔn)確性和實時性比較好。但它的缺陷之一就是太重,一天戴兩三個小時就是極限,所以,硬件設(shè)備這方面需要改進。
在內(nèi)容方面,高效的AI快速渲染生成是主流。當(dāng)然,視頻內(nèi)容制作廠商或者個人會更加嘗試使用AI技術(shù)工具去進行內(nèi)容生成,這也是必然的。
現(xiàn)在比較夸張地說,我們每個個體都能當(dāng)大片導(dǎo)演。只要我們把想法輸入到ChatGPT里,它就會生成一個劇本,再把這個劇本作為內(nèi)容輸入到視頻生成模型里,它也能生成一些新的創(chuàng)意。最后我們再用一些視頻或者圖像編輯剪輯工具把它做成更加合理的樣子。其實很多視頻制作人都是這樣操作的,所以這也是目前短期已經(jīng)實現(xiàn)的部分。
關(guān)于未來遠期的發(fā)展方向和基本規(guī)律,一是AI技術(shù)的多行業(yè)滲透;二是人類用AI工具的入口載具變革,載具形態(tài)就是一副眼鏡;三是在不同場景下符合物理規(guī)律。
*量子力學(xué)先有理論后有證明,AI才能證明量子貓
李祖希:也就是說,一開始需要我們不停地訓(xùn)練它,模仿我們?nèi)祟?,之后它就可能有一些獨特的獨立的發(fā)展方向了。這個問題我們也聽聽朱嘉明老師的觀點。
朱嘉明:我們知道,至少從1925年海森堡提出矩陣量子結(jié)構(gòu)以來,量子力學(xué)已有近100年的發(fā)展歷史。但是,量子力學(xué)不是發(fā)現(xiàn),也不是發(fā)明。量子力學(xué)是通過超強的抽象能力,先有形而上的理論和公式,之后通過100年的歷史證明所證明的科學(xué)理論。現(xiàn)在人們接受這個世界的物質(zhì)是不連續(xù)的,接受諸如量子糾纏這樣的概念。人們接受與常識性認(rèn)知是根本不同的觀念,突破牛頓經(jīng)典物理學(xué)的束縛,是人類文明的升級。
還有,證明夸克的存在不過是過去的三四十年的事情。其歷史也是理論走在發(fā)現(xiàn)的前面,發(fā)現(xiàn)不過是一種證明方式。
朱嘉明認(rèn)為,只有AI才能證明量子貓的存在
如今,人工智能與量子力學(xué)正在形成相互融合的趨勢,這樣的融合將展現(xiàn)前所未有的物理世界。例如,可以斷言,人工智能可以證明薛定諤量子貓的存在。
在人類歷史上,常常先有想法后被歷史證明,這是人類文明進步的非常重要的特征,世界上很多東西是先驗的。所以,現(xiàn)在需要以更開放的思想理解唯物主義和唯心主義。
超人類感知如何影響未來
李祖希:最后暢想一下第三種存在出現(xiàn)之后,我們在近期、中期或更長遠的時間里可能面臨哪些機遇和挑戰(zhàn)?
*《奇點臨近》觀點:2045年AI智能超過人類智能
朱嘉明:目前對于這種全面侵入人類文明的人工智能還是低估的,三年五載就會進入到歌、畫、文章、思想,你分不清楚到底是人還是機器創(chuàng)造的。
現(xiàn)在不是人機融合,是人機組合時代已經(jīng)全面開始。將來馬斯克去完全是建立在人工智能的基礎(chǔ)上,現(xiàn)在的戰(zhàn)爭已被無人機所左右,人工智能正在全方位地接管和替代人類,現(xiàn)在是人類如何回應(yīng)的問題。
庫茲韋爾在20年后又寫了《奇點更近》一書,提出三類人類主體
很多人都知道庫茲韋爾在2005年寫了《奇點臨近》這本書,他在書中提出,人工智能會在上個世紀(jì)末超速發(fā)展,到2035年,AI智力跟人類智力是平起平坐;到了2045年,AI智能會超過人類智能,所以這10年就是“人類文明的奇點”。 最近15年基本驗證了他的預(yù)言。最近他又出版了《奇點更近》,主要觀點是,隨著基因工程、腦機接口這些技術(shù)的出現(xiàn),世界主體將分為三類,一類是我們碳基人,一類是被人工智能改造過的人類,還有一類是純粹的人工智能,這三者構(gòu)成了人類文明的主體,這個時代10—20年就會來臨。
以人工智能對未來藝術(shù)行業(yè)的影響為例。在三類主體共存下,藝術(shù)的本質(zhì)也會被一些元素改變,比如說數(shù)據(jù),還有人工智能導(dǎo)致的Token就成為藝術(shù)的基本元素。而量子物理里的量子糾纏、夸克、核聚變,以往都是屬于物理科學(xué)家研究范圍的事物,以后就會和藝術(shù)界融合成為藝術(shù)的內(nèi)容。在某種程度上,藝術(shù)會重新回到文藝復(fù)興時期,維持了兩三百年的藝術(shù)分工會被打破,一般民眾就可能成為藝術(shù)的創(chuàng)造者,藝術(shù)將會變成無界的。
*開放態(tài)度中有懷疑:去做AI不能做的事
李淼:我對人工智能全面取代人類和超越人類持開放的態(tài)度。開放的態(tài)度意思是說可能但是不一定。比如說在下圍棋方面AI已經(jīng)超越人類,這是確定性的。但我們并沒有看到它在更多方面超越人們。文心一言也會寫文章,但我沒看到它寫的任何一篇文章超越我喜歡的小說、詩歌。那AI能不能真的超越人類呢?
很多年前有讓人眼前一亮的兩句汽車廣告詞——“車到山前必有路,有路必有豐田車”,這只有我們?nèi)祟惒拍軐懙贸?,對吧?像恒源祥的“羊羊羊”廣告,或者“今年過節(jié)不送禮,送禮就送腦白金”這種特別洗腦的廣告語,我懷疑人工智能是能做到的。再比如說人類文學(xué)史,是從口頭的傳說也就是講故事,發(fā)展到詩歌再到唱歌,在中國是到詩到詞到曲、到小說、到電影、到戲劇。試問人工智能能不能搞出一個超越電影的形式,并且人類也能接受?我比較懷疑。
所以,如果讓我給大家提建議,以后就找那種人工智能做不到的事情來做。
*奇點到前先學(xué)會善用AI,站在巨人和AI 肩上
北京圖書大廈顧客看到講座駐足而聽
倪賢豪:一方面,確實像李淼老師提到的,代表人類智慧的天花板方向的工作,AI現(xiàn)在還很難做到,或2045年奇點來臨才會改變。
另一方面,在絕大多數(shù)領(lǐng)域,不太需要在平均水平的工作人員身上體現(xiàn)出這樣的天花板。如果AI寫不出激動人心的作品,但它會議記錄寫得非常好;它或許寫不出一首很好的詩歌,但它每天寫音頻轉(zhuǎn)成文本,它甚至能夠區(qū)分是誰說的,這對于普通的勞動力造成了一定的挑戰(zhàn)。
作為普通人,我經(jīng)常借助ChatGPT的幫助,比如外出徒步看到地上有一個小土堆,覺得像個螞蟻窩又不太確認(rèn)時,我用拍照求助它確認(rèn);比如看到一條狗狗在地上躺著睡覺,黑狗身上有一些白毛發(fā),我會拍照求助詢問是否年紀(jì)有點大了。很多人有過極限的工作體驗,讓我們挑戰(zhàn)難題,不僅需要腦力也需要體力,而80%的工作是基礎(chǔ)性的,那么我們可以選擇讓AI完成基礎(chǔ)工作,留出精力去攻克最難部分。
現(xiàn)場嘉賓觀點同中有異
在2000年代初,我們嘗試用百度、Google等搜索引擎,后來這樣的嘗試很自然地內(nèi)化成了我們的生活習(xí)慣、工作習(xí)慣。所以,在實現(xiàn)天花板突破的人工智能到來前,我們或許可以培養(yǎng)自己和小朋友們養(yǎng)成使用大模型或者AI工具的好習(xí)慣,至少能夠做到不容易被基礎(chǔ)的人工智能替代掉。
令人擔(dān)憂的是,現(xiàn)在能夠更好地使用AI的人群或者團體或許也會帶來兩極化,而科技的初心是讓大家的資源分配更加平均一些。
李祖希:謝謝。您也提醒我們,未來我們不光是站在前人的肩膀上,也要站在AI的肩膀上。不是讓它代替我們,讓我們躺平,而是在AI的工作的基礎(chǔ)上實現(xiàn)更好的工作的效果,探索工作的未知。 整理:李念 金夢
作者:倪賢豪 朱嘉明 李祖希 李淼
文:倪賢豪 朱嘉明 李祖希 李淼 圖:朱梅全 李念攝編輯:李念責(zé)任編輯:李念
轉(zhuǎn)載此文請注明出處。
- 免責(zé)聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認(rèn)可。 交易和投資涉及高風(fēng)險,讀者在采取與本文內(nèi)容相關(guān)的任何行動之前,請務(wù)必進行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。