中國人工智能界曾爭論:走日本路線還是走美國路線
如果要總結2023年的科技產業大事件,人工智能幾乎可算貫穿全年的主線之一。
從去年年底GPT-3通用語言大模型出現“智慧涌現”,到今年年初ChatGPT高調出圈;從如火如荼的“千模大戰”,到“所有業務都值得用人工智能再做一遍”;從英偉達市值一飛沖天,再到OpenAI的人事變動大戲……
不過,在過去數十年的大部分時間里,這條AI賽道上沒有IPO的鑼聲和花團錦簇,有的只是漫長的荊棘之路。
對中國AI人來說,更是如此。由于錯過了上世紀50年代世界人工智能的第一波高潮,中國人工智能界沒有明斯基、麥卡錫、司馬賀、費根鮑姆、辛頓這樣的權威學者,但從上世紀70年代起,我們迎頭追趕,以相對有限的資源投入,不僅在符號主義人工智能的研究上取得了世界級的成果,也趕上了神經網絡研究的熱潮,逐步追到今天世界第二的位置。
這個過程中,一件大事是國家“863”計劃。在上世紀90年代全球人工智能跌入低谷的轉折時刻,“863-306”主題通過持續投入,在高性能計算機、智能接口、智能應用等方面取得一批重大科研成果,為我國培養了一大批進入國際高技術前沿的計算機人才,也成為曙光、漢王、中科星圖、科大訊飛、寒武紀等一大批高技術公司的源頭。
近期出版的《中國人工智能簡史(第1卷)》,通過大量對當事人的采訪,以中國計算機學會的人工智能和模式識別委員會,以及中國人工智能學會的部分人員為主線,系統梳理了從1979年到1993年中國人工智能發展早期的源流,為今天希望了解和投身人工智能領域的朋友們提供了一張不可多得的地圖。
本文是科工力量對《中國人工智能簡史(第1卷)》作者之一、雷鋒網創始人林軍的采訪實錄。
科工力量:“人工智能”如今不僅成為科技界熱詞,甚至已經深入到普通人的日常生活中,成為檢驗一個國家科技發展的試金石,中國也成為這個新賽道的重要參與者。您當初是怎么萌生要撰寫一部《中國人工智能簡史》的想法的?
林軍:高文老師在序言里也提到了,那是2018年的元旦,我在美國圣地亞哥白沙灘陪女兒度假,突然接到老師的視頻電話。他說,有個關于《中國人工智能史》的PPT,想問問我的意見。
我聽著聽著,發現畫風不對,原來他是想忽悠我來寫。我頭腦一發熱,就答應了。
幾周之后,我回到國內,跟高文老師在辦公室面談。高老師給了一個思路,以中國計算機學會的人工智能和模式識別委員會,以及中國人工智能學會的部分人員為主線,展開我們的訪談。
中國計算機學會(CCF)是一級學會,其人工智能和模式識別專委會是相當于其他學會的二級學會,具有較大的影響力。而中國人工智能學會(AAI)起初并不是一個純粹的搞人工智能的學會,其中還包含了很多社科和哲學等領域的學者,這一定程度上導致他們與計算機科學為主的學會之間某種程度的不契合。隨著時間的推移,中國人工智能學會也逐漸轉向更專注于自然科學和工程領域的方向。
以這兩大學會的人員和發展為線索,在一定程度上能夠反映中國人工智能領域的發展歷程,當然,也不完全涵蓋所有對人工智能領域有重要貢獻的學者和機構。
然后我就去了一趟東北,拜訪了中國自然語言領域的重要老師、哈工大的老系主任王開鑄,還到吉林大學找了王湘浩的學生劉大有等人?;貋砗箝_始構思和準備寫作。
但是這本書的出版經歷的時間比較長,也有點曲折,首先因為我當時正在集中精力寫《沸騰新10年》,到了2020年,又出現疫情影響,再疊加當時人工智能話題在輿論圈不是熱點了,出版社也不太熱心,就把出版進度給耽擱了。但是訪談一直在推進。
到了2022年底,ChatGPT又火了,我們就加快進度,在2023年先出版第一卷。目前,第二卷寫了一半多,第三卷寫了30%,我們想爭取春節前把第二卷寫完,到明年7月能把第三卷寫完。
科工力量:去年年底以來,通用大模型進展迅猛,國際上有谷歌、微軟這樣的大公司不斷引領創新,國內企業也積極跟進,人工智能的江湖前途未定、精彩紛呈。這會不會影響到你們第三卷的寫作?
林軍:我們這三本書的邏輯設計是,第一卷寫學術起源,厘清中國人工智能的源頭在哪,開山立派的宗師是誰;第二卷是開枝散葉,更多寫教育家的故事,這一階段正值全球人工智能低谷,各位宗師們開始傳弟子,這些學生現在大都是各大高校的系主任、各大科研院所的所長、各個體系的帶頭人;第三卷我們認為應該寫繼往開來,談一些人工智能產業化的進展,因為2008年之后互聯網崛起,開始有算法推薦引擎、有機器視覺、有自動駕駛等產業應用。
2021年我們的寫作一度停頓,原因之一就是發現這一系列寫作有點難以收尾。
當時,雖然語音、語義、機器,安防、自動駕駛等各種各樣的應用場景都已經衍生出來,但它只是大家對 AI的產業化過程中比較前沿的一些應用的投入,在資本市場上也有一定的高估和泡沫。
本來我們不知道該怎么結尾,總不能寫一部產業史,最后寫到行業一地雞毛,到2022年下半年GPT出現了,我們就可以把結尾落到GPT大模型帶來的新的產業化。同時,這兩年人工智能發展很快,我們會再寫一個面向未來的篇章。
科工力量:高文院士在序言寫道,人工智能在世界和中國幾十年發展,是一個螺旋前進的過程,現在人工智能火了,很多研究者和從業者不知道歷史,就有很多似是而非,您怎么看待這個問題?
林軍:過去幾十年,人工智能并不是一門顯學。
我就是學人工智能的,專業是圖像處理和模式識別,現在叫作計算機視覺,實際上我們當年畢業的時候很難找到工作,一個方向是去公安局,因為有罪犯的抓捕用到拍照和識別;另一個方向是去航天系統,做數據傳輸和遙感這些方向,合適的工作機會很少。
所以在我們看來,人工智能長期處于行業低谷。我們是完整經歷過低谷和高潮的,所以在低谷的時候,我們沒有那么悲觀,在高潮的時候,我們也沒那么樂觀。
現在對人工智能的炒作和鼓吹,有些來自科幻愛好者,他們更多是依靠想象力,但我們是計算機出身,更多還是要講這些事情有沒有可行性,從理論和邏輯上推演,能不能成功。當下有些輿論熱點跟計算機本身是有沒關系的,但大模型是算力提升帶來的結果,這是有可行性的,雖然解釋性還有點問題。
科幻小說《三體》
我們認為,當下算力提升帶來的人工智能高潮,是又一波螺旋上升,會帶來一批新的應用推向市場,吸引市場上新的投資投入研發,開發新的算力。當然這個過程中又會有一些泡沫,算力的持續迭代本身也是一個周而復始的過程,呈現波浪前進的特點。
現在有很多年輕人是在泡沫過程中加入進來的,這可能產生一些問題。我們認為,對于新技術帶來的可能性,永遠是既不要高估,也不要低估。
科工力量:書中第八章和第十五章集中講述了“863-306計劃”的故事,高文院士當時主導智能接口研究,李國杰院士主導“曙光”系列計算機,在全球人工智能低谷期,中國人工智能的研究和產業化為什么能加速追趕?
林軍:要承認,在863-306項目早期,我們確實一度想向日本“抄作業”。
上世紀90年代中期,日本大力推動第五代計算機,不但在人工智能方面加速追趕,同時在存儲芯片上強勢發力。英特爾也因此放棄了存儲芯片的生產,將這項業務外包臺積電代工,才有了自身芯片業務的涅盤重生。
日本風光一時,在中國就有了參考美國還是日本的不同路線之爭。當時國內有不少人傾向于日本路線,高文和李國杰兩位院士作為當時的年輕人,對確定路線發揮了作用。
這是這本書第八章的內容,當時,高文正在日本留學,學習的就是人工智能,他給出的意見是認為日本的人工智能路線有問題。李國杰當時在美國普渡大學讀書,與王凱、黃英杰等人很熟,提供了很多美國方面的情況,也提出了自己的見解。
他們兩位都采用了實事求是的方法,導致中國在人工智能重要方向的抉擇上,選擇了高性能計算路線,也就是美國路線,而不是日本五代機路線,更加符合中國國情,對中國產業界和應用層面也帶來更多的幫助,包括后來863-306項目對科大訊飛的支持,這是后話。
在計算機和人工智能方面,有很多人埋頭做自己的事,但事實證明,在有限的資源限制下,哲學思維和戰略方向很重要。
科工力量:在本書2018年策劃之前,2016年的AlphaGo也掀起一波人工智能熱潮,您認為當時的情況跟現在對比,有哪些相同點,有哪些不同點?您也是媒體從業者,怎樣看待當下在人工智能方面的輿論和投資環境?
林軍:2016年,雷鋒網與中國計算機學會合作創立“全球人工智能與機器人大會”(GAIR),這可能是我個人對逢“6”的年份有些玄學的著迷,你看,2006年初是“iPhone時刻”;1996年微軟發布了Windows95;1986年是第一臺386計算機發布,是PC的重要時刻……
所以我們認為2016年AlphaGo事件是人工智能在公眾領域破圈,也很可能標志著人工智能的一個重要時刻,并且擁有了小范圍的擁躉和投資先行者,并裹挾一些投機人員進入這個領域。
到了2022年,ChatGPT出現,這時行業已經發展了六年多,第一批投機者已經被擠出去了,又有新的投研機構會加入進來,目前看來,人工智能像PC和移動互聯網一樣成為一個產業的可能性已經比較大了。
一旦成為產業,它再往下走向新的低谷的可能性很小,我個人認為,人工智能產業在2026年左右會到達一個高點,然后進入橫盤。
科工力量:當下有一些國內的大企業和國家隊在對標GPT,但也有一些輿論認為國內水平還差得遠,您認為如何客觀評價?
林軍:到年底國內能夠達到GPT-3.5的水平,到明年年中大概能追到GPT-4的水平,這是目前大家比較客觀、統一的認知。
科工力量:這樣追趕的話,差距是在縮小還是擴大?
林軍:在縮小。
我們有一個很有意思的觀察,我們曾經在硅谷見了當時在Facebook中最年輕的華人e9級人才王美宏,他后來在快手擔任過海外技術總負責人。
王美宏是全球最早做推薦引擎的人,他對我們分享了自己的觀察。
2012年,他就在Facebook做推薦引擎,2014年他有一次回國,當時國內大家都只是聽說過這些引擎,沒有人在做;2016年他再次回國的時候,發現國內做的推薦引擎已經有模有樣了;到了2018年,他發現國內的推薦引擎已經做得比國外好了。
從這個小例子可以看出,只要有驅動力,在應用創新方面,中國人是領先的,只是在底層技術能力的創新方面,的確還沒有美國人強。
美國人能做出安卓,中國人能做出微信,大概是這樣的邏輯。
科工力量:國外人工智能擁有先發優勢和生態優勢。之前AlphaGo出圈,當下ChatGPT出圈,加上英偉達的GPU芯片、cuda工具鏈、TensorFlow和PyTorch的主流ai框架,大量的開發者,強勢的英語語料,還有成熟的資本和融資環境,共同構成了一個具有先發優勢的強勢ai生態。面對這樣的情況,中國的企業應該怎么應對?
林軍:這要看我們怎么定義“中國企業”。如果所謂“中國企業”是在中國創立,只用中國原創技術,做中國本土業務的企業,那這樣的討論可能沒什么必要。但是如果談論的是中國人主導的,擁有全球業務的企業,那是有很多變化和討論空間的。
我舉個簡單例子,《數據安全法》出臺后,字節跳動正在推動數據跨境流動“第一案”。這件事情的背景是,國內的視頻內容比美國量大得多,生態豐富程度也比美國強得多,抖音的數據量10倍于Tik Tok,字節跳動因此希望能夠以國內數據為材料,以不受限制的國外算力來訓練人工智能大模型。
其實美國的頂級科技企業也一樣,像英偉達這樣的算力提供者,也有很強的沖動在中國市場銷售產品。這是一個很有意思的話題,美國的巨頭們也正在面臨一個國家立場和自身價值觀的沖突問題,因為他們要做全球生意,特別是要支持全球化。
像可口可樂、惠普、IBM、微軟、谷歌、Facebook、英偉達等等這些全球巨頭,都是曾經超越了國家之間的沖突,業務遍布全球,美國本土生意只占20%-30%,中國巨大的市場在這里擺著,他們想放棄也放棄不了。
在這個問題上我是樂觀的,只要我們愿意堅持開放和交流,以中國人的勤勞和智慧,必能將全世界資源為我所用。
科工力量:大模型需要那么多算力,它有明顯的基礎設施特征,邊際成本是遞減的,有很強的規模效應。國外的發展現狀是,由跨國巨頭或者巨頭聯盟來提供這樣一個公共基礎設施,供全球使用,作為中國來說,是否需要新型舉國體制才能與之抗衡?
林軍:超級計算機和算力網絡無疑是國家關鍵的基礎建設,其重要性甚至可以比肩核武器。
中國可能的確還沒有能力率先造出這件“核武器”,但是我們有可能在別人造出核武器的情況下,跟隨造出核武器,只要有交流和信息的傳遞,就不可能阻斷技術的擴散。
高文老師領銜鵬城實驗室,從一開始就圍繞為華為提供算力基礎設施這項使命來建設。它是一個結合科研目標和產業轉化為導向的實驗室,這是一種新的機制,傳統的大學可能更多圍繞科研目標,而鵬城實驗室同時面向產業,有自己的工程化管理能力,集中了全國和全球最好的人才,可以說是“新型舉國體制”的一個代表。
鵬城實驗室主任高文院士
科工力量:中國人工智能發展有高端人才不足的短板,同時擁有大批優秀的年輕人,如何看待這個局面?對有志于投身人工智能領域的年輕人,您有什么建議?
林軍:第一,在人工智能方面,中國擁有全世界最好的高等教育人才批量培養體系;第二,中國缺少大師,這是兩個事實。
順便一提,美國方面和我們相反,他們有大師成長的體系,但是在人才大批量培養方面不行。
這是有歷史淵源的,世界人工智能在這波起勢前,曾經兩起兩落,中國的人工智能發展是在第二波人工智能浪潮開始的時候起步的,所以天生就比世界水平晚了一個周期,這也是我們現在缺乏大師的原因。
但是中國在應用層面擁有獨一無二的人才培養機制,現在還擁有全球獨一無二的豐富應用場景。2016年前后,中國出現了機器視覺(CV)四小龍,為什么它們首先出現在中國,而沒有出現在美國呢?機器視覺落地往往是算法有了,需要針對特定場景進行具體的工程化適配調參,在這件事情上,美國的人力成本很高,而1979年以來,中國培養出了一批基礎比較扎實,擅長解決場景問題的人才,落地場景也更豐富。
未來在計算機領域,算力越來越成為核心資源,而算法將在商業上成為新的驅動力。所以,中國人工智能的業者如果想有所作為的話,我的建議是,選定算力或者算法方向,年輕的時候到海外走走,見見世面,在海外獲得一定成就之后回國發展,這仍然是一個快捷高效的路徑。
科工力量:這本書的寫作過程中有沒有一些遺憾?
林軍:我們想說一個挺感傷的事情。在這本書的采訪和編輯出版過程中,就有一些前輩老先生離開了我們。在中國科技史上,通過我們這次小小的努力,留下了一些先行者的珍貴史料。
《簡史》編寫過程中逝世的(老)先生們
董振東
著名中文信息處理專家、知網發明人。2019年2月逝世。
第十五章“306 漸入佳境”中提及在機器翻譯中的相關貢獻。
Thomas Huang
華人計算機視覺泰斗,桃李滿天下。2020年4月逝世。
在第六章“計算機視覺青出于藍”中有專門一節。
劉敘華
中國人工智能研究領域開拓者、吉林大學教授。1994年腦出血進入植物人狀態。2020年5月逝世。
第一章“符號主義與數學家”中提及劉敘華作為王湘浩的主要助手對早期AI的推動。
邊肇祺
模式識別先驅、《模式識別》教材編著者。2021年3月逝世。
第三章講模式識別和第七章講清華AI研究均有提及。
許孔時
計算機軟件科學家,中國科學院軟件研究所創所所長。2021年9月逝世。
第一章“中國的達特茅斯會議”中提及許孔時為1979年吉林大學CCF會議的小組成員;第五章“計算理論的春天和計算語言學興起”中提及許孔時對馬希文的幫助。
俞士汶
計算語言學先驅、北京大學計算語言所前所長。2021年11月逝世。
第五章“計算理論的春天和計算語言學興起”中提及在馬希文出國后主持計算語言所的工作。
劉開瑛
著名自然語言處理領域學者,山西大學教授。2022年3月逝世。
第五章“計算理論的春天和計算語言學興起”中提及。
李三立
中國工程院院士、清華大學計算機系原系主任,我國微機結構學術帶頭人。2022年3月逝世。
第七章“清華大學的人工智能研究”中提及在早期清華人工智能建設中起的作用。
孫劍
2022年6月逝世。
在第六章“計算機視覺青出于藍”中提到鄭南寧的時候順帶提了孫劍。
劉倬
中國機器翻譯開山鼻祖,NLP先行者。2022年9月逝世。
第五章“計算理論的春天和計算語言學興起”中提及。
楊叔子
機械工程專家、教育家、華中科技大學前校長。2022年11月逝世。
在第九章“機器人的曲折向前”中有提到楊叔子作為學術帶頭人對華中工學院(華中科技大學)機器人領域的貢獻。
涂序彥
自動控制和人工智能領域著名科學家、中國人工智能學科的主要奠基人,中國人工智能學會前理事長。2023年3月逝世。
第二章“中國人工智能學會的籌備”和第四章“專家系統的井噴”中均提到涂序彥的相關工作和在早期人工智能研究者群體中的突出位置。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。