【“數智說”系列人物對話】薛向陽:數字浪潮風起云涌類腦智能優勢獨特
本期訪談人物:
復旦大學計算機科學技術學院教授、博士生導師 薛向陽
“科技迭代的速度越來越快,我們鉚足了勁往前去追,希望可以摸索出一些出路。作為科研工作者,我感到非常激動;同時,我還有一種緊迫感,在如此的歷史機遇面前,我希望自己能夠不負時代,有所作為,為社會發展帶來更多創新技術。“
ChatGPT的橫空出世讓人工智能再次成為熱詞,社會各界對它的探討與思考也逐漸走向了更深層次:眼下的人工智能已發展到了什么程度?再一次突破技術瓶頸還需哪些條件?在人工智能浪潮中,我國又處于怎樣的地位?
要回答這些問題,不妨去最前沿的科學研究領域看一看。復旦大學類腦人工智能科學與技術研究院副院長薛向陽教授長期浸潤于人工智能的科研一線,對人工智能有著大量的科研成果及產業化經驗,日前,《科創板日報》記者與薛向陽教授進行了對話探討。
據介紹,早在上世紀70年代后期,復旦大學就開啟了人工智能兩個重要方向的研究,即計算機視覺和自然語言處理,目前已形成了一支頗具規模的AI研究團隊。薛向陽教授領導的計算機視覺團隊開發了計算機視覺算法庫,包含了圖像字符檢測與識別、行人重識別、單目三維目標檢測等性能領先的算法模型,顯著提升了檢測識別精度。此外,該AI研究團隊還自主開發了基于深度神經網絡的自然語言處理算法庫,最近開源了大型語言模型MOSS,大大降低了自然語言處理技術的應用門檻……
從完成特定任務的小模型,到多任務大模型
“回顧我的學術生涯,激動二字是我最大的感觸。”薛向陽稱,這種激動之情,是算法的快速迭代發展所帶來的,“你很難再找到另一個行業,可以在短短十多年內,發生如此高頻的迭代進化,而且,這種迭代進化還極大推動了社會經濟的發展,引發了深刻的產業變革”。
薛向陽介紹稱,在過去短短十幾年的時間里,計算科學發生了“翻天覆地”的變化,“由于數據的爆發式增長、CPU/GPU計算能力的大幅提高、硬件的快速迭代和深度學習算法的發展成熟,計算科學領域取得了顯著的成就——其實,仔細算起來,深度學習算法也就發展了不到十年的時間”。
對此,作為科研工作者,薛教授最直接的感受是課題研究的方式變了。
“過去我們做研究,是一個任務、一個模型、一批數據,各個課題小組根據任務‘單兵作戰’;現在有了大模型,它可以實現通用化,不再需要那么多單個的任務小組了。但是,大模型需要算力,動輒需要幾百上千個高性能GPU卡,這又讓學術研究的門檻提高了很多。”薛向陽表示。
更進一步來說,薛向陽認為,隨著大模型在日常生活中的逐漸滲透,未來的人才培養方式也會發生改變:相較于考試“得分”,學生的創造力及創新能力會顯得更加重要。
更值得一提的是,在這股技術浪潮面前,薛向陽坦言,中國還有自身獨特的優勢。
“首先,中國具有多應用場景的優勢,在由應用所驅動的研究領域,我們已經處于全球領先水平;其次,在原創性的基礎研究方面,雖然目前國內還有短板,但再有一段時間,想必也會有所突破。”薛向陽稱,從全球范圍來看,在人工智能研究領域取得重大突破的,有不少杰出的華人科學家。
因此,作為科研工作者,薛向陽既感覺到自己面對著巨大的機會窗口,可作為的空間廣闊,又明顯感到自己責任在肩:“科技迭代的速度越來越快,我們鉚足了勁往前去追,也希望可以摸索出一些出路。作為科研工作者,我感到非常激動;同時,我還有一種緊迫感,在如此的歷史機遇面前,希望自己能夠不負時代,有所作為,為社會發展帶來更多創新技術。”
腦科學研究的突破,將繼續促進算法的迭代
在進行科研攻關的過程中,薛向陽把自己的視線瞄向了腦科學。
據悉,人工智能的技術路線大致可分為兩條:一條以ChatGPT為代表,依靠海量數據和強大算力,通過對深度學習算法的不斷迭代,更好地建立起輸入和輸出之間非線性映射關系,這一類構建大模型方法可以稱之為功能類腦;另一條則是結構類腦的大模型構建方法,通過模擬仿真人腦規模的神經網絡,稱之為數字孿生大腦,在此基礎上研究感知、學習、記憶、決策等認知功能。目前,復旦類腦智能科學與技術研究院在馮建峰院長領導下,有一支跨學科研究團隊正在開展這方面的探索研究。
薛向陽稱,他認為,第二條技術路線如果走通,可能會帶來比ChatGPT更具顛覆性的變革。
他進一步解釋稱,這一方面是因為深度學習算法具有一定的“先天限制”。比如,模型訓練依賴人工對數據進行標注;模型反映復雜關聯關系,缺乏透明性,對預測結果缺少合理解釋;模型易受對抗樣本攻擊,對應用場景穩定性要求極高等等。
另一方面,基于數字孿生大腦開展其認知功能的研究,是類腦智能研究的一個新的探索方向。
“人腦有860億個神經元,每個神經元可能連接到1000~10000個其他神經元,神經信號經由這些連接所形成的神經環路進行信息的接受、傳遞和處理,其復雜程度是Chatgpt4的上百倍,而大腦能耗大致是15~30瓦。”薛向陽激動表示,如果有一天,計算機可以像人腦一樣進行計算,不僅耗能低,而且計算效率驚人,那么這又會為人類社會帶來什么呢?
實際上,人腦的強大特性已給到科學家們對于人工智能的新啟發,這也是人工神經元、類腦智能算法的基礎。
早在1943年,心理學家McCulloch和數學家Pitts參考了生物神經元的結構,發表了抽象的神經元模型MCP。以此為開端,學界接連提出了人工神經網絡ANN和深度卷積神經網絡CNN,最后實現了0到9的簡單字符識別,在其基礎上構建出了各種各樣的深度神經網絡模型,成為今天我們所見到的各種大模型的肇始。
不過,薛向陽表示,所謂“知其然,知其所以然”,要學習人腦是如何對信息進行接受、傳遞和處理的,首先就要了解人腦的工作原理。但一直以來,礙于科學技術水平有限,人類對于人腦的研究始終有限。
在復旦大學,得益于各類項目支持,科研人員們把對人腦的研究往前推進了一大步:其類腦人工智能科學與技術研究院是國內高校最早成立的腦科學與類腦前沿交叉研究機構之一,現在,通過數字孿生、核磁共振等技術,該研究院已完成了對人類的大腦全數字化仿生,進而在計算機上復刻出一個數字大腦。
“我們可以去了解大腦的結構,反解大腦結構,構建數字孿生大腦。腦科學家們可以基于該研究成果進行腦疾病發病機制的研究;后期,甚至可以接入一個機器人,將數字孿生腦植到機器人上……”薛向陽解釋稱,打開想象力,基于數字孿生腦,他們可以做的工作還有很多很多。
同時,薛向陽也坦言稱,這是一個龐大的工程,涉及認知神經科學、計算生物學、計算精神病學、人工智能算法、類腦智能技術與轉化等前沿基礎和應用研究,需要打通芯片、算法等軟硬件方面的各項合作。最近,復旦大學大數據研究院在院長鄔江興院士領導下,正在探索用晶上系統實現全腦仿真,以其進一步提高芯片集成度和降低功耗,從而持續提升類腦智能系統的效能。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。