約翰·霍普克羅夫特計算機科學中心林洲漢:未來國內應用大模型或走在國際前列
促進數字技術與實體經濟深度融合,已成為近年來最火熱的議題之一。ChatGPT的面市又將人工智能大模型推向了高潮。
2023人工智能大模型基準測試科創發展大會暨中西部數字經濟大會(下稱“大會”)將于12月28日在成都市正式舉辦。大會旨在為行業發掘出更優質的大模型,并提供資源對接。
大會舉辦之前,大模型基準評測專家委員會專門為大模型評測研制開發了自動測試平臺,取名“OpenEval”,意為開放評測。
對此,專家委員會成員——來自上海交通大學約翰·霍普克羅夫特計算機科學中心的林洲漢教授在接受紅星資本局專訪時提到,“得益于國內更多樣化的應用場景,在應用大模型的方式方法上,國內的大模型落地應用,未來甚至是大概率可以走在美國前面的。”
國內應用場景更多
未來應用大模型的或走在國際前列
紅星新聞:2022年底,OpenAI推出人工智能聊天原型ChatGPT,在國內及全球掀起了AI浪潮。能跟我們講講AI和大模型的關系嗎?大模型是如何形成,如何分類的?
林洲漢:相對于大模型,AI是一個更廣泛的概念。但是現在,以ChatGPT為代表的大模型取得重大突破并出圈,AI和大模型也就似乎成了同義詞。但實際上,在大模型之外,AI還有很多其他的重要工作。
大模型并非憑空而來。模型結構作為模型訓練中的一部分,最早出現在2016~2017年左右,加拿大的蒙特利爾實驗室先后做了attention和self-attention兩個attention的機制,緊接著谷歌在self-attention的基礎上做了transformer。這些模型結構上的前期技術積累,掃清了神經網絡在模型結構上走向大規模化的技術障礙。不過當時包括谷歌在內的眾多研究機構都只是用這些模型去訓練一些只有幾十、幾百兆的小模型。直到OpenAI將Transformer模型大規模化到175B的程度,模型效果才量變引起質變,有了質的飛躍。
另外一個重要要素是預訓練。剛開始,模型訓練就是每一個任務對應一個單獨的模型,后來慢慢發展成用巨量的語料去預訓練,這種訓練模式能夠利用預訓練好的單個模型,通過后期的微調訓練,將各種任務統一到一個基礎模型上。OpenAI則是利用GPT-3高達175B的大模型,不光徹底統一了絕大部分的自然語言處理任務,還在模型的通用性、對新任務的適應速度等方面做到了全新的高度。做出了指令微調、in-context learning等的新形式。
紅星新聞:目前,國內大模型主要應用在什么領域?已經發展到了什么階段?
林洲漢:在大模型的落地應用方面,其實國內外沒有太大的差距。甚至得益于國內更多樣化的應用場景,在應用大模型的方式方法上,未來甚至是大概率可以走在美國前面的。
至于典型的應用場景,我可以想到的就是常見的網絡會議場景和電商客服場景。大模型可以自動生成會議概要、自動回復客戶問題。甚至語言模型也可以接上一些外部的工具。
在基礎模型研發方面,目前還沒有其他公司的產品能夠超越ChatGPT。因此可以說,這不光是中美之間的差距,也算是OpenAI與世界的差距。
醫療問診、在線教育、辦公軟件等都會用上大模型
未來各個模態會融合起來
紅星新聞:對于我們每天都會接觸到的手機軟件,哪些運用了大模型?運用的何種大模型?大致原理是什么?
林洲漢:像我前面提到的會議軟件,以及辦公交流軟件,比如飛書、釘釘,大多是會用到大模型的。
另一個典型就是現在的電商服務機器人。我們可以看到,像淘寶天貓這些電商平臺,部分店鋪的自動回復相較于以往已經明顯更智能,并且在售前售后服務方面替代真人客服。這些使用大模型的店鋪,會使得用戶的交互更智能,真人客服也將更少參與。
另外,在醫療問診、在線教育等領域也會用到大模型。比如醫療問診,當患者遇到排號緊張,自身患病不嚴重的情況就可以選擇互聯網問診。
但總的來說,現階段來看,大模型的應用基本就是“兩條路”。一條就是調用OpenAI的ChatGPT,但ChatGPT能夠給到使用者的定制化應用相對較少,因為它只能直接輸出文本。另一種就是定制化程度更高的私有化部署,這種情況可以選擇用開源模型或者合作方自有的模型,在私有領域專門微調定制。
紅星新聞:我們了解到,機器學習和自然語言處理這個方向上,有包括機器翻譯、聊天機器人等離日常生活很近的應用,目前有沒有更新的領域正在開拓?
林洲漢:其實自然語言處理有了像ChatGPT這樣的大模型后,相當于給了AI各個領域之間一個互通的通道。目前,大模型可以拓展的領域很多,在往多模態的方向發展,不限于前面的純文字。比如文生圖,圖生文,甚至是視頻生成等。不過目前視頻類還處于起步階段。
最近,信雅達(600571.SH)因“女兒概念股”受關注,正是基于信雅達實控人郭華強之女郭文景創立了Pika,Pika目前是AI文本生成視頻領域的明星公司,可以根據AI模型生成和編輯動漫、電影、3D動畫、等不同風格的視頻。
所以視頻類也是有前景的,未來各個模態或許都會融合起來,可能未來就不存在單獨的計算機視覺領域或者自然語言處理領域了。
高級思維活動需要人來負責
AI難以替代
紅星新聞:在高校計算機領域科研方面,您認為AI在ChatGPT出現后有什么變化嗎?
林洲漢:像ChatGPT這樣的大模型出來之后,對于高校科研人員而言,有挑戰也有機遇。
挑戰是面臨科研成本進一步升高。過去小模型對于硬件要求不高,但現在一個模型要跑起來,動輒幾十萬上百萬的機器。
機遇是有了去探討一些更高更難問題的機會。以往,計算機生成的語言很難保持長篇流暢的文本,更不用去談事實準確性、語言得體、前后邏輯一致等高級的問題了。現在有了大模型后,我們基本解決了流暢生成長文本的問題,所以可以騰出手來去解決上面提到的更高層面上的問題。甚至可以去考慮模仿專業科學家、律師說話,使用何種專業詞匯,以及語言中的前后邏輯等。
紅星新聞:隨著人工智能應用到各行各業,關于“人工智能是否會代替更多的職業”這樣的擔憂也越來越多,在這個問題上您怎么看待?
林洲漢:我不覺得替代是一個好的方式,事實上AI也做不到替代。
把AI用到任何一個領域,比如自動駕駛、代替醫生問診、代替記者寫稿,AI都沒法做到把人替換掉。現階段,AI只能幫人解決一些腦力上的臟活累活。
以自動駕駛為例,AI能做的就是讓車保持在車道內行駛,但是在有交通事故的關鍵時刻,是需要人介入的。再比如記者寫稿,大模型可以幫助記者生成文章內容,但文章的主旨需要人拍板。
因此最重要的一點是,目前高級思維活動還是需要人來決定和負責。
不過,技術的發展很難預知,在未來,AI最終擁有高級思維,實現所謂的通用人工智能(AGI),是完全有可能的。但就目前來看還沒有辦法做到完全替代人。
(文章來源:紅星資本局)
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。