港科大校董會主席沈向洋:通用大模型會越來越少,行業(yè)大模型會越來越多
本文來源:時代周報 作者:郭美婷
“講卡傷感情,沒卡沒感情?!?1月17日電,今日上午,2024大灣區(qū)科學(xué)論壇開幕式和主論壇在廣州南沙國際會展中心主會場召開。香港科技大學(xué)校董會主席、美國國家工程院外籍院士、英國皇家工程院外籍院士沈向洋在會上笑談智能時代的機遇與挑戰(zhàn)。
香港科技大學(xué)校董會主席、美國國家工程院外籍院士 英國皇家工程院外籍院士沈向洋,圖源:主辦方供圖
“算力是關(guān)鍵,算力是生產(chǎn)力?!鄙蛳蜓蟊硎?,大模型數(shù)量爆發(fā)式增長的當(dāng)下,GPU算力每年以4倍的速度增長,10年后預(yù)計將增長100萬倍。在這個過程中,英偉達(dá)成為最大的贏家,去年該公司的下單量至少是15萬張。
作為大模型發(fā)展的另一關(guān)鍵要素,數(shù)據(jù)也被沈向洋頻頻提及:“GPT3用了大概2萬億Token,到GPT4時,一開始講的是12萬億的數(shù)據(jù),但是在不斷訓(xùn)練中,我們預(yù)計大概是用了20T的數(shù)據(jù)……這基本是把互聯(lián)網(wǎng)上能公開搜到的數(shù)據(jù)都拿了下來,洗干凈后的數(shù)據(jù)量?!?/p>
沈向洋表示,OpenAI希望訓(xùn)練出GPT5,其中的難點就在于要使用更大的數(shù)據(jù)來訓(xùn)練更有效的模型。他預(yù)測,若GPT5面世,其使用的數(shù)據(jù)量大概是200T,這其中可能加入了多模態(tài)或合成的數(shù)據(jù)。
“有意思的是,互聯(lián)網(wǎng)經(jīng)歷了40年,大家將數(shù)據(jù)放到網(wǎng)上,最后好像就是為了這樣一個‘ChatGPT的時刻’。”沈向洋笑言。
對于中國而言,AI大模型會沿著什么樣的道路發(fā)展?
沈向洋認(rèn)為,第一層是發(fā)展通用大模型,需要至少萬卡甚至十萬卡的算力來做這件事。一旦有了這個通用大模型后,接下來發(fā)展的就是行業(yè)大模型。這樣的大模型只需幾千張算力卡,未來每家企業(yè)都要做自己的大模型,提高效率、增強產(chǎn)品,如同今天所有企業(yè)都要向數(shù)字化、智能化轉(zhuǎn)型一般。再下一層,就是個人大模型了。未來,PC、手機等都是大模型的重要載體。
“從國內(nèi)的整體發(fā)展來看,是到7月底,中央網(wǎng)信辦批準(zhǔn)的大模型大概有 200 個,其中只約有1/ 3是通用大模型,2/3是行業(yè)大模型。我預(yù)測未來通用大模型的數(shù)量會越來越少,占比越來越小,而行業(yè)大模型數(shù)量會越來越多。”沈向洋表示。
他補充道,未來AI最大的超級應(yīng)用就是AI智能體,即人類提出問題,AI就能解決掉。這個超級應(yīng)用一直都存在,只不過在技術(shù)上尚未突破。
AI也將給人類社會GDP帶來巨大的增量。沈向洋表示,工業(yè)革命以前,人類社會GDP增長只有0.1%~0.2%,工業(yè)革命后增長到1%~2%,信息社會則到了3%~4%,而到了人工智能時代,AI智能體有望使人類社會的GDP增速變?yōu)?0%~20%。但在這樣的經(jīng)濟增長下,人類仍要警惕AI對社會、公司和監(jiān)管造成的沖擊,AI的治理刻不容緩。
“我們今天對人工智能的理解還是遠(yuǎn)遠(yuǎn)不夠的。大模型雖然被做出來,但確實不可理解、不魯棒(穩(wěn)定)的,這讓人懷疑,現(xiàn)在一套體系是不是真的能走遠(yuǎn)。人們認(rèn)為智能有限,似乎大模型出來之后,智能就出來了?!鄙蛳蜓筇岬剑ツ?,他在香港科技大學(xué)組織了一批科學(xué)家,正在試圖解開AI涌現(xiàn)出來背后的數(shù)學(xué)原理的謎題。
本文源自:時代周報
- 免責(zé)聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認(rèn)可。 交易和投資涉及高風(fēng)險,讀者在采取與本文內(nèi)容相關(guān)的任何行動之前,請務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。