中國(guó)電子商會(huì)元宇宙專業(yè)委員會(huì)理事長(zhǎng)熊焰:生成式智能將成為一個(gè)經(jīng)濟(jì)主體
財(cái)聯(lián)社5月14日訊(記者 王全寶 趙相鋒)隨著大模型帶來的新范式和新機(jī)會(huì),大模型經(jīng)濟(jì)開始越發(fā)受到關(guān)注。
五一長(zhǎng)假剛一結(jié)束,5月5日,二十屆中央財(cái)經(jīng)委員會(huì)第一次會(huì)議就強(qiáng)調(diào)要把握人工智能等新科技革命浪潮。人工智能等新科技再次被中央高層點(diǎn)題。
今年以來,由于ChatGPT的出色表現(xiàn),人工智能領(lǐng)域已經(jīng)掀起大語言模型開發(fā)浪潮,谷歌、百度、阿里、騰訊等頭部大廠爭(zhēng)相入局,相繼發(fā)布產(chǎn)品。高校、科研機(jī)構(gòu)亦在積極參與相關(guān)技術(shù)及應(yīng)用的研發(fā)。
生成式人工智能為何能在短時(shí)間內(nèi)做出突破?在社會(huì)結(jié)構(gòu)及生產(chǎn)力水平提升方面將做出怎樣的影響?中國(guó)將如何抓住本輪科技發(fā)展機(jī)遇?
中國(guó)電子商會(huì)元宇宙專業(yè)委員會(huì)理事長(zhǎng),北京國(guó)富資本有限公司董事長(zhǎng)熊焰認(rèn)為,ChatGPT可能會(huì)引發(fā)第四次工業(yè)革命,生成式智能將成為一個(gè)經(jīng)濟(jì)主體。未來將會(huì)出現(xiàn)人類智能與機(jī)器智能融合伴生,共同發(fā)展。
熊焰在接受財(cái)聯(lián)社專訪時(shí)還表示,中國(guó)在垂直領(lǐng)域應(yīng)用上有很大的優(yōu)勢(shì),因?yàn)橹袊?guó)產(chǎn)業(yè)鏈齊全,并且正好處在工業(yè)化數(shù)字化疊加,數(shù)字化能力快速發(fā)展的關(guān)鍵的階段。在垂直領(lǐng)域小模型上爭(zhēng)取突破,真正用數(shù)字技術(shù)賦能實(shí)體產(chǎn)業(yè)降本增效,這可能是一條可行路線。
“量的積累發(fā)生了質(zhì)的變化”財(cái)聯(lián)社:人工智能的發(fā)展已有數(shù)十年的歷史,而GPT如何能在短時(shí)間內(nèi)做出突破?
熊焰:ChatGPT表現(xiàn)出非常令人驚艷的語言理解、語言生成、知識(shí)推理能力。它可以非常好地理解用戶意圖, 真正做到多輪溝通,而且回答問題內(nèi)容完整,重點(diǎn)清晰、有概括、有邏輯、有條理,在絕大多數(shù)問題上超過了絕大多數(shù)的正常人。而且他還會(huì)拒絕回答不當(dāng)問題。ChatGPT的成功表現(xiàn),使人們看到了解決自然語言處理這一人工智能核心問題的可能性,并且被認(rèn)為向通用人工智能邁出了關(guān)鍵的一步。
簡(jiǎn)單來講GPT就是單字接龍,比如輸入“不忘初”三個(gè)字,通過計(jì)算GPT會(huì)算出第四個(gè)字是“心”,然后以前面四個(gè)字為基礎(chǔ),再算第五個(gè)字。這是一種所謂自回歸,把學(xué)到的所有東西作為他的已有的,然后結(jié)合你的提問,給你算出下一個(gè)字是什么。
實(shí)際上計(jì)算機(jī)對(duì)生成的內(nèi)容并不了解,就是“鸚鵡學(xué)舌”,依據(jù)前文猜后文?;诮y(tǒng)計(jì)語言學(xué)的思想,通過大量文本數(shù)據(jù)的統(tǒng)計(jì)分析和建模計(jì)算來學(xué)習(xí)語言的概率分布,從而生成具有語法和語義合理性的文本。他會(huì)把知識(shí)庫中學(xué)到的語言規(guī)律提煉出來作出預(yù)測(cè),這叫“回歸”。同時(shí)還會(huì)把他看到的規(guī)律,舉一反三,這就是所謂泛化。
與搜索引擎不同的是,ChatGPT得出的結(jié)論不是基于已有資料庫里的原有答案,而是它自己生成出來的。恰恰是他造出來的,就潛在的出現(xiàn)了智能的可能性。
GPT的核心技術(shù)并沒有什么顛覆性的、獨(dú)門的、全新的,根據(jù)已有的資料分析,實(shí)際就是量的積累發(fā)生了質(zhì)的變化。圈子里的兩個(gè)重要詞,第一個(gè)詞叫“涌現(xiàn)”,當(dāng)模型正確,參數(shù)夠大,訓(xùn)練的數(shù)據(jù)量足夠大的時(shí)候,在某一個(gè)臨界點(diǎn)上突然出現(xiàn)了指標(biāo)的躍升;另外一個(gè)詞叫“統(tǒng)一”,原來文字與機(jī)器交流是一種方法,圖像與機(jī)器交流是一種方法,現(xiàn)在這幾個(gè)方法把它混合在一起叫“多模態(tài)”,可以在各個(gè)模態(tài)下都用這一個(gè)方法。現(xiàn)在的問題是涌現(xiàn)、統(tǒng)一的機(jī)理、這個(gè)機(jī)器智慧到底是怎么生成的,這些問題還有不可解釋性,全球頂尖的科學(xué)家,對(duì)這個(gè)機(jī)制還有些說不太清楚。
財(cái)聯(lián)社:目前很多大廠都在加碼大語言模型的研發(fā),GPT本身更新迭代的速度也在加快,GPT是如何實(shí)現(xiàn)進(jìn)行技術(shù)突破的?具有哪些基礎(chǔ)與條件?
熊焰:第一是人工智能算法的加速發(fā)展。人工智能到現(xiàn)在為止大概有七十幾年歷史,從1950年開始啟動(dòng),前40年叫小規(guī)模專家訓(xùn)練階段。到1990年開始進(jìn)入了所謂淺層機(jī)器學(xué)習(xí),用了大概20年左右的時(shí)間。到了2010年開始深度機(jī)器學(xué)習(xí),淺層與深層的差別就是用了很多疊層的計(jì)算機(jī)給它摞在一起,三層以上算深層,例如GPT-3是96層摞在一起算。2018年開始進(jìn)入預(yù)訓(xùn)練,到現(xiàn)在大約用了5年的時(shí)間突破。人工智能算法進(jìn)入了倍速發(fā)展階段,每隔前一段的一半時(shí)間,一個(gè)新的劃時(shí)代的算法出現(xiàn)了。
第二是算料,實(shí)際就是數(shù)據(jù)。團(tuán)隊(duì)給GPT-3喂了45TB的無標(biāo)志數(shù)據(jù),包括維基百科、Books Corpus,后來又挑了大概1%的有標(biāo)注的數(shù)據(jù)去規(guī)范和引導(dǎo)。
第三是算力,過去10年是算力爆炸性增長(zhǎng)的十年,全球算力大約增長(zhǎng)了10萬倍,這是OpenAI能突破的重要的技術(shù)能量基礎(chǔ)。OpenAI團(tuán)隊(duì)在GPT-3上用了13萬片GPU ,這是一種加速計(jì)算芯片,現(xiàn)在已經(jīng)成了生成智能革命的最核心的卡脖子資料了。
第四,OpenAI團(tuán)隊(duì)是一組年輕的科技狂人和最杰出的人工智能科學(xué)家,具有長(zhǎng)期主義,并且他們沒有短期回報(bào)的壓力。團(tuán)隊(duì)最初的創(chuàng)始人就是在馬斯克、彼得蒂爾和比爾蓋茨的支持下做這件事,現(xiàn)在來看投入已經(jīng)是百億美元的強(qiáng)度了。他們做了一個(gè)非常好的混合式股權(quán)模型,一開始是一個(gè)非盈利機(jī)構(gòu),但后來由于投資強(qiáng)度太大,非盈利模式扛不住。微軟作為第一大股東投了100億美元,但是他已經(jīng)對(duì)外承諾,當(dāng)財(cái)務(wù)投資回報(bào)的上限達(dá)到100倍之后,它又回歸為非盈利機(jī)構(gòu)。
“最重要的是質(zhì)疑能力、判斷能力與創(chuàng)造能力”財(cái)聯(lián)社:GPT的出現(xiàn)對(duì)社會(huì)的貢獻(xiàn)體現(xiàn)在哪些方面?
熊焰:現(xiàn)在主要的語系包括印歐語系、漢藏語系等等,官方語言100多種,如果加上地方方言上可以達(dá)到千種之多,隔幾十里的人就沒法交流了。ChatGPT的出現(xiàn),有可能消除人與人之間的語言溝通的障礙。
GPT還將解決人與計(jì)算機(jī)的交流。軟件工程師的工作就是人與機(jī)器之間的翻譯,匯編語言、C語言的作用就是解決人與計(jì)算機(jī)的交流問題。自然語言處理就是希望用人類使用的普通語言文字與計(jì)算機(jī)交流,ChatGPT成功使得人與計(jì)算機(jī)交互的障礙基本解除了。
ChatGPT是目前被普遍認(rèn)為第一個(gè)通過了圖靈測(cè)試的人造智能體,它開啟了人類通向通用人工智能的一個(gè)入口。如果按照智能智力測(cè)評(píng),ChatGPT相當(dāng)于斯坦福大學(xué)四年級(jí)本科生的智力,在絕大多數(shù)領(lǐng)域超過了絕大多數(shù)人的通識(shí)。在每一個(gè)細(xì)分領(lǐng)域,它相當(dāng)于是大學(xué)畢業(yè)并工作5年的專業(yè)人士的水平。
從學(xué)術(shù)上講,ChatGPT成功的解決了知識(shí)的表達(dá)與調(diào)用問題。知識(shí)的表達(dá)與調(diào)用一直是計(jì)算機(jī)科學(xué)的一個(gè)最重要的問題。過去人類的知識(shí)是以數(shù)據(jù)庫的方式儲(chǔ)存在計(jì)算機(jī)中,使用匯編語言可以把知識(shí)調(diào)出來,到了互聯(lián)網(wǎng)時(shí)代就是用搜索引擎把知識(shí)調(diào)出來,現(xiàn)在到了生成智能時(shí)代,GPT就是智能時(shí)代的操作系統(tǒng)。
財(cái)聯(lián)社:生成智能被認(rèn)為是第四次工業(yè)革命,如何看待這一說法?
熊焰:OpenAI成功用一款產(chǎn)品把大家?guī)肓艘粋€(gè)生成智能的時(shí)代。它符合數(shù)字經(jīng)濟(jì)的一個(gè)很重要的特征:高建設(shè)成本,低使用成本。這個(gè)事具有很高的門檻,沒有幾十億美金投入別想做成。但是客戶使用成本極低,并且使用的人越多,它的質(zhì)量提升越快,各種垂直應(yīng)用越多越好。
ChatGPT可能引發(fā)第四次工業(yè)革命,生成式智能將成為一個(gè)經(jīng)濟(jì)主體。未來將會(huì)出現(xiàn)人類智能與機(jī)器智能融合伴生,共同發(fā)展。沒有巨大的數(shù)據(jù),就沒有GPT這個(gè)產(chǎn)品,同時(shí)這個(gè)產(chǎn)品又在源源不斷地生成新的數(shù)據(jù),它將極大地提高勞動(dòng)生產(chǎn)率。
首先是與知識(shí)相關(guān)的勞動(dòng)生產(chǎn)力極大的提高,顯然是一次生產(chǎn)力的革命。傳統(tǒng)經(jīng)濟(jì)學(xué)的起點(diǎn)叫稀缺,對(duì)應(yīng)于人的需求,任何要素都是不夠的。數(shù)據(jù)是人與計(jì)算機(jī)合作的產(chǎn)物,計(jì)算機(jī)一天24小時(shí)不休不眠,數(shù)據(jù)源源不斷,數(shù)據(jù)這個(gè)要素在生成智能的迭代推動(dòng)下大量涌現(xiàn)。稀缺基礎(chǔ)變了,成本、消費(fèi)一系列的生產(chǎn)與再生產(chǎn)的邏輯關(guān)系都會(huì)發(fā)生變化。
財(cái)聯(lián)社:人工智能會(huì)取代哪些人或職業(yè)?如何更好的利用這一新興技術(shù)?
熊焰:掌握人工智能的人會(huì)取代沒有掌握人工智能的人,比如大量接電話的客服、翻譯、律師、一般的文員等靠過往知識(shí)為主的服務(wù)產(chǎn)業(yè)將完全被生成智能改變;對(duì)于科研、文化等知識(shí)生產(chǎn)領(lǐng)域,生成智能出現(xiàn)是一場(chǎng)重新洗牌。原來很多細(xì)分的領(lǐng)域的邊界消失了,大模型一算,許多專業(yè)就沒什么可研究了。
人類原本認(rèn)為在幾十年內(nèi)解決不了的一些科學(xué)研究問題,比如小型可控核聚變、托卡馬克模型,現(xiàn)在美國(guó)已經(jīng)開始用Chat GPT來算,效率和質(zhì)量都很高;對(duì)于教育和傳媒等需要知識(shí)的傳承與傳播的行業(yè),以傳遞已有知識(shí)為主的填鴨式教育顯然不行了。原有的教育邏輯、教育規(guī)則、教育模式全都要改變了。最重要的是質(zhì)疑能力、判斷能力與創(chuàng)造能力。如果能提出一個(gè)問題,ChatGPT沒聽到過,這可能對(duì)全世界都是一個(gè)貢獻(xiàn)。此外具有判斷力變得很重要,ChatGPT的回答是生成出來的,所以判斷力變得很重要,今后最稀缺的是創(chuàng)造能力。
職業(yè)出現(xiàn)兩端化:一端是向手工業(yè)靠,另一端就是腦力創(chuàng)意。上周好萊塢作家們集體抗議游行,因?yàn)橹破瑥S不給那么多稿費(fèi)了,GPT寫得更好;美國(guó)醫(yī)生也開始抗議,盲盒問診下ChatGPT的問診的滿意度46%,真人的問診的滿意度4.6%。金融行業(yè)方面,常規(guī)的客服、一般的文案問答,大概今后都會(huì)出現(xiàn)很大的變化;在信息行業(yè),我身邊創(chuàng)業(yè)團(tuán)隊(duì)就在做IT運(yùn)維的Chat GPT。IT運(yùn)維過去10年左右的累積,從小型機(jī)、PC服務(wù)器、路由器等,包括操作系統(tǒng)、中間件,適配。任何一個(gè)人問它任何一個(gè)問題,都可循迅速得到回答,整個(gè)運(yùn)維成本就下來了,這就是Chat GPT垂直應(yīng)用。
“我們要正視差距,形成合力,化解阻力”財(cái)聯(lián)社:“十四五”規(guī)劃中多次提到聚焦人工智能關(guān)鍵算法、培育壯大人工智能等新興數(shù)字產(chǎn)業(yè),對(duì)此你認(rèn)為如何把握大語言模型對(duì)中國(guó)人工智能及數(shù)字化產(chǎn)業(yè)所帶來的機(jī)遇?目前存在哪些差距?
熊焰:大概春節(jié)前后,各個(gè)大廠都開始了行動(dòng)。據(jù)說3月中旬的那一周,圈子里的人連續(xù)幾天睡不著,OpenAI的GPT-4、微軟的全家桶、百度的文新一言都在那段時(shí)間發(fā)布。包括科大訊飛、昆侖萬維、華為、達(dá)摩院、網(wǎng)易、阿里巴巴、百度、商湯、清華大學(xué)、騰訊、智源研究院、中科院等都在布局大語言模型。
我認(rèn)為多數(shù)的創(chuàng)業(yè)團(tuán)隊(duì)實(shí)際做的是垂直應(yīng)用,而大模型是參數(shù)在百億以上的產(chǎn)品,應(yīng)該是只有少數(shù)大廠能做的起,投資強(qiáng)度大約是大幾十億人民幣起,而且對(duì)數(shù)據(jù)的要求非常高。前期投入、算力支持、核心團(tuán)隊(duì)、語料支撐,同時(shí)具備這幾個(gè)條件的大概中國(guó)只有百度、阿里、字節(jié)、騰訊、華為等,其他產(chǎn)品可以理解為垂直應(yīng)用的小模型。
一方面,要正視差距。中國(guó)在自然語言處理就是NLP領(lǐng)域在全球還是比較領(lǐng)先的,美國(guó) CSRanking上個(gè)月發(fā)布全球高校自然語言處理排名,哈工大排名第一。中國(guó)在這個(gè)領(lǐng)域?qū)W術(shù)上并不差,然而在商業(yè)、工程和產(chǎn)品上面要想突破,必須要在模型、算力、算料、流量、機(jī)制、投入、人才方面都要跟上。
在大語言模型開發(fā)方面一定要集中力量辦大事,一定是先做大模型,再做小模型。如果采用取巧方法,上來就看的那么準(zhǔn),沿著那一個(gè)地方進(jìn)入,失敗概率是非常大的。要形成合力,發(fā)揮我們國(guó)家集中力量辦大事的優(yōu)勢(shì)?,F(xiàn)在中國(guó)是百模大戰(zhàn),競(jìng)爭(zhēng)和內(nèi)耗都很厲害。不鼓勵(lì)競(jìng)爭(zhēng)是不對(duì)的,但是資源有限情況下,這種惡性競(jìng)爭(zhēng)對(duì)形成突破是不利的。最起碼在算法上我們內(nèi)部要開源,做到標(biāo)注數(shù)據(jù)復(fù)用。國(guó)家相關(guān)部門能不能做一些工作,讓大家來形成合力。
另一方面,要化解阻力。美國(guó)設(shè)置了很多障礙,我們?cè)撟龅木褪歉娱_放,比如很多的測(cè)試環(huán)境搭到國(guó)外去。另外就是在產(chǎn)業(yè)應(yīng)用上爭(zhēng)取突破,中國(guó)在垂直領(lǐng)域應(yīng)用上有很大的優(yōu)勢(shì),因?yàn)橹袊?guó)產(chǎn)業(yè)鏈齊全,并且正好處在工業(yè)化數(shù)字化疊加,數(shù)字化能力快速發(fā)展的關(guān)鍵的階段。在垂直領(lǐng)域小模型上爭(zhēng)取突破,真正用數(shù)字技術(shù)賦能實(shí)體產(chǎn)業(yè)降本增效,這可能是一條可行路線。
我們正處在人工智能時(shí)代的起點(diǎn)上,生成智能將成為經(jīng)濟(jì)主體,人工智能與人類智能相互協(xié)同,共同向前走,生成智能將改變數(shù)據(jù)這個(gè)生產(chǎn)要素,生成智能將重構(gòu)個(gè)人職業(yè)、社會(huì)結(jié)構(gòu)和經(jīng)濟(jì)社會(huì)面貌。這是新時(shí)代的兩彈一星工程,事關(guān)國(guó)運(yùn),因此我們要正視差距,形成合力,化解阻力,實(shí)現(xiàn)產(chǎn)業(yè)突破。
- 免責(zé)聲明
- 本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。