首頁(yè) > AI資訊 > 最新資訊 > 科技必爭(zhēng)之地:泡沫退去,國(guó)產(chǎn)大模型未來(lái)在哪?

科技必爭(zhēng)之地:泡沫退去,國(guó)產(chǎn)大模型未來(lái)在哪?

新火種    2023-12-27

21世紀(jì)經(jīng)濟(jì)報(bào)道記者 董靜怡 上海報(bào)道

人工智能的2023年屬于大模型。

2022年11月,美國(guó)AI公司Open AI發(fā)布旗下基于大語(yǔ)言模型的AI聊天機(jī)器人程序ChatGPT,在發(fā)布后的短短兩個(gè)月內(nèi),ChatGPT的月活用戶(hù)突破 1 億,成為史上用戶(hù)增長(zhǎng)速度最快的消費(fèi)級(jí)應(yīng)用程序。至此,科技行業(yè)掀起了大模型的熱潮。

我國(guó)科技企業(yè)迅速跟進(jìn)。工業(yè)和信息化部賽迪研究院數(shù)據(jù)顯示,目前,我國(guó)已有超過(guò)19個(gè)語(yǔ)言大模型研發(fā)廠商,其中,15家廠商的模型產(chǎn)品已經(jīng)通過(guò)備案,預(yù)計(jì)今年我國(guó)語(yǔ)言大模型市場(chǎng)規(guī)模將達(dá)到132.3億元,增長(zhǎng)率將達(dá)到110%。

大模型的革命性在于“涌現(xiàn)能力”。在計(jì)算量達(dá)到10的22次方之后,模型能力會(huì)完成從量變到質(zhì)變的飛躍,呈現(xiàn)出驚人的爆發(fā)式增長(zhǎng)。

這似乎也證明了一條路是正確的,即擴(kuò)大模型規(guī)模,即可使其具有“智能”。在AI圍棋打敗人類(lèi)棋手之時(shí),Google Bert的參數(shù)規(guī)模為3億;2020年后GPT-3橫空出世,參數(shù)量級(jí)已經(jīng)跨越到了1750億;迭代到GPT-4,參數(shù)繼續(xù)成倍增長(zhǎng),已達(dá)1.8萬(wàn)億左右。

在業(yè)內(nèi)看來(lái),大模型具有強(qiáng)大的泛化性、通用性和實(shí)用性,能夠降低AI開(kāi)發(fā)門(mén)檻、提高模型精度和泛化能力、提高內(nèi)容生成質(zhì)量和效率等多種價(jià)值,實(shí)現(xiàn)了對(duì)傳統(tǒng)AI技術(shù)的突破,并成為AGI的重要起點(diǎn)。

下半年以來(lái),技術(shù)的顛覆性影響逐漸深入到產(chǎn)業(yè)界,重構(gòu)傳統(tǒng)的產(chǎn)業(yè)形態(tài)和產(chǎn)業(yè)模式。Gartner預(yù)測(cè),到2026年,超過(guò)80%的企業(yè)將在生產(chǎn)中使用生成式人工智能API和模型,或在部署生成式人工智能應(yīng)用。

而2024年或是AI大模型應(yīng)用的浪潮年。近日,獵豹移動(dòng)董事長(zhǎng)兼CEO、獵戶(hù)星空董事長(zhǎng)傅盛在2023探索大會(huì)上表示,未來(lái)一定會(huì)出現(xiàn)很多像移動(dòng)智能手機(jī)時(shí)代的滴滴、美團(tuán)外賣(mài)等,在過(guò)去的時(shí)代中沒(méi)有出現(xiàn)過(guò)的應(yīng)用。

百模大戰(zhàn)

這是繼IT時(shí)代、移動(dòng)互聯(lián)網(wǎng)時(shí)代之后又一個(gè)充滿機(jī)遇和可能性的新時(shí)代。從全球范圍看,世界各地均在積極推動(dòng)大模型研發(fā)和應(yīng)用,其中美國(guó)和中國(guó)發(fā)布的通用大模型總數(shù)占全球發(fā)布量的80%。

緊跟ChatGPT的腳步,各大企業(yè)和機(jī)構(gòu)紛紛加入大模型競(jìng)爭(zhēng)中,包括百度、阿里巴巴、騰訊等互聯(lián)網(wǎng)大廠,商湯科技、曠視科技等AI領(lǐng)域廠商,智譜華章、百川智能、達(dá)觀數(shù)據(jù)等大模型初創(chuàng)企業(yè),以及復(fù)旦大學(xué)、清華大學(xué)等高校機(jī)構(gòu)。公開(kāi)資料顯示,截至今年10月份,國(guó)內(nèi)已經(jīng)發(fā)布了238個(gè)大模型。

在新的大模型競(jìng)爭(zhēng)中,創(chuàng)業(yè)公司和大廠各有優(yōu)勢(shì)。大廠有多年的積累和大量的用戶(hù),得以獲得海量用戶(hù)數(shù)據(jù)和反饋,但一線創(chuàng)業(yè)公司通常擁有創(chuàng)新的技術(shù)和業(yè)務(wù)模式,同樣存在快速技術(shù)迭代的可能。正如百川智能創(chuàng)始人、CEO王小川所說(shuō),“小創(chuàng)新靠大廠,大創(chuàng)新仍然要靠小廠”。

在《SuperCLUE中文大模型基準(zhǔn)測(cè)評(píng)報(bào)告,2023》中,大廠和創(chuàng)業(yè)公司大模型的平均成績(jī)差值約1分,幾乎持平。

但國(guó)內(nèi)外大模型的能力差距仍然存在。“我們與OpenAI的差距正在拉大,不是在縮小。”復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院教授肖仰華表示。

在SuperCLUE測(cè)評(píng)中,GPT4-Turbo以總分89.79分遙遙領(lǐng)先,高于國(guó)內(nèi)所有的大模型及國(guó)外的代表性大模型。國(guó)內(nèi)得分最高的大模型是文心一言4.0,但距離GPT4-Turbo仍有15.77的分差。

“現(xiàn)在國(guó)內(nèi)主流的大模型的能力水平基本上在GPT3.5上下。”非凡資本合伙人吳畏向21世紀(jì)經(jīng)濟(jì)報(bào)道記者表示,在他看來(lái),其中差距在半年以上。

大模型的核心壁壘包括算力、數(shù)據(jù)、算法。度小滿CTO許冬亮在2023金融街論壇年會(huì)上表示,只有極少的企業(yè)能夠從頭到尾地完成產(chǎn)業(yè)級(jí)研發(fā)。

算力是大模型訓(xùn)練的基石。如今,模型參數(shù)指數(shù)級(jí)增長(zhǎng),訓(xùn)練所需算力巨大,千億級(jí)別的通用大模型,訓(xùn)練一次就需要付出幾千萬(wàn)的成本。當(dāng)前國(guó)內(nèi)已發(fā)布的大模型中,參數(shù)規(guī)模達(dá)到千億及以上的廠商僅為10個(gè)左右。

在美國(guó)最新一輪的封鎖制裁下,國(guó)產(chǎn)化替代方案的需求更加迫切。但在很長(zhǎng)一段時(shí)間內(nèi),芯片與算力仍會(huì)是國(guó)產(chǎn)大模型與ChatGPT之間一道巨大的鴻溝。

“優(yōu)數(shù)據(jù)+強(qiáng)算法”則是大模型開(kāi)發(fā)訓(xùn)練的兩大關(guān)鍵點(diǎn)。大模型的輸入數(shù)據(jù)通常存在重復(fù)、文本格式多樣化、非文本內(nèi)容多等噪聲問(wèn)題,這些問(wèn)題可能會(huì)對(duì)大模型的訓(xùn)練和模型質(zhì)量產(chǎn)生不良影響。此外,算法能力的持續(xù)優(yōu)化和算法的可解釋性也對(duì)廠商的技術(shù)能力和AI治理能力提出了更高的要求。

“國(guó)內(nèi)每家公司都要做,這就會(huì)產(chǎn)生一個(gè)問(wèn)題,每家都做自己的,但每家數(shù)據(jù)、算力也有限,也沒(méi)有多少錢(qián)可以支持研發(fā),并且又在做一些很基礎(chǔ)的、重復(fù)性的事情。”邱錫鵬在此前接受21世紀(jì)經(jīng)濟(jì)報(bào)道記者采訪時(shí)表示。

大模型目前處于泡沫期,擁有技術(shù)力量的公司不想被時(shí)代的浪潮拋下,企圖通過(guò)訓(xùn)練自己的大模型迎頭趕上,所以有了百模大戰(zhàn)、千模大戰(zhàn)。當(dāng)行業(yè)進(jìn)入成熟期,只有少量企業(yè)能真正賦能行業(yè),擠掉泡沫后才能沉淀出價(jià)值。

“以后大模型會(huì)逐漸呈現(xiàn)寡頭的趨勢(shì),因?yàn)樗懔τ邢薜那闆r下,以及大模型過(guò)于同質(zhì)化,會(huì)使得算力資源以及數(shù)據(jù)資源未來(lái)會(huì)集中,有一些價(jià)值性不高的大模型也會(huì)逐漸被淘汰。”沙利文大中華區(qū)總監(jiān)李慶向21世紀(jì)經(jīng)濟(jì)報(bào)道記者表示。

業(yè)內(nèi)普遍認(rèn)為,在通用大模型中,最后勝出的只會(huì)是少數(shù)的幾家巨頭。

“被淘汰的大模型企業(yè)也不會(huì)就此消失,他們可能會(huì)找到自己的機(jī)會(huì),比如做多模態(tài)的大模型、或某些特定的行業(yè)的大模型等。”吳畏向記者表示。

下半年以來(lái),市場(chǎng)對(duì)于大模型的熱度較年初已有顯著降溫,在業(yè)內(nèi)看來(lái),這無(wú)非是市場(chǎng)對(duì)新技術(shù)“高估短期影響,低估長(zhǎng)期潛力”的體現(xiàn)。從另一個(gè)角度來(lái)看,當(dāng)新技術(shù)祛魅,落地過(guò)程中各類(lèi)問(wèn)題逐漸顯現(xiàn),對(duì)于大模型過(guò)度的期待也在趨于理性的過(guò)程中。

賦能與應(yīng)用

時(shí)間來(lái)到2023年尾部,行業(yè)對(duì)于大模型落地應(yīng)用的討論頗多,關(guān)注重點(diǎn)從新技術(shù)帶來(lái)的時(shí)代變革轉(zhuǎn)移至幾個(gè)月后的產(chǎn)業(yè)變化。IDC在2023年8月的《Gen AI ARC Survey》的調(diào)研報(bào)告中指出,在擁有5000名以上員工的企業(yè)中,80%的企業(yè)認(rèn)為生成式AI將在未來(lái)18個(gè)月內(nèi)顛覆他們的業(yè)務(wù)。

“大模型絕不應(yīng)該只停留在煉金術(shù)階段,我們要推動(dòng)它變成科學(xué)的大模型,只有跟行業(yè)深度融合才有可能真正的實(shí)現(xiàn)可持續(xù)發(fā)展。”肖仰華表示。

首先是從通用大模型向垂直大模型的轉(zhuǎn)型,有行業(yè)觀點(diǎn)認(rèn)為,大模型未來(lái)發(fā)展將趨于通用化與專(zhuān)用化并行。

今年6月,騰訊云首次正式公布行業(yè)大模型研發(fā)進(jìn)展,并發(fā)布了面向 B 端客戶(hù)的騰訊云MaaS服務(wù)解決方案。今年7月,華為發(fā)布“不作詩(shī)只做事”的盤(pán)古大模型3.0,深耕政務(wù)、金融、制造、煤礦、鐵路、制藥、氣象等行業(yè)。此外,面向旅游的“攜程問(wèn)道”、面向醫(yī)療的百度“靈醫(yī)”大模型、面向教育的網(wǎng)易“子曰”大模型等也集中在下半年陸續(xù)發(fā)布。

其中,金融行業(yè)的應(yīng)用場(chǎng)景豐富,是最早進(jìn)行數(shù)字化轉(zhuǎn)型的機(jī)構(gòu),成為AI大模型落地應(yīng)用的最佳場(chǎng)景之一。金融行業(yè)積淀了包括金融交易數(shù)據(jù)、客戶(hù)信息在內(nèi)的海量數(shù)據(jù),良好的數(shù)據(jù)基礎(chǔ)為AI大模型的落地應(yīng)用提供條件。目前,生成和決策兩類(lèi)金融大模型,已在銀行、證券等金融機(jī)構(gòu)中實(shí)現(xiàn)落地。

“怎么將自己的業(yè)務(wù)和商業(yè)場(chǎng)景與AI的邏輯相匹配,以及如何尋求AI價(jià)值創(chuàng)新,而不單一是從效率上體現(xiàn),可能是目前推進(jìn)中需要考慮的問(wèn)題。”李慶表示,“如果不能靈活使用大模型,或者不能完全適配自己的商業(yè)場(chǎng)景,可能在一定程度上很難完全實(shí)現(xiàn)降本增效的目的。”

而對(duì)于后來(lái)者來(lái)說(shuō),大模型的機(jī)會(huì)或在于應(yīng)用。基于大模型技術(shù)的AI原生應(yīng)用被看作會(huì)真正點(diǎn)燃行業(yè)的路徑,吳畏向記者表示,從投資人角度,也更看好大模型應(yīng)用的創(chuàng)業(yè)公司。

百度創(chuàng)始人、董事長(zhǎng)兼CEO李彥宏近日在一場(chǎng)圓桌活動(dòng)上表示,百模大戰(zhàn)是對(duì)社會(huì)資源的浪費(fèi),更多資源應(yīng)該放在超級(jí)應(yīng)用。在11月的西麗湖論壇上,他也說(shuō)過(guò),“AI原生時(shí)代,我們需要100萬(wàn)量級(jí)的AI原生應(yīng)用,但是不需要100個(gè)大模型。”在百度世界2023現(xiàn)場(chǎng),百度率先甩出了十余款A(yù)I原生應(yīng)用。

新技術(shù)的繁榮一定是應(yīng)用的繁榮,如上傳20張照片生成寫(xiě)真照的妙鴨相機(jī),輸入幾個(gè)關(guān)鍵詞就可生成高質(zhì)量視頻的Pika,這些火爆的創(chuàng)新產(chǎn)品為AI創(chuàng)業(yè)拉開(kāi)一條新口子。業(yè)內(nèi)普遍認(rèn)為,原生應(yīng)用能夠撬動(dòng)更大的商業(yè)價(jià)值,是人類(lèi)進(jìn)入AI時(shí)代的標(biāo)識(shí)。

它們有基于原有的產(chǎn)品融合大模型的能力,也有重新搭載大模型的基于場(chǎng)景的應(yīng)用。“目前我們看到很多應(yīng)用都是選擇了第二種。”李慶向記者表示。

他認(rèn)為,監(jiān)管層面可能會(huì)給予一定空間。“在大模型剛出來(lái)時(shí),因?yàn)閷?duì)于其理解以及未來(lái)的應(yīng)用相對(duì)模糊,一開(kāi)始采取從嚴(yán)的策略,之后隨著應(yīng)用的誕生,以及國(guó)內(nèi)外的差異,監(jiān)管層面或許會(huì)給予適當(dāng)?shù)撵`活空間來(lái)支持行業(yè)的發(fā)展。”

不過(guò)遺憾的是,直到年末,國(guó)內(nèi)依然沒(méi)有一款持續(xù)火爆的AI應(yīng)用出現(xiàn),即便是紅極一時(shí)的妙鴨相機(jī),也在上線僅兩個(gè)月后因多次付費(fèi)、用戶(hù)粘性不夠等漸漸淡出大眾視野。在吳畏看來(lái),國(guó)內(nèi)大模型應(yīng)用的商業(yè)模式仍待探索,相比之下,海外市場(chǎng)擁有更大的機(jī)會(huì),“海外類(lèi)似的應(yīng)用單月收入已突破百萬(wàn)美元。”

不過(guò),此類(lèi)問(wèn)題并不可操之過(guò)急,大模型高昂的使用成本、自身存在的幻覺(jué)問(wèn)題、市場(chǎng)的付費(fèi)意愿不足等都是限制應(yīng)用發(fā)展的原因,而這些問(wèn)題的解決都在日新月異的變革中推進(jìn)。

業(yè)內(nèi)有觀點(diǎn)認(rèn)為,繁榮的AI原生應(yīng)用生態(tài)需要大模型、智能算力、AI原生應(yīng)用研發(fā)新范式三要素相輔相成,也有觀點(diǎn)認(rèn)為,AI原生應(yīng)用的起點(diǎn)會(huì)在2024年。可以肯定的是,爆發(fā)還需時(shí)間,但AI應(yīng)用的未來(lái)值得期待。

相關(guān)推薦
免責(zé)聲明
本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴(lài)本文觀點(diǎn)而產(chǎn)生的任何金錢(qián)損失負(fù)任何責(zé)任。

熱門(mén)文章