首頁 > AI資訊 > 最新資訊 > 全球大模型發(fā)展整體態(tài)勢,暗流涌動(dòng)下的機(jī)遇

全球大模型發(fā)展整體態(tài)勢,暗流涌動(dòng)下的機(jī)遇

新火種    2023-12-05

原創(chuàng) | 文 BFT機(jī)器人

(一)大模推動(dòng)能“涌現(xiàn)”,打開AI術(shù)發(fā)展上限

人工智能大模型,是指通過在海量數(shù)據(jù)上依托強(qiáng)大算力資源進(jìn)行訓(xùn)練后能完成大量不同下游任務(wù)的模型。

在技術(shù)層面上,大模型的實(shí)現(xiàn)采用“預(yù)訓(xùn)練+指令微調(diào)+人類反饋的強(qiáng)化學(xué)習(xí)”的訓(xùn)練范式。

首先通過預(yù)訓(xùn)練技術(shù)將深度學(xué)習(xí)網(wǎng)絡(luò)在海量數(shù)據(jù)上進(jìn)行自監(jiān)督訓(xùn)練,然后利用指令數(shù)據(jù)進(jìn)行有監(jiān)督指令微調(diào),提升模型對人類指令的追隨能力,最后,基于由人類價(jià)值標(biāo)注數(shù)據(jù)訓(xùn)練得到的獎(jiǎng)勵(lì)模型所提供的獎(jiǎng)勵(lì)信息進(jìn)行強(qiáng)化學(xué)習(xí),控制大模型的輸入符合人類價(jià)值判斷。

在大模型使用時(shí),通過設(shè)計(jì)提示進(jìn)行即時(shí)學(xué)習(xí)可以進(jìn)一步提升大模型完成各類任務(wù)的能力。規(guī)模化是使大模型強(qiáng)大的重要原因,研究表明當(dāng)模型規(guī)模足夠大的時(shí)候,會(huì)“涌現(xiàn)”智能能力,具備處理新的、更高層次的特征和模式的能力,能夠?yàn)橐幌盗邢掠稳蝿?wù)帶來更好的任務(wù)效果。

大模型不斷擴(kuò)大的規(guī)模由“量變”引發(fā)“質(zhì)變”,模型通用認(rèn)知能力不斷提升大模型能力的迅速發(fā)展不僅有助于人類完成“規(guī)定動(dòng)作”還可能幫助人類去研究和發(fā)現(xiàn)未知領(lǐng)域,突破人類過去沒有突破過的極限。

大模型的技術(shù)變革呈現(xiàn)數(shù)據(jù)巨量化、模型通用化、應(yīng)用模式中心化的特點(diǎn)。整個(gè)發(fā)展歷程可劃分為三個(gè)階段。

2013-2018年的深度學(xué)習(xí)階段,主要還是基于傳統(tǒng)的“針對特定任務(wù)的專用模型+大量標(biāo)注數(shù)據(jù)”方式,在監(jiān)督學(xué)習(xí)的機(jī)制下訓(xùn)練得到一個(gè)個(gè)專用小模型,但是在詞向量的自監(jiān)督學(xué)習(xí)中,使用大規(guī)模數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練的方法已初見端倪2017年Transformer的提出為基礎(chǔ)架構(gòu)帶來了規(guī)模化構(gòu)建和規(guī)模化運(yùn)算的潛力。

Transformer解決了RNN和LSTM的并行化訓(xùn)練和長距離依賴問題,解決了CNN的局部歸納偏差問題能夠容納更多的參數(shù)規(guī)模,并且具備更強(qiáng)的語義特征提取能力、長距離特征捕獲能力、綜合特征提取能力。

2018年-2022年的預(yù)訓(xùn)練階段,基于“海量無標(biāo)注數(shù)據(jù)”,在自監(jiān)督學(xué)習(xí)機(jī)制下獲得預(yù)訓(xùn)練大模型,通過少量標(biāo)注數(shù)據(jù)微調(diào)后得到領(lǐng)域?qū)S媚P汀W员O(jiān)督學(xué)習(xí)機(jī)制的成功使得可利用的數(shù)據(jù)愈發(fā)“巨量化”,從標(biāo)注數(shù)據(jù)拓展到無標(biāo)注數(shù)據(jù)。

Bert將可利用的預(yù)訓(xùn)練數(shù)據(jù)量擴(kuò)大3到5倍,成為自然語言理解任務(wù)中的基準(zhǔn)模型。自此,“預(yù)訓(xùn)練+微調(diào)”的學(xué)習(xí)范式成為主流。在通用大模型上通過少量標(biāo)注數(shù)據(jù)微調(diào),即可適用于一系列下游任務(wù)。

2022年下半年以來的大語言模型階段,預(yù)訓(xùn)練大模型的通用能力愈發(fā)強(qiáng)大,引入指令監(jiān)督訓(xùn)練使得模型能更好地追隨人類指令完成各種任務(wù),并提升了在下游任務(wù)上的泛化能力,通過人類反饋學(xué)習(xí)讓機(jī)器與人類價(jià)值對齊成為可能。

(二)大模型變革內(nèi)容生產(chǎn)和技術(shù)服務(wù)模式,“無限生產(chǎn)”推動(dòng)生產(chǎn)效率顛覆式提升

內(nèi)容生產(chǎn)方面,生成式大模型率先在內(nèi)容創(chuàng)作、圖像生成、數(shù)字人、游戲等娛樂媒體領(lǐng)域廣泛應(yīng)用,內(nèi)容生產(chǎn)效率和質(zhì)量顯著提升,內(nèi)容生產(chǎn)模式從輔助人到“替代”人演變據(jù)Gartner預(yù)測,至2023年底,將有20%的內(nèi)容被生成式大模型所創(chuàng)建;至 2025 年底,生成式大模型產(chǎn)生的數(shù)據(jù)將占所有數(shù)據(jù)的10%。

技術(shù)服務(wù)方面,大模型的“無限生產(chǎn)”能力重塑企業(yè)生產(chǎn)引擎。隨著大模型能力的不斷提升,AI Agent成為重要發(fā)展趨勢。

未來,大模型將不僅僅是一種生產(chǎn)工具更多是作為企業(yè)“合作者”,持續(xù)為企業(yè)注入生產(chǎn)動(dòng)能。

(三)大模作為新的“根”基礎(chǔ)設(shè)施,驅(qū)動(dòng)AI范式變革

大模型實(shí)現(xiàn)模型生產(chǎn)從“作坊式”到“流水線”的升級(jí)大模型出現(xiàn)以前,AI模型是“定制化、場景化”的開發(fā)方式針對特定應(yīng)用場景需求訓(xùn)練一個(gè)個(gè)小模型,模型難以復(fù)用和積累,導(dǎo)致AI落地的高門檻、高成本與低效率。大模型實(shí)現(xiàn)基礎(chǔ)模型底座的標(biāo)準(zhǔn)化開發(fā)和泛在化應(yīng)用,解決成本困境。

通用大模型通過從海量的、多場景、多領(lǐng)域的數(shù)據(jù)中學(xué)習(xí)共性知識(shí),成為具有通用性和泛化能力的模型底座。基于通用大模型底座可搭建各行業(yè)的垂類大模型,可以有效縮減垂類大模型訓(xùn)練所需要的算力和數(shù)據(jù)量,縮短模型的開發(fā)周期,提升垂直領(lǐng)域的應(yīng)用開發(fā)效率。

OpenAI以GPT4通用大模型為底座,通過快速增量訓(xùn)練和個(gè)性化微調(diào)的方式,允許普通用戶通過簡易對話界面自定義定制GPT,支持開發(fā)者采用私有數(shù)據(jù)對GPT進(jìn)行個(gè)性化微調(diào),使大模型更易于訪問和開發(fā),產(chǎn)品形態(tài)更加豐富,以滿足更廣泛的市場需求。

(四)中美是大模型技術(shù)領(lǐng)域的主要“玩家”,大模型市場競爭持續(xù)深入

2023年5月發(fā)布的《中國人工智能大模型地圖研究報(bào)告》指出,美國和中國發(fā)布的通用大模型總數(shù)已占全球發(fā)布量的80%。

美國方面,形成了OpenAI+微軟、Meta、谷歌等多個(gè)“陣營”,OpenAI重點(diǎn)圍繞GPT4底座模型完善上層開發(fā)者生態(tài)Meta 通過開源LLaMa等大模型,引領(lǐng)了全球大模型開源浪潮我國方面,大模型再次詮釋中國速度。

截至2023年10月,我國10億參數(shù)規(guī)模以上的大模型廠商及高校院所共計(jì)254家,分布于20余省市/地區(qū)。

中國工程院院士鄭緯民指出,美國作為全球科技霸主一直引領(lǐng)人工智能領(lǐng)域發(fā)展前沿,整個(gè)大模型的產(chǎn)業(yè)布局全面領(lǐng)先,在研發(fā)能力、人才儲(chǔ)備、硬件設(shè)施及融資環(huán)境方面占據(jù)優(yōu)勢。

相較而言,中國占據(jù)海量數(shù)據(jù)資源和應(yīng)用場景優(yōu)勢,但頂尖的AI人才缺乏,在基礎(chǔ)理論、原創(chuàng)模型等顛覆型、階躍型技術(shù)方面仍缺乏引領(lǐng)能力。產(chǎn)業(yè)基礎(chǔ)層的整體實(shí)力較弱,高質(zhì)量數(shù)據(jù)積累不足,在高端芯片、關(guān)鍵基礎(chǔ)軟件等領(lǐng)域受制于美國。

總結(jié)

現(xiàn)在,全球大模型發(fā)展呈現(xiàn)出多種態(tài)勢,包括參數(shù)競賽進(jìn)入冷靜期、基礎(chǔ)模型受到

而在這種大背景下,大模型產(chǎn)品層出不窮,各大推手底下暗流涌動(dòng),未來,誰會(huì)是場競爭的最后勝利者,我們可以拭目以待。

注:若您對該文章內(nèi)容有任何疑問,請與我們聯(lián)系,將及時(shí)回應(yīng)。

相關(guān)推薦
免責(zé)聲明
本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。

熱門文章