潛行十載百度文心大模型的閃耀時刻
大模型無疑是今年最熱的詞,縱觀2023年,從“百模大戰(zhàn)”競賽,到應(yīng)用層生態(tài)的“百花齊放”,AIGC產(chǎn)業(yè)在這一年迎來爆發(fā)期。數(shù)據(jù)顯示,截至10月份,中國已經(jīng)發(fā)布了238個大模型,相較于6月份的79個翻了3倍。自大模型引發(fā)科技熱潮以來,從創(chuàng)投到資本市場,從B端到C端,無不提及AI。
在大模型火了半年時間后,行業(yè)就出現(xiàn)一個觀點爭論:大模型通用和垂直,誰是未來?在12月16日的極客公園創(chuàng)新大會2024中,李彥宏表示:“卷AI原生應(yīng)用才有價值,大模型的進展對絕大多數(shù)人都不是機會”。
站上C位,文心大模型的高光時刻
ChatGPT的橫空出世,讓“大模型”成為全球科技賽道熱詞,也使其成為今年世界人工智能大會的絕對“C位”。
在眾多產(chǎn)品之中,百度文心大模型的動態(tài)無疑是最受關(guān)注之一。今年3月16日,百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏正式發(fā)布預(yù)訓(xùn)練生成式大語言模型文心一言。百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏透露2019年文心大模型的第1個版本就已發(fā)布,此后每年都有新版本迭代。
當(dāng)人們對AI大模型應(yīng)用的評估,大多停留在“一款好用的智能軟件”的印象時,李彥宏則率先在國內(nèi)提出,此次AI浪潮堪比“第四次科技革命”。
6月26日互聯(lián)網(wǎng)大會數(shù)字文明尼山對話中,他再次強調(diào)“大模型是影響人類發(fā)展的重大技術(shù)變革,是拉動全球經(jīng)濟增長的引擎,是絕對不能錯過的重大戰(zhàn)略機遇。”
另一個持有相同意見的商界大佬,是大洋彼岸的比爾·蓋茨,“不管你愿不愿意,這都將引領(lǐng)一場新的工業(yè)革命,意義超越互聯(lián)網(wǎng)和iPhone的發(fā)明。”
百度文心一言的迭代優(yōu)化,也不斷提速。6月發(fā)布的文心大模型3.5版本,訓(xùn)練速度、推理速度都得到極大提升。僅四個月后,它又被全面升級的文心大模型4.0取代,李彥宏直言其綜合能力“與GPT-4相比毫不遜色”。
8月底,文心大模型又成為第一批面向公眾開放的、一個可體驗、摸得著的AIGC產(chǎn)品,在8月31日面向公眾開放的當(dāng)天,文心一言就回復(fù)了網(wǎng)友總計3342萬個問題,問鼎各家應(yīng)用商店榜首。
“此舉標志著中國行業(yè)領(lǐng)導(dǎo)者的重大突破,是其飛速發(fā)展的人工智能行業(yè)的里程碑。”彭博社在報道中寫道。
多家外媒將文心一言視為中國大模型的領(lǐng)導(dǎo)者,“文心一言引發(fā)了最大的興奮”,《經(jīng)濟學(xué)人》在9月3日的報道中寫道。
在《時代周刊》緊隨其后發(fā)布的全球AI百大人物榜單中,李彥宏被評為全球AI領(lǐng)袖,與馬斯克、黃仁勛、OpenAI CEO 薩姆·奧特曼等人并列出現(xiàn)。
百度的大模型也得到了社會的認可,文心大模型關(guān)鍵技術(shù)還獲得了2023世界互聯(lián)網(wǎng)大會領(lǐng)先科技獎。
大模型卷偏了,未來是原生應(yīng)用的時代
見慣了外賣、出行的百團大戰(zhàn),再回到今年年初的百模大戰(zhàn),似乎又是一個大力出奇跡的拼財力、拼耐力的互聯(lián)網(wǎng)之戰(zhàn)。
有的學(xué)者認為,大模型時代的AI跟之前的深度學(xué)習(xí)時代的AI本質(zhì)相差不大,都是對互聯(lián)網(wǎng)的縫縫補補。但在12月16日的極客公園創(chuàng)新大會2024中,百度創(chuàng)始人李彥宏直言:“卷AI原生應(yīng)用才有價值,大模型的進展對絕大多數(shù)人都不是機會”。
早在2023年3月,李彥宏就提醒行業(yè)“不要重復(fù)造輪子”,并表示應(yīng)用才是大模型真正的機遇。但無數(shù)的錢涌向AI大模型賽道,對于很多公司而言,與其想清楚慢慢做,不如簡單粗暴地搞一個再說,至少能拉一把股價或者估值。
李彥宏看來,國內(nèi)的大模型賽道上其實布滿了“陷阱”:
首先,大模型是通用模型。一個大模型就能夠服務(wù)上百個行業(yè),因此它符合贏家通吃的規(guī)則,其發(fā)展紅利很難普及給太多人和太多企業(yè)。大模型與此前歷次AI浪潮的根本不同,在于它的通用性,即“智能涌現(xiàn)”。這意味著大模型天然具備馬太效應(yīng)。最終效率上,規(guī)模更大,推出更早,公司實力更深厚的無疑占據(jù)了先發(fā)優(yōu)勢,最終只會有少數(shù)大模型能夠具備競爭力。正如手機操作系統(tǒng)一樣,一個市場內(nèi)有1-3家頭部企業(yè)就已足夠。而國內(nèi)的大模型數(shù)量早已在上百級別,大多數(shù)注定是炮灰。
第二,大模型和操作系統(tǒng)一樣,本身不具備任何創(chuàng)造價值的能力,必須有應(yīng)用把它的潛力變現(xiàn)。早在今年10月百度世界大會現(xiàn)場,李彥宏就表示:“沒有構(gòu)建于基礎(chǔ)模型之上的、豐富的AI原生應(yīng)用生態(tài),大模型就一文不值。”
上世紀70年代至今,AI經(jīng)歷過多次成為風(fēng)口,又多次退熱的窘境。最近的一次來自2016年,“阿爾法狗”戰(zhàn)勝圍棋世界冠軍,讓世界重新聚焦于人工智能。但短短幾年后,AI領(lǐng)域融資事件和規(guī)模驟降。
李彥宏把AI的多次退燒,歸結(jié)于應(yīng)用方面:“最后大家發(fā)現(xiàn),其實這個東西沒什么用處”。比如在上一次AI風(fēng)口中,國內(nèi)涌現(xiàn)了非常多的AI企業(yè),其中又以AI四小龍為翹楚。不過,他們的收入比起估值來說,都有些寒酸。應(yīng)用的規(guī)模往往只聚焦在監(jiān)控和人臉識別等少數(shù)領(lǐng)域。
第三,從歷史上看,應(yīng)用層的總潛力,遠比底層更大,對大多數(shù)公司也更加友好。反觀應(yīng)用層,國內(nèi)外目前還沒出現(xiàn)殺手級應(yīng)用。下載量最大的應(yīng)用,可能就是日活過億的ChatGPT自己。國內(nèi)外普遍認為大模型將重構(gòu)所有行業(yè),但截至目前,生成式AI還沒有自己的“微信”或者“抖音”。對大模型來說,如果模型得不到好的落地場景,最終,花數(shù)億、數(shù)十億搭建的模型,只能“應(yīng)用”在跑分軟件里,成為一種滿足虛榮心的形象工程。
在李彥宏的不斷呼吁下,最近幾個月,更多的AI創(chuàng)業(yè)公司,也開始聚焦在應(yīng)用層面。這些企業(yè)的轉(zhuǎn)向,會讓大模型的生態(tài)更加繁榮,帶來更多的用戶,形成一個正向的循環(huán),最終使整個行業(yè)受益。
AI原生應(yīng)用想象空間巨大,市場期待現(xiàn)象級應(yīng)用
AI和原生應(yīng)用結(jié)合起來,到底有多賺錢,李彥宏在極客公園創(chuàng)新大會2024的對談中舉了一個例子:微軟將Office與AI結(jié)合起來,推出的產(chǎn)品Microsoft 365 Copilot一年營收達到了50億美元,而按照Open AI的CEO山姆奧特曼今年10月披露,目前公司的年收入在13億美元左右。作為世界上最好的大模型公司,OpenAI的收入?yún)s趕不上微軟的一個產(chǎn)品中的分支產(chǎn)品,AI原生應(yīng)用的變現(xiàn)能力可見一斑。
李彥宏還認為,小廠在AI中也有非常大的機遇。即便體量再大的公司,也不可能覆蓋所有行業(yè),中小企業(yè)可以發(fā)揮靈活的優(yōu)勢,做出現(xiàn)象級的應(yīng)用。正如李彥宏所說:“(在大模型時代)創(chuàng)業(yè)公司可能能夠做出 3 個、5 個 Super App,或者做出幾百個幾千個非常有價值的垂類應(yīng)用,可能性也非常大。”
眼下,國內(nèi)也有許多變現(xiàn)潛力巨大的AI原生應(yīng)用,他們的想象空間,并不比文心大模型或者GPT本身小。在不久前的百度世界大會上,百度發(fā)布了十余款A(yù)I原生應(yīng)用,其中的相當(dāng)一部分,已經(jīng)展現(xiàn)出了商業(yè)上的潛力。以“百度新文庫”為例。在大模型的加持下,“新文庫”擁有了AI寫作、AI做PPT等功能。這些都是國內(nèi)用戶的剛需,并且其商業(yè)付費模式已經(jīng)被金山、微軟、百度自己所驗證過,擁有創(chuàng)造巨大收入的潛力。
光有應(yīng)用還不夠,還必須有一整套為之服務(wù)的生態(tài)。百度在今年的世界大會上推出了自己的AI原生應(yīng)用商店,解決了AI原生應(yīng)用的分發(fā)問題。再加上此前飛漿、百度智能云千帆大模型、文心一言等的一整套基礎(chǔ)設(shè)施,國內(nèi)AI原生應(yīng)用已經(jīng)具備了一個類似移動互聯(lián)網(wǎng)的生態(tài)。開發(fā)者能以較低的成本開發(fā)AI原生應(yīng)用,并找到自己的分發(fā)渠道。
半年多過去了,行業(yè)的發(fā)展正在驗證李彥宏的觀點。站在當(dāng)下,也只有當(dāng)越來越多的人意識到大模型原生應(yīng)用的重要性,并在其中重現(xiàn)中國軍團的戰(zhàn)斗力——就像移動互聯(lián)網(wǎng)時代APP的繁榮一樣,AI大模型行業(yè),才可能走進真正的、有望改變整個時代的風(fēng)口。
默默攀登10年,百度大模型是這樣登頂?shù)?/p>
在百度文心大模型的背后,是百度all In AI的決心和層出不窮的AI人才隊伍。
大模型的種子早在10年前就已經(jīng)落下。2013年,一個只發(fā)表了9頁論文的3個人小團隊,被中美科技公司競拍,最后的出價竟然超過了4000萬美元。
2012年冬天,多倫多大學(xué)教授杰夫·辛頓帶著自己兩個學(xué)生一起發(fā)布了一篇長度9頁的論文《ImageNet Classification with Deep Convolutional Neural Networks》,他們建立了神經(jīng)網(wǎng)絡(luò)算法AlexNet,在ImageNet圖像識別比賽中以84%的準確率奪得冠軍,訓(xùn)練成本之低,只用了4顆英偉達GPU。
李彥宏敏銳地發(fā)現(xiàn)了這項研究的價值,旋即安排當(dāng)時負責(zé)百度戰(zhàn)略投資的副總裁湯和松與辛頓取得聯(lián)系,發(fā)出橄欖枝,邀請他加盟百度。這一動作帶動了另外兩家科技巨頭,緊隨其后,谷歌和微軟也相繼發(fā)出了邀約。出于不想高齡遠渡重洋等種種原因,辛頓最終決定加入谷歌與百度擦身而過。最終谷歌用4400萬美元的代價,拍下了這家成立不到一個月、沒有產(chǎn)品、沒有收入,只有三個員工和幾篇論文的公司。
李彥宏在這次競拍中堅定了投入深度學(xué)習(xí)、加快布局AI技術(shù)的決心,2013年1月,李彥宏在百度主導(dǎo)成立了全球第一個深度學(xué)習(xí)研究院,并親自出任院長。他開始向全球招攬吳恩達、徐偉、張潼等知名人才,許多人都是親自拜訪接待。
此后數(shù)年,盡管熱點不斷,但百度一直堅持ALL in AI的戰(zhàn)略。李彥宏在2020年世界人工智能大會上發(fā)表演講:“我對AI的信仰,沒有絲毫改變”,那場演講中,李彥宏給出了自己的堅持。飛槳、昆侖芯、智能云等一系列AI底層技術(shù)和產(chǎn)品在這些年先后誕生,逐漸形成了百度AI“芯片-框架-模型-應(yīng)用”的四層架構(gòu)。
今年站在聚光燈下的文心大模型,其實首次發(fā)布于2019年,那時,距離ChatGPT的基礎(chǔ)大模型GPT-3發(fā)布還有16個月。
2019年7月,文心大模型升級至2.0;2021年12月,百度推出了基于文心大模型的2600億參數(shù)知識增強大模型;2022年5月,11個基于文心的行業(yè)大模型發(fā)布。至2023年3月16日,全行業(yè)的期待下,李彥宏宣布了文心一言的發(fā)布。
“從某種意義上說,我們已經(jīng)為此準備了多年,我們十幾年前就開始投入AI研究,2019年就推出了文心大語言模型,今天的發(fā)布是過去多年努力的延續(xù)。”舞臺上,李彥宏一如既往地溫和卻堅定。
李彥宏曾在2020年的致股東信中寫道,我們有決心,有耐心,我們熬得過萬丈孤獨,藏得下星辰大海。如今,文心一言大模型承載著百度的夢想,駛向星辰大海。
(文章來源:潮新聞)
- 免責(zé)聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風(fēng)險,讀者在采取與本文內(nèi)容相關(guān)的任何行動之前,請務(wù)必進行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產(chǎn)生的任何金錢損失負任何責(zé)任。