大模型的創(chuàng)投蜜月期,可能結(jié)束得比預(yù)期更早
中國的投資人和創(chuàng)業(yè)者,很久沒有這么開心過了。
長時間的所謂“資本寒冬”,讓所有的融資動作都變得謹(jǐn)小慎微,科技行業(yè)仿佛集體從熱帶移民至南極,只覺過完了一個冬天,下面還是冬天。而這樣的形式,在2023年短短的三個月內(nèi),完成了神奇的逆轉(zhuǎn):今年Q1,各賽道完成融資796.22億元(數(shù)據(jù)來自睿獸分析),是前三個月的13倍,比2022全年還高1倍多,其中絕大部分融資事件,都出自AI賽道。
將模型參數(shù)沖到百億以上,然后開一場發(fā)布會,是上半年許多大模型公司的主要工作。
所以,當(dāng)與小冰CEO李笛在望京見面,交流了關(guān)于大模型的成本、技術(shù)以及其他關(guān)鍵信息后,我們才驚訝地發(fā)現(xiàn):這場大模型創(chuàng)業(yè)者與投資人的蜜月期,可能結(jié)束得比預(yù)期更早。
11月25日,李笛將參加虎嗅F&M創(chuàng)新節(jié)(11月25-26日,為期兩天),他將在北京751D.PARK-97罐,為大家詳細(xì)分享他在 AI、大模型領(lǐng)域的技術(shù)、產(chǎn)品和商業(yè)探索經(jīng)驗(yàn),以及過去一年在與國際專家交流中,形成的對于大模型發(fā)展趨勢的最新判斷。
“大模型的訓(xùn)練成本,已經(jīng)成為行業(yè)內(nèi)不得不關(guān)注的重點(diǎn),”李笛說道,“并不是所有公司都適合做大模型。”
關(guān)于訓(xùn)練成本,其實(shí)業(yè)內(nèi)早有認(rèn)識,但從投資人到創(chuàng)業(yè)者,似乎都在回避這個問題。年初美團(tuán)聯(lián)合創(chuàng)始人王慧文高調(diào)宣稱:“我的人工智能宣言,5000 萬美元,帶資進(jìn)組。”沒承想立刻就遭到行業(yè)內(nèi)人士的批評,海通證券研究所科技產(chǎn)業(yè)鏈負(fù)責(zé)人鄭宏達(dá)說:“5000 萬美元,夠干什么的?大模型訓(xùn)練一次就花500萬美元,訓(xùn)練10次?”
然而大家可能還是太樂觀了。根據(jù)此前 semianalysis 的爆料來看,如果使用 A100 來訓(xùn)練 GPT-4 ,單次訓(xùn)練成本約為 6300 萬美元;如果使用 H100 進(jìn)行訓(xùn)練,單次成本為 2150 萬美元。如果加上實(shí)際工作中方方面面的額外成本,就算用上 H100,5000 萬美元恐怕也只夠訓(xùn)練一次。
這還沒有計算實(shí)際的運(yùn)營成本、研發(fā)成本、人力成本,2022年,OpenAI 巨虧 5.4 億美元。反觀中國創(chuàng)業(yè)市場目前存在 130 余家大模型企業(yè),意味著所有人都擠上了這張“盲注”極大的牌桌。
這樣的成本估算,就是終點(diǎn)嗎?李笛表示,據(jù)可靠的技術(shù)判斷,當(dāng)下的大模型距離理想狀態(tài),至少還差三個數(shù)量級的參數(shù),而大模型的技術(shù)標(biāo)準(zhǔn),會在明年 Q1 基本確定。
留給大模型們的時間,已經(jīng)不多了。
李笛提到,當(dāng)下的 AI 產(chǎn)業(yè),僅憑 AI 軟件服務(wù)幾乎很難取得豐厚的利潤,大部分 AI 企業(yè)的方案是軟件、硬件打包售賣,靠硬件賺取更多營收。這點(diǎn)從“ AI 四小龍”的財報上也能得到印證——市場規(guī)模越大,虧得越多,這是痼疾。
“ AI 服務(wù)當(dāng)下還是以軟件產(chǎn)品的形式,做一次性交付。客戶不會考慮大模型預(yù)訓(xùn)練的成本,只會考慮大模型服務(wù)在推理過程中產(chǎn)生的成本。”李笛告訴虎嗅,“做成 SaaS 服務(wù)也不太行,做 SaaS 會發(fā)現(xiàn)市場很快就飽和了。即便參照云計算的發(fā)展路線,借鑒意義也十分有限,云計算畢竟有實(shí)打?qū)嵉姆?wù)器可供租用,和大模型買GPU做預(yù)訓(xùn)練是兩個概念。”
如果沿用互聯(lián)網(wǎng)時代的流量思維,重心從 To B 轉(zhuǎn)向 To C ,是否可行呢?現(xiàn)在 ChatGPT 付費(fèi)版每月收費(fèi) 20 美元,如果是調(diào)用 API,每輸出100萬個單詞的價格約僅為 2.7 美元。百度文心一言付費(fèi)版,連續(xù)包月的價格是 49.9 元/月。
無論是哪款,連訂三個月,都不一定有東北人過冬買的幾百斤大白菜開銷大。
從成本最高、最有想象力的軟件產(chǎn)品,到白菜一般的零售價格,中間到底誰在作祟?
- 免責(zé)聲明
- 本文所包含的觀點(diǎn)僅代表作者個人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險,讀者在采取與本文內(nèi)容相關(guān)的任何行動之前,請務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。