MiniMax副總裁劉華:標(biāo)準(zhǔn)化大模型是未來,技術(shù)進(jìn)化優(yōu)于定制化|最前線
文 | 田哲
編輯 | 蘇建勛
隨著人工智能進(jìn)入大模型時代,全球科技競爭正逐步聚焦于中美兩國。高昂的算力投入和海量的數(shù)據(jù)需求,決定了大模型的研發(fā)門檻極高,少數(shù)領(lǐng)先國家的大模型廠商正在這場技術(shù)競賽中爭奪前沿優(yōu)勢。
MiniMax是較早出海的國內(nèi)大模型廠商之一,據(jù)報道,MiniMax今年的海外收入將超過7000萬美元。
目前,MiniMax已在海外市場推出HailuoAI、Talkie兩大 C 端產(chǎn)品,分別主打AI視頻/音頻生成和 AI 內(nèi)容社區(qū)。36氪獲悉,MiniMax的海外主要收入來源,除出海C端AI應(yīng)用Talkie目前占比較大,Hailuo AI訂閱服務(wù)和B端API服務(wù)也有所提升。
近日,騰訊云北區(qū)云原生總經(jīng)理田豐、MiniMax 副總裁劉華,與36氪等媒體展開了一次對話,從全球競爭格局、技術(shù)路徑到商業(yè)化方向,共同探討了大模型技術(shù)的發(fā)展趨勢及兩者間的協(xié)作價值。
劉華介紹,Talkie除了已有的付費(fèi)訂閱制之外,廣告業(yè)務(wù)也是商業(yè)化收入來源之一。此外,MiniMax在海外市場暫時不會開發(fā)定制化模型項(xiàng)目,目前仍以標(biāo)準(zhǔn)化API 接口服務(wù)B端客戶。
原因在于,創(chuàng)業(yè)公司應(yīng)將主要資源投入到核心技術(shù)的研發(fā)與迭代上,而不是耗費(fèi)大量精力在滿足個性化需求的定制化項(xiàng)目中。"如果一款大模型需要大量定制化開發(fā)才能滿足客戶需求,說明這代模型尚不夠成熟,與其投入時間與成本進(jìn)行定制,不如加速模型迭代。"劉華表示。
他透露,MiniMax已確定未來的研發(fā)路線,主要聚焦于降低模型錯誤率、實(shí)現(xiàn)無限長的輸入和輸出、多模態(tài)路線發(fā)展。
首先,模型錯誤率方面,他認(rèn)為上一代的GPT系列模型錯誤率約30%,沒有引起用戶較大重視的原因在于,其較多被用于沒有標(biāo)準(zhǔn)答案的文創(chuàng)領(lǐng)域,如果將大模型用于生產(chǎn)、研發(fā)、科研設(shè)計(jì)等場景,最好把錯誤率降低至個位數(shù)。而MiniMax理想中的錯誤率是2%-3%。
其次,隨著大模型任務(wù)逐步從文本擴(kuò)展到語音和視頻,所需的Token 量也在迅猛增加,因此新技術(shù)落地的關(guān)鍵在于,提高大模型處理大規(guī)模輸入和輸出的能力。
目前,MiniMax最新研發(fā)的Abab 7系列模型基于 MoE和Linear Attention(線性注意力)機(jī)制的新架構(gòu),可顯著降低長文本的計(jì)算復(fù)雜度。
在劉華看來,美國的大模型行業(yè)仍保持一定程度的領(lǐng)先。據(jù)36氪觀察,OpenAI、Anthropic、XAI等行業(yè)頭部廠商占據(jù)了強(qiáng)大的資源和技術(shù)優(yōu)勢,譬如OpenAI的公司規(guī)模接近2000人,年度算力成本可能達(dá)到百億美元。
不過,中國大模型廠商追趕的速度非常快,尤其在語音和視頻等領(lǐng)域,中國的語音 API 服務(wù)已接近 GPT-4o 的水平。如果國內(nèi)知名科技公司也進(jìn)入這一賽道,也必然會憑借其資源優(yōu)勢占據(jù)重要位置。
劉華認(rèn)為,中國的 AI創(chuàng)業(yè)公司仍有著廣闊的發(fā)展空間。正如MiniMax得到了騰訊云這類云廠商支持,同時通過成功的商業(yè)化實(shí)現(xiàn)了資金循環(huán)。
此外,劉華認(rèn)為如果需要更好服務(wù)國內(nèi)外用戶,必須堅(jiān)持自研,打造真正原生性的解決方案,從而擁有具備獨(dú)立競爭力的大模型。
談及與MiniMax的合作。騰訊云北區(qū)云原生總經(jīng)理田豐介紹,騰訊云為MiniMax 提供了一系列集計(jì)算、存儲、網(wǎng)絡(luò)為一體的高性能智能產(chǎn)品,讓 MiniMax釋放更多的精力聚焦在模型本身的訓(xùn)練和工程化上。其中,對象存儲產(chǎn)品則提供了元數(shù)據(jù)加速方案來保障性能,以及多種精細(xì)化管理措施進(jìn)行數(shù)據(jù)治理,降本增效。數(shù)據(jù)湖產(chǎn)品則專門針對語料數(shù)據(jù)預(yù)處理進(jìn)行了專項(xiàng)優(yōu)化,來提升任務(wù)處理性能,幫助MiniMax節(jié)約算力 30%以上,性能提升 35.5%以上。
據(jù)悉,騰訊云高性能計(jì)算集群通過一系統(tǒng)化的運(yùn)維機(jī)制,可做到網(wǎng)絡(luò)故障一分鐘內(nèi)發(fā)現(xiàn)問題,三分鐘內(nèi)定位問題,最快五分鐘恢復(fù)系統(tǒng)。其千卡集群的日故障數(shù)已刷新至 0.16,是行業(yè)平均水平的三分之一。
同時,騰訊云星脈網(wǎng)絡(luò)可支持大模型訓(xùn)練,實(shí)現(xiàn)大模型訓(xùn)練過程中,網(wǎng)絡(luò)通信占比(通信時間占總體時間比例)低至6%,整體訓(xùn)練效率提升了 20% 以上。
正如美國大模型廠商已形成頭部效應(yīng),這一現(xiàn)象也將在中國市場出現(xiàn)。劉華認(rèn)為,未來只有少數(shù)企業(yè)研發(fā)基礎(chǔ)大模型,大多數(shù)企業(yè)將逐漸轉(zhuǎn)向 AI 應(yīng)用層面的研發(fā)。
至于MiniMax,將依然堅(jiān)持投入核心技術(shù)研發(fā),用好的技術(shù)驅(qū)動好的產(chǎn)品,再讓好的產(chǎn)品帶來好的服務(wù)體驗(yàn)和口碑,反哺技術(shù)。
- 免責(zé)聲明
- 本文所包含的觀點(diǎn)僅代表作者個人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險,讀者在采取與本文內(nèi)容相關(guān)的任何行動之前,請務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。