首頁 > AI資訊 > 最新資訊 > 國產(chǎn)大模型密集放大招!豆包提出新架構(gòu)AI手機(jī)兩大重磅消息都與國產(chǎn)大模型有關(guān)

國產(chǎn)大模型密集放大招!豆包提出新架構(gòu)AI手機(jī)兩大重磅消息都與國產(chǎn)大模型有關(guān)

證券時報(bào)網(wǎng)    2025-02-13

  國產(chǎn)大模型,密集放大招。

  2月12日,字節(jié)跳動豆包大模型團(tuán)隊(duì)發(fā)布消息稱,團(tuán)隊(duì)提出了全新的稀疏模型架構(gòu)UltraMem,可有效解決MoE(Mixtureof Experts,混合專家模型)推理時高額的訪存問題,推理速度較MoE架構(gòu)提升2—6倍,推理成本最高可降低83%。

  除了字節(jié)豆包以外,阿里和智譜AI也傳來新動態(tài)。據(jù)TheInformation援引知情人士消息稱,蘋果和阿里將合作為中國iPhone用戶開發(fā)AI功能。受該消息影響,阿里美股直線拉升,一度漲超3%。另外,三星則宣布智譜的AgenticGLM成為其新手機(jī)GalaxyS25的AI能力來源。業(yè)內(nèi)分析稱,蘋果牽手阿里,三星與智譜合作,AI手機(jī)在中國市場的端側(cè)AI大戰(zhàn),將在2025年進(jìn)入焦灼的“貼身肉搏”狀態(tài)。

  豆包提出新架構(gòu),大幅降低推理成本

  據(jù)豆包大模型團(tuán)隊(duì),在大模型主流的Transformer架構(gòu)下,模型的性能與其參數(shù)數(shù)量和計(jì)算復(fù)雜度呈對數(shù)關(guān)系。隨著大語言模型規(guī)模不斷增大,推理成本會急劇增加,速度變慢。盡管MoE架構(gòu)已經(jīng)成功將計(jì)算和參數(shù)解耦,但在推理時,較小的batchsize就會激活全部專家,導(dǎo)致訪存急劇上升,進(jìn)而使推理延遲大幅增加。

  為解決這一問題,字節(jié)跳動豆包大模型Foundation團(tuán)隊(duì)提出了全新的稀疏模型架構(gòu)UltraMem,這一架構(gòu)同樣將計(jì)算和參數(shù)解耦,但在保證模型效果的前提下解決了推理的訪存問題。

  實(shí)驗(yàn)結(jié)果表明,在參數(shù)和激活條件相同的情況下,UltraMem在模型效果上超越了MoE,并將推理速度提升了2—6倍。在常見batchsize規(guī)模下,UltraMem的訪存成本幾乎與同計(jì)算量的稠密模型相當(dāng)。

  據(jù)了解,最近大火的國產(chǎn)模型團(tuán)隊(duì)DeepSeek,重要的一項(xiàng)技術(shù)基石就是MoE。其自研的DeepSeekMoE是一種創(chuàng)新的大規(guī)模語言模型架構(gòu),通過整合專家混合系統(tǒng)、改進(jìn)的注意力機(jī)制和優(yōu)化的歸一化策略,在模型效率與計(jì)算能力之間實(shí)現(xiàn)了新的平衡。

  隨著豆包大模型團(tuán)隊(duì)提出新的稀疏模型架構(gòu)UltraMem,大模型訓(xùn)練推理成本有望進(jìn)一步快速下降,推動大模型的發(fā)展。

  AI手機(jī)兩大重磅,都與國產(chǎn)大模型有關(guān)

  據(jù)TheInformation援引知情人士消息稱,蘋果和阿里將合作為中國iPhone用戶開發(fā)AI功能,具體功能包括圖像生成、文本優(yōu)化、智能搜索等,以增強(qiáng)iPhone在攝影、通知管理和文本處理等場景的體驗(yàn)。受該消息影響,阿里美股直線拉升,一度漲超3%。

  該報(bào)道還稱,蘋果和阿里已將雙方共同開發(fā)的AI功能提交給監(jiān)管機(jī)構(gòu)審批,若獲批,中國將成為全球首個使用蘋果與本土企業(yè)合作AI功能的地區(qū)。事實(shí)上,此前屢屢有關(guān)于蘋果與國產(chǎn)AI大模型合作的消息傳出,曾有消息稱百度或成為蘋果的合作伙伴,還有傳言稱蘋果曾與騰訊、字節(jié)以及智譜AI、百川等公司接觸。

  蘋果在華銷售額已連續(xù)兩年下降,2024年第四季度同比下滑11%,這一舉措是蘋果應(yīng)對中國市場銷售下滑的戰(zhàn)略之一,旨在通過更具吸引力的軟件功能,與華為、vivo等本土品牌的競爭對手抗衡。

  阿里是國產(chǎn)AI大模型的第一梯隊(duì)玩家。在今年春節(jié)期間,阿里云通義千問旗艦版模型Qwen2.5-Max正式升級發(fā)布。據(jù)其介紹,Qwen2.5-Max模型是阿里云通義團(tuán)隊(duì)對MoE模型的最新探索成果,預(yù)訓(xùn)練數(shù)據(jù)超過20萬億tokens,展現(xiàn)出極強(qiáng)勁的綜合性能,在多項(xiàng)公開主流模型評測基準(zhǔn)上錄得高分,全面超越了目前全球領(lǐng)先的開源MoE模型以及最大的開源稠密模型。

  Qwen2.5-Max的發(fā)布還引發(fā)了資本市場關(guān)于重估中國AI資產(chǎn)的討論。業(yè)內(nèi)人士分析,阿里云不僅發(fā)布了與全球頂尖模型比肩甚至更優(yōu)的模型,而且具備完整的云生態(tài),或能形成類似去年北美云計(jì)算服務(wù)商的投資邏輯。自1月中旬以來,阿里美股累計(jì)漲幅已超30%。

  除了蘋果+阿里的組合以外,三星+智譜的合作也引發(fā)市場關(guān)注。智譜和三星基于AgenticGLM展開合作,三星最新手機(jī)GalaxyS25系列現(xiàn)可支持基于AI的實(shí)時語音和視頻通話,以及實(shí)現(xiàn)視覺理解和系統(tǒng)功能調(diào)用、AI搜索、文案寫作等功能,智譜旗下C端產(chǎn)品智譜清言及清言智能體平臺登陸GalaxyS25系列。

  智譜有關(guān)負(fù)責(zé)人介紹稱,AgenticGLM讓GalaxyS25系列能夠同時處理文本、語音、圖像和視頻等多模態(tài)的數(shù)據(jù),并能夠使用工具,具備自主行動能力。比如,GalaxyS25系列的“語聊視界”功能,能夠讓AI視頻通話功第一次在手機(jī)上同用戶智能互動。GLM-Realtime支持圖片和視頻輸入,能夠精確識別畫面中的文字和細(xì)節(jié),以及流式推理能力帶來了低延時。它還擁有多輪記憶能力,能作為更聰明的語音助理,為用戶提供流暢的翻譯、搜索等功能。

  “基于最新GalaxyAI的三星GalaxyS25系列手機(jī)是三星在全球范圍內(nèi)首次推出具有視頻通話功能的原生AI智能硬件產(chǎn)品。很高興智譜AgenticGLM豐富多樣的AI功能通過系統(tǒng)級的無縫嵌入,能夠?yàn)閺V大用戶提供沉浸、智能、安全的AI手機(jī)體驗(yàn)?!敝亲V方面表示。

  業(yè)內(nèi)人士普遍認(rèn)為,隨著DeepSeek等國產(chǎn)大模型帶動大模型的成本大幅下降,有望推動端側(cè)AI加速發(fā)展,帶動智能手機(jī)、智能家居設(shè)備、智能可穿戴設(shè)備等更多終端設(shè)備集成智能功能。

(文章來源:證券時報(bào)網(wǎng))

相關(guān)推薦
免責(zé)聲明
本文所包含的觀點(diǎn)僅代表作者個人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險,讀者在采取與本文內(nèi)容相關(guān)的任何行動之前,請務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。

熱門文章