DeepSeek浪潮下,端側(cè)AI的創(chuàng)新催化劑
端側(cè) AI
催化劑
在柏拉圖的《理想國(guó)》中有一個(gè)洞穴隱喻的故事,一群囚徒從小就被鎖在一個(gè)洞穴里面對(duì)墻壁,身后有一堆火,囚徒們一生所見(jiàn)只有映在墻壁上的影子,便以為這些影子就是真實(shí)的世界。
大模型也曾被類似的「影子」誤導(dǎo),一度將大力出奇跡的預(yù)訓(xùn)練奉為圭臬。直到 2025 年初 DeepSeek R1 展現(xiàn)的推理能力,AI 從僅僅觀察影子的階段,轉(zhuǎn)向以自省和辯證的方式探尋真知。
DeepSeek 讓模型走出「洞穴」,也在改變智能終端的范式。
DeepSeek 蒸餾模型在問(wèn)世不到兩周內(nèi)便實(shí)現(xiàn)在搭載驍龍平臺(tái)的商用終端上的運(yùn)行,AI 硬件將不再只是提升估值的「性感故事」,而是已經(jīng)具備實(shí)際的應(yīng)用價(jià)值和商業(yè)潛力。
高通最新發(fā)布的白皮書(shū)《AI 變革正在推動(dòng)終端側(cè)推理創(chuàng)新》指出,DeepSeek 的推出標(biāo)志著 AI 進(jìn)入推理創(chuàng)新時(shí)代,訓(xùn)練成本下降、快速推理部署和針對(duì)邊緣環(huán)境的創(chuàng)新,正在推動(dòng)高質(zhì)量小模型的激增,加速 AI 跨邊緣終端的部署。
清華大學(xué)副教授、面壁智能聯(lián)合創(chuàng)始人兼首席科學(xué)家劉知遠(yuǎn)也提出,這種從「規(guī)模至上」到「效率優(yōu)先」的轉(zhuǎn)變,為端側(cè) AI 提供了重要啟示:通過(guò)模型壓縮、參數(shù)優(yōu)化和算法創(chuàng)新,可以在保持模型性能的同時(shí),大幅降低計(jì)算資源需求,使其適合在終端設(shè)備上運(yùn)行。
使用 DeepSeek 蒸餾后的 Qwen-7B 模型,已經(jīng)能夠在性能上與去年所推出的且當(dāng)時(shí)最為先進(jìn)的 GPT-4o 云端模型持平。
這也意味著,過(guò)去很多只能在云端運(yùn)行大規(guī)模參數(shù)的模型,能部署到隨身的終端設(shè)備中,在本地完成復(fù)雜的推理過(guò)程,甚至可能實(shí)現(xiàn)滿血運(yùn)行。同時(shí),在端側(cè) AI 的新浪潮下,我們正見(jiàn)證智能終端的又一次關(guān)鍵轉(zhuǎn)折——從單純的功能性設(shè)備到具有自主理解和行動(dòng)能力的智能體(Agent)。
端側(cè) AI 的技術(shù)拐點(diǎn):從「規(guī)模至上」到「推理創(chuàng)新時(shí)代」
兩年前,比爾·蓋茨發(fā)布了一篇博客,稱在有生之年見(jiàn)證了兩次革命性的 Demo ,第一次是在 1980 年看到了圖形用戶界面(GUI)——現(xiàn)代操作系統(tǒng)的前身,另一次則是在 GPT-3.5 前幾個(gè)月看到 AI 的回答方式。
然而作為普通用戶,對(duì)這種改變的感知顯然沒(méi)那么強(qiáng)烈,因?yàn)榻换サ淖兏锏妮d體離不開(kāi)智能終端,就像 iPhone 將功能機(jī)時(shí)代的按鍵操作轉(zhuǎn)變?yōu)橛|控交互,進(jìn)而重塑了整個(gè)智能手機(jī)生態(tài)。
那么在 AI 時(shí)代這個(gè)載體是什么?
或許未必是一個(gè)全新形態(tài)的終端,而是智能終端帶來(lái)的全新體驗(yàn)形式——從應(yīng)用驅(qū)動(dòng)向智能體驅(qū)動(dòng)。
就像高通 CEO 安蒙在去年年底提到的新趨勢(shì),AI 是新的用戶界面(UI)。端側(cè) AI 的落地將改變傳統(tǒng)的交互邏輯。
用戶無(wú)需打開(kāi)特定應(yīng)用,AI 智能體可通過(guò)多模態(tài)輸入(語(yǔ)音、圖像、視頻)直接執(zhí)行任務(wù)。這些功能背后其實(shí)離不開(kāi)邊緣側(cè) AI 支持。
比如榮耀 Magic7 系列中 YOYO 智能體的許多交互功能就需要終端側(cè) AI 處理能力的支持,驍龍 8 至尊版搭載的高通 Hexagon NPU 為終端側(cè)提供了足夠強(qiáng) 的 AI 算力,可以在手機(jī)本地完成推理和理解等 AI 任務(wù)。
過(guò)去端側(cè) AI 受限于硬件性能,而大模型的計(jì)算需求卻在快速增長(zhǎng),雖然此前搭載驍龍 8 至尊版的智能手機(jī)已經(jīng)能在端側(cè)運(yùn)行 7B 規(guī)模的模型,但針對(duì)一些復(fù)雜的生成式 AI 用例和高質(zhì)量圖像生成等任務(wù),還是需要結(jié)合云端算力。
不過(guò)現(xiàn)在端側(cè) AI 的技術(shù)拐點(diǎn)已經(jīng)出現(xiàn),《AI變革正在推動(dòng)終端側(cè)推理創(chuàng)新》白皮書(shū)中指出了加速端側(cè) AI 落地的四大趨勢(shì):
1.
當(dāng)前先進(jìn)的AI小模型已具備卓越性能,通過(guò)模型蒸餾和新型網(wǎng)絡(luò)架構(gòu),性能已經(jīng)超越一年前僅能在云端運(yùn)行的更大模型
2.
模型參數(shù)規(guī)模正在快速縮小,先進(jìn)的量化和剪枝技術(shù)使開(kāi)發(fā)者能在保持準(zhǔn)確性的同時(shí)減小模型體積
3.
開(kāi)發(fā)者能夠在邊緣側(cè)打造更豐富的應(yīng)用,如文本摘要、編程助手和實(shí)時(shí)翻譯
4.
讓 Agent 成為新交互入口,個(gè)性化多模態(tài)AI智能體將簡(jiǎn)化交互
高通技術(shù)公司高級(jí)副總裁、技術(shù)規(guī)劃和邊緣解決方案業(yè)務(wù)總經(jīng)理馬德嘉告訴愛(ài)范兒,隨著模型規(guī)模不斷地下降,日后 10-20 億參數(shù)規(guī)模的模型將會(huì)占用更少的運(yùn)行內(nèi)存,更好地適配 8-12GB 內(nèi)存設(shè)置的終端。
異構(gòu)計(jì)算架構(gòu):端側(cè) AI 的硬件基礎(chǔ)
高通技術(shù)公司擁有三大業(yè)界領(lǐng)先的處理器單元,這些處理器對(duì)于端側(cè) AI 的發(fā)展非常重要。
馬德嘉表示,「我們有業(yè)界領(lǐng)先的定制高通 Oryon CPU,并已經(jīng)應(yīng)用于我們的 PC、移動(dòng)和汽車平臺(tái)。」
高通 Adreno GPU 能夠滿足終端側(cè) AI 運(yùn)行所需要的眾多功能需求;此外,高通 Hexagon NPU 完全面向處理生成式 AI 工作負(fù)載而設(shè)計(jì)。
這三大處理器單元必須都具備業(yè)界領(lǐng)先的能力且能夠協(xié)同工作,才能實(shí)現(xiàn)異構(gòu)計(jì)算,滿足生成式 AI 的發(fā)展需求,而在這一領(lǐng)域高通有著非常強(qiáng)大的優(yōu)勢(shì)。
端側(cè) AI 的落地對(duì)芯片架構(gòu)提出了更高的要求,高通的做法是,將 NPU、GPU 和 CPU 集成到終端中的異構(gòu)計(jì)算架構(gòu),從而在更低功耗下輸出更高算力,且滿足不同場(chǎng)景的 AI 處理任務(wù)需求。
這一架構(gòu)的核心是三大處理器單元之間,如同一支交響樂(lè)隊(duì)般的協(xié)同合作:
1.
高通自研 Oryon CPU:最新的第二代 Oryon CPU 采用臺(tái)積電 3nm 工藝,最高主頻達(dá) 4.32GHz,超大緩存設(shè)計(jì)(業(yè)界最大 24MB 二級(jí)緩存)顯著降低 AI 推理時(shí)延。
2.
高通 Adreno GPU:滿足終端側(cè) AI 運(yùn)行的多樣化功能需求,特別在并行計(jì)算和圖像處理方面表現(xiàn)出色。
3.
高通 Hexagon NPU:專為處理生成式 AI 工作負(fù)載而設(shè)計(jì),讓驍龍 8 至尊版上實(shí)現(xiàn)了45% 的 AI 性能提升和 45% 的 AI 能效提升。
其中 Oryon CPU 在手機(jī)與汽車芯片中的復(fù)用。這意味著這些終端設(shè)備可以采用共通的底層架構(gòu),有更好的兼容性,互相之間的互聯(lián)互通也會(huì)更加通暢。
這種異構(gòu)計(jì)算架構(gòu)在最新發(fā)布的眾多驍龍 8 至尊版旗艦手機(jī)上已經(jīng)有所體現(xiàn), iQOO 13 利用驍龍 8 至尊版的 AI 算力,打造了 AI 電競(jìng)信號(hào)引擎,通過(guò) AI 智能優(yōu)化網(wǎng)絡(luò),實(shí)現(xiàn)多任務(wù)場(chǎng)景下時(shí)延更低,可以邊玩游戲邊視頻或直播。
REDMI K80 Pro 則將 AI 技術(shù)應(yīng)用于連接體驗(yàn),帶來(lái)了小米星辰 AI 多網(wǎng)融合,可以進(jìn)行智能信號(hào)預(yù)測(cè),讓網(wǎng)絡(luò)自動(dòng)優(yōu)化。在地鐵場(chǎng)景下,微信視頻卡頓率降低 31%,短視頻卡頓率降低 29%。
如果說(shuō)智能終端已經(jīng)進(jìn)入 Agent 時(shí)代,那么異構(gòu)計(jì)算架構(gòu)就是智能體的「中央神經(jīng)系統(tǒng)」,不僅處理各種感官信息,還能協(xié)調(diào)「思考」與「行動(dòng)」,保證端側(cè) AI 高效、流暢、穩(wěn)定地運(yùn)行。
軟件也是釋放端側(cè) AI 潛能的關(guān)鍵
正如高性能賽車不僅需要強(qiáng)勁的引擎,還需要精密的調(diào)校和優(yōu)秀的賽車手一樣。端側(cè) AI 的實(shí)現(xiàn)不僅僅依賴于強(qiáng)大的硬件算力,同樣離不開(kāi)高效、完善的軟件工具支持。
對(duì)開(kāi)發(fā)者來(lái)說(shuō),其實(shí)不需要知道硬件端的具體設(shè)計(jì)細(xì)節(jié),更重要的是軟件工具庫(kù)支持,讓他們能夠按照自己所需,非常自由、靈活地選擇所需的框架、runtime 和工具,面向任何操作系統(tǒng)設(shè)計(jì) AI 應(yīng)用和智能體。
在提供硬件基礎(chǔ)的同時(shí),高通也在構(gòu)建 AI 軟件棧,包括庫(kù)(libraries)、SDK 和優(yōu)化工具,可簡(jiǎn)化模型部署并提升性能。
開(kāi)發(fā)者可以利用這些資源,面向高通平臺(tái)高效進(jìn)行模型適配,縮短 AI 賦能應(yīng)用的上市時(shí)間。無(wú)論端側(cè) AI 的算力有多強(qiáng)大,也只有通過(guò)應(yīng)用來(lái)釋放出來(lái),最終才能轉(zhuǎn)化為用戶體驗(yàn)。
在實(shí)際應(yīng)用中,你可以拿起手機(jī)識(shí)別你將用于烹飪的食材,成功識(shí)別后,讓手機(jī)幫你生成對(duì)應(yīng)的菜譜,還能讓手機(jī)給你一些低卡路里菜單組合。
烹飪完成后,你可以通過(guò)攝像頭,向手機(jī)詢問(wèn)這些食物所包含的卡路里。憑借智能手機(jī)如今對(duì)多模態(tài) AI 能力的支持,這個(gè)用例可以完全在終端側(cè)實(shí)現(xiàn)。
這種場(chǎng)景正是智能體作為新平臺(tái)的典型應(yīng)用——用戶不再需要打開(kāi)多個(gè)應(yīng)用,而是通過(guò)自然交互直接完成復(fù)雜任務(wù)。
這種以開(kāi)發(fā)者為中心的策略,大大簡(jiǎn)化了在消費(fèi)和商用產(chǎn)品中集成先進(jìn) AI 特性的過(guò)程,也在加速 AI 推理創(chuàng)新在端側(cè)的應(yīng)用。
AI Hub 正成為開(kāi)發(fā)者的百寶箱
目前已經(jīng)有眾多智能手機(jī)、PC、汽車廠商在終端設(shè)備中接入 DeepSeek,開(kāi)始了利用高質(zhì)量小模型在終端側(cè)升級(jí)AI體驗(yàn),或是打造全新 AI 應(yīng)用的實(shí)踐。邊緣側(cè) AI 應(yīng)用的創(chuàng)新蓄勢(shì)待發(fā)。
如果你是一個(gè)開(kāi)發(fā)者,對(duì)不同細(xì)分領(lǐng)域的芯片平臺(tái)的 AI 部署也有了更迫切的需求。高通去年發(fā)布的高通 AI Hub 跨出了一大步,讓開(kāi)發(fā)者選擇相應(yīng)平臺(tái)和開(kāi)發(fā)模型、編寫(xiě)應(yīng)用,最后在不同類型的移動(dòng)終端上進(jìn)行部署。
高通 AI Hub 包含超過(guò) 100 個(gè)預(yù)優(yōu)化的 AI 模型,如Llama、Allam 3B、通義千問(wèn)、OpenAI 等廠商模型,支持在搭載驍龍平臺(tái)的終端上無(wú)縫部署,發(fā)布一年以來(lái),目前已有超過(guò) 1500 家企業(yè)在使用,進(jìn)一步推動(dòng)了端側(cè) AI 應(yīng)用的普及。
AI Hub 覆蓋的終端也不斷增加,馬德嘉向我們介紹,高通 AI Hub 可支持移動(dòng)、PC、IoT、汽車,甚至 Wi-Fi 聯(lián)網(wǎng)終端平臺(tái),比如第二代高通機(jī)器人 RB3 平臺(tái)這一面向 IoT 領(lǐng)域的機(jī)器人平臺(tái)。
高通正在成為端側(cè) AI 生態(tài)構(gòu)建者,通過(guò)與全球 AI 模型廠商的積極合作,不僅提供了強(qiáng)大的計(jì)算平臺(tái),還開(kāi)發(fā)了完整的軟件棧和開(kāi)發(fā)工具,使開(kāi)發(fā)者能夠更輕松地將 AI 模型集成到應(yīng)用程序中。
智能終端的 Agent 時(shí)代真正到來(lái)之前,這個(gè)行業(yè)需要先構(gòu)建完整的端側(cè) AI 生態(tài)系統(tǒng)。
高通,正在成為端側(cè) AI 的首席架構(gòu)師
在中國(guó)隋朝,曾誕生了一個(gè)名留千史的建筑工程專家宇文愷,他不僅規(guī)劃了貫通南北的水道網(wǎng)絡(luò),更創(chuàng)新性地設(shè)計(jì)了船閘系統(tǒng),解決了不同水位間船只通行的技術(shù)難題。用「通則興,塞則衰」的系統(tǒng)思維,將分散的河道整合成一個(gè)互聯(lián)互通的交通網(wǎng)絡(luò)。
這與高通為端側(cè) AI 提供的統(tǒng)一而高效的計(jì)算基礎(chǔ)頗為相似。正如大運(yùn)河的修建需要克服地形、水文等諸多挑戰(zhàn),端側(cè) AI 所面對(duì)的,是來(lái)自不同終端設(shè)備、不同應(yīng)用場(chǎng)景的更加多樣化和復(fù)雜的需求。這其中不僅包括了硬件性能的限制,還包括了模型大小、功耗、延遲等多重約束。
而要讓 AI 真正融入到這些多樣化的終端中,正如宇文愷當(dāng)年規(guī)劃大運(yùn)河一樣,需要一位「首席架構(gòu)師」來(lái)進(jìn)行頂層設(shè)計(jì),打造出強(qiáng)大的底層架構(gòu)來(lái)支撐其高效運(yùn)行。這個(gè)架構(gòu)不僅要能處理海量數(shù)據(jù),還要能靈活適應(yīng)各種應(yīng)用場(chǎng)景。
這種從具體到抽象、從工程到技術(shù)的遞進(jìn),實(shí)際上也反映了人類文明發(fā)展的基本脈絡(luò)。
人類文明的傳承本質(zhì)就是信息蒸餾的過(guò)程。從中世紀(jì)一字一句地謄抄、信息時(shí)代的系統(tǒng)化結(jié)構(gòu),到 AI 推理時(shí)代,信息的提煉呈現(xiàn)出新的形態(tài)——模型通過(guò)強(qiáng)化學(xué)習(xí)來(lái)發(fā)展推理能力,像嬰兒通過(guò)不斷的自我探索來(lái)認(rèn)識(shí)世界。
像前面提到的高通 AI Hub ,它構(gòu)建的預(yù)優(yōu)化模型庫(kù),使開(kāi)發(fā)者能將適應(yīng)終端設(shè)備的模型的,應(yīng)用在高通手機(jī)、PC 和汽車等多終端中的技術(shù)基礎(chǔ)。
模型輕量化是端側(cè) AI 普及的關(guān)鍵。DeepSeek 蒸餾模型已經(jīng)可在驍龍平臺(tái)智能手機(jī)和 PC上直接運(yùn)行。這種技術(shù)突破類似于大運(yùn)河工程中的節(jié)水閘門(mén)設(shè)計(jì),以最小的資源消耗實(shí)現(xiàn)最大的通行效率。
同時(shí) AI 推理的創(chuàng)新正在邊緣側(cè)爆發(fā)。
研究機(jī)構(gòu) Counterpoint Research 預(yù)測(cè),2025 年將成為生成式 AI 手機(jī)的關(guān)鍵拐點(diǎn)。
生成式AI技術(shù)正在成為中高端手機(jī)的標(biāo)配。預(yù)計(jì) 2025 年全球生成式 AI 手機(jī)滲透率將從 2024 年的 19%提升至29%,出貨量約 4 億臺(tái),到 2027 年 ,生成式 AI 手機(jī)出貨量預(yù)計(jì)達(dá) 5.5 億臺(tái)(占整體市場(chǎng) 43%)。
此外,全球邊緣 AI芯 片規(guī)模預(yù)計(jì)從 2023 年 76 億美元增至 2027 年 252 億美元(CAGR 27.1%),汽車、工業(yè)物聯(lián)網(wǎng)和醫(yī)療是核心增長(zhǎng)領(lǐng)域。
高通正在轉(zhuǎn)變成端側(cè) AI 的首席架構(gòu)師。
端側(cè) AI 的能力注入到終端的每一個(gè)角落,從智能手機(jī)到汽車,從 XR 頭顯到 PC,一條連接不同終端、促進(jìn)智能體自由流動(dòng)的技術(shù)「大運(yùn)河」正在形成。
- 免責(zé)聲明
- 本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢(qián)損失負(fù)任何責(zé)任。