首頁 > AI資訊 > 最新資訊 > AI在終端運(yùn)用增長,成為手機(jī)、電腦新賣點(diǎn)

AI在終端運(yùn)用增長,成為手機(jī)、電腦新賣點(diǎn)

新火種    2023-11-27

來源:【中國城市報(bào)】

相較于依托數(shù)據(jù)中心、通過處理巨量數(shù)據(jù)給出洞察建議的云端AI,終端側(cè)AI多在拍照、安全、聯(lián)接等領(lǐng)域扮演并不顯山露水的賦能角色。隨著終端側(cè)AI技術(shù)的不斷進(jìn)步,疊加智能手機(jī)和PC(個(gè)人電腦)市場漫長的累庫周期已過,產(chǎn)能逐漸恢復(fù),市場開始將AI與終端的融合視為新的創(chuàng)新錨點(diǎn)。

如今,終端側(cè)AI正在走向臺(tái)前,成為手機(jī)、電腦廠商的新賣點(diǎn)。雖然目前尚未出現(xiàn)真正的“殺手級(jí)應(yīng)用”徹底改變市場格局,但端側(cè)大模型競賽已趨白熱化,手機(jī)、電腦未來將如何被重塑?

消費(fèi)電子景氣度底部改善

AI成為新賣點(diǎn)

vivo在11月1日舉行的開發(fā)者大會(huì)上,展示了其AI解決方案中的前沿技術(shù)——“藍(lán)心小V”。這款由vivo自研大模型加持的智能手機(jī)助手,不僅能高效檢索照片和文件,還可在復(fù)雜場景下實(shí)現(xiàn)路人消除功能,甚至助力用戶提煉論文要點(diǎn),以及創(chuàng)作社交媒體內(nèi)容和生成思維導(dǎo)圖。

vivo并未明確表態(tài)這些功能是否完全基于終端。但據(jù)透露,為“藍(lán)心小V”提供支撐的自研藍(lán)心大模型矩陣中,70億參數(shù)版本已落地移動(dòng)終端,而更高級(jí)的130億參數(shù)模型也已實(shí)現(xiàn)終端側(cè)跑通。11月13日,vivo即發(fā)布了搭載“藍(lán)心小 V”、端側(cè)支持 70 億大模型的X100系列手機(jī)。

與此同時(shí),三星于11月8日展示了其Gauss大模型,OPPO則計(jì)劃于11月中旬公布安第斯大模型的最新進(jìn)展和特性。這些動(dòng)作緊跟在10月下旬小米、榮耀公布其自研端側(cè)大模型進(jìn)展之后。不到一個(gè)月,幾大主流安卓手機(jī)品牌齊聚端側(cè)大模型賽道。另一方面,華為則早在8月就宣布其智慧助手“小藝”已經(jīng)接入了自家的盤古大模型能力。

將經(jīng)過精細(xì)訓(xùn)練的大模型引入終端設(shè)備,已是終端與芯片行業(yè)新一輪技術(shù)競賽的核心。2022年11月,OpenAI發(fā)布聊天機(jī)器人ChatGPT,迅速引發(fā)了全球范圍內(nèi)關(guān)于大模型的AI熱潮,互聯(lián)網(wǎng)、云服務(wù)和AI領(lǐng)域企業(yè)紛紛入局。如今,這場技術(shù)革命之“火”從云端燒到終端。

為端側(cè)大模型提供底層算力的芯片領(lǐng)域火藥味漸濃。10月下旬,高通在驍龍峰會(huì)上發(fā)布新款旗艦處理器第三代驍龍8,成為首個(gè)在手機(jī)終端側(cè)支持百億參數(shù)大模型的芯片平臺(tái)。該平臺(tái)基于Stable Diffusion模型,其文生圖功能的運(yùn)行速度由2023年一季度的15秒提升至僅需0.6秒。在此次峰會(huì)期間,小米、榮耀也宣布了各自可運(yùn)行于高通平臺(tái)的自研大模型進(jìn)展。

聯(lián)發(fā)科則搶在高通發(fā)布會(huì)前夕,公布了與OPPO、vivo在端側(cè)大模型上的合作。11月6日,聯(lián)發(fā)科在其新款旗艦手機(jī)芯片“天璣9300”發(fā)布會(huì)上,展示了其在AI大模型領(lǐng)域的實(shí)力。這款芯片不僅支持70億參數(shù)規(guī)模大模型落地,還成功地在端側(cè)運(yùn)行了130億參數(shù)模型,并正在探索端側(cè)運(yùn)行330億參數(shù)大模型的可能性。在展示用例中,聯(lián)發(fā)科稱,基于這款芯片的文生圖速度已降至不到1秒。

PC芯片領(lǐng)域,競爭亦在白熱化。高通在驍龍峰會(huì)上發(fā)布了其新款PC處理器驍龍X Elite,AI特性成為最大賣點(diǎn)。與此同時(shí),英特爾也計(jì)劃于12月發(fā)布集成NPU(神經(jīng)網(wǎng)絡(luò)處理器)的新品“酷睿Ultra”,意圖直指AI PC市場。根據(jù)市場調(diào)研機(jī)構(gòu)Counterpoint數(shù)據(jù),2023年三季度全球智能手機(jī)與PC兩大市場均錄得環(huán)比增幅。在觸底期已過的樂觀預(yù)期下,市場對AI的提振作用寄予厚望,認(rèn)為AI PC可能會(huì)在2024年推動(dòng)新一輪出貨反彈,并有望在2026年后主導(dǎo)PC市場。

大模型塞進(jìn)終端

效果幾何

塞進(jìn)AI大模型的終端設(shè)備,究竟會(huì)有什么不同?華為在今年8月的新產(chǎn)品發(fā)布會(huì)上,基本奠定這一輪手機(jī)端側(cè)大模型落地基礎(chǔ)應(yīng)用——智能助手。升級(jí)后的變化在于手機(jī)助手從原先僅限于語音交互,擴(kuò)展為支持語音、文字、圖片和文檔等多種輸入形式,并能從單純的準(zhǔn)確指令執(zhí)行,進(jìn)步為自然對話。

幾乎與華為同步,小米也在8月對其語音助手“小愛”進(jìn)行了大模型賦能,實(shí)現(xiàn)了從過去較局限的固定對答語庫向復(fù)雜指令交互的升級(jí),極大地增強(qiáng)了處理復(fù)雜指令的能力。此外,小米還宣布成功在手機(jī)端跑通了自研的13億參數(shù)模型,部分場景效果比肩云端的60億參數(shù)模型,并在10月進(jìn)一步將端側(cè)大模型參數(shù)升至60億。

小米技術(shù)委員會(huì)AI實(shí)驗(yàn)室的負(fù)責(zé)人欒劍在接受中國城市報(bào)記者采訪時(shí)表示,傳統(tǒng)的智能助手由于需要精確指令才能給出正確反饋而被許多用戶視為不實(shí)用。他提到,大模型技術(shù)可在復(fù)雜指令和多輪交互上帶來全新體驗(yàn),使得用戶可以更自然、隨意地與AI進(jìn)行交流。此外,在生成能力上,AI不再僅僅是娛樂工具,而是成了一個(gè)實(shí)用的助手。

在高通驍龍峰會(huì)上,榮耀展示了其YOYO助手通過大模型技術(shù),幫助用戶以語音搜索手機(jī)中的影像,并按指令生成視頻的能力。而vivo的策略有所不同,推出了獨(dú)立的GPT產(chǎn)品藍(lán)心小V,而不是升級(jí)原有的手機(jī)助手。vivo解釋稱,選擇相對保守的應(yīng)用方案緣于用戶仍可能延續(xù)使用習(xí)慣。兩款產(chǎn)品可能會(huì)在未來成熟后融合。

相較于終端廠商,芯片廠商攜合作伙伴展示的使用場景更輕量和聚焦。例如,高通與慧鯉科技合作推出的“照片擴(kuò)充”功能,可以通過AI補(bǔ)全已拍攝照片的周圍景觀,創(chuàng)造廣角效果。聯(lián)發(fā)科則展示了更貼近中國市場的應(yīng)用,比如快速生成表情包的“文生趣圖”。此外,高通合作伙伴元智能(RWKV)也展示了于手機(jī)端側(cè)生成音樂的能力。

在PC市場上,AI也是新一輪角力之處。Counterpoint高級(jí)分析師William Li表示,從硬件角度看,蘋果搭載M系列自研芯片的Mac系列PC已具備AI PC的特性。而隨著英特爾和高通新款芯片的推出,預(yù)計(jì)到2024年上半年,我們將看到更廣泛的AI PC應(yīng)用。

手機(jī)端側(cè)大模型瓶頸:

性能和能耗難平衡

高通公司總裁兼CEO安蒙(Cristiano Amon)曾就如何將大模型裝入手機(jī)提供了深刻見解。他表示:“盡管大模型在訓(xùn)練和調(diào)優(yōu)上存在差異,其參數(shù)規(guī)模越大,通常意味著模型能力越強(qiáng)。”安蒙詳細(xì)說明了量化技術(shù)在優(yōu)化模型訓(xùn)練過程中的重要性,其不僅確保了減小模型參數(shù)時(shí)不會(huì)對準(zhǔn)確性產(chǎn)生顯著影響,還能實(shí)現(xiàn)模型計(jì)算的高效率。他進(jìn)一步解釋說:“我們的核心任務(wù)是實(shí)現(xiàn)模型的極致精簡,甚至是轉(zhuǎn)換浮點(diǎn)模型計(jì)算為更高效的低比特定點(diǎn)模型計(jì)算。”

受制于終端設(shè)備處理器算力、內(nèi)存和存儲(chǔ)容量及電池續(xù)航等各方面瓶頸,與云端動(dòng)輒成百上千億參數(shù)的大模型相比,端側(cè)大模型參數(shù)量目前堪堪觸及百億,差距一望而知。因此,業(yè)界多計(jì)劃采取端側(cè)大模型搭配云端大模型的混合式AI路線。

元智能聯(lián)合創(chuàng)始人羅璇認(rèn)為,未來半年到一年,手機(jī)端將能跑通140億及以下參數(shù)規(guī)模的大模型,PC端則有望容下600億參數(shù)的模型。在此情況下,云端與終端亦不會(huì)是割裂狀態(tài)。他說:“未來可能出現(xiàn)的情形是,手機(jī)上運(yùn)行一個(gè)140億參數(shù)的大模型作為OS(操作系統(tǒng))的‘發(fā)動(dòng)機(jī)’,而云端則運(yùn)行一個(gè)比GPT-4更大的模型,作為整個(gè)下一代互聯(lián)網(wǎng)的底座。這兩者將相互配合,如同當(dāng)前的本地軟件與互聯(lián)網(wǎng)。

手機(jī)廠商中,vivo采取了矩陣策略,其藍(lán)心大模型包含70億及以下參數(shù)的端側(cè)版本和700億、1300億、1750億參數(shù)的云端版本。vivo副總裁、vivo AI全球研究院院長周圍稱,雖然目前70億參數(shù)模型已能較好支持文檔摘要、拆解等功能,但要具備中臺(tái)級(jí)的上下文理解能力、接近類人思維能力的“智能涌現(xiàn)”——一個(gè)標(biāo)志性的500億參數(shù)門檻,還需要“再往上走走”。因此,130億參數(shù)大模型成為實(shí)現(xiàn)智能體的更好選擇。但截至目前,130億參數(shù)大模型的內(nèi)存占用已接近7GB,這幾乎是高端智能手機(jī)12GB內(nèi)存的一半。除去大模型占用后,就只剩下了類似中端手機(jī)的內(nèi)存性能。

相較于內(nèi)存占用,羅璇認(rèn)為,能耗是更大的瓶頸。他指出:“內(nèi)存是可以增加的,但電池容量的提升卻受限于電池密度的挑戰(zhàn)。”他認(rèn)為,當(dāng)前大多數(shù)大模型基于Transformer架構(gòu),其算法復(fù)雜度決定了性能和能耗難以平衡。

榮耀CEO趙明曾在與媒體交流中指出,端側(cè)大模型必然帶來更高的硬件需求。趙明透露,未來一段時(shí)間,手機(jī)廠商會(huì)宣傳端側(cè)大模型,但當(dāng)前在端側(cè)普遍使用的通常只是10億、20億參數(shù)規(guī)模的“小模型”。他進(jìn)一步表示,任何AI應(yīng)用,如果不能平衡用戶隱私、算力和低功耗,就無法提供更好的消費(fèi)者體驗(yàn)。

求解未來升級(jí)路線,欒劍認(rèn)為,解決方案首先包括增加內(nèi)存容量和帶寬,以便終端設(shè)備能夠承載更大的模型;其次是提升或優(yōu)化算力,更高效地支持大模型的網(wǎng)絡(luò)結(jié)構(gòu)與算子;此外,軟件層面上,持續(xù)探索模型的壓縮和量化,以及推理算法的改進(jìn),從而在保持同等效果的條件下降低算力需求。“更重要的是,端側(cè)大模型的發(fā)展將改變手機(jī)的使用方式,可能催生新的生態(tài)系統(tǒng),因此軟件架構(gòu)需要適時(shí)調(diào)整,以適應(yīng)新的需求。”他說。

■中國城市報(bào)記者 孫雪霏

本文來自【中國城市報(bào)】,僅代表作者觀點(diǎn)。全國黨媒信息公共平臺(tái)提供信息發(fā)布傳播服務(wù)。

相關(guān)推薦
免責(zé)聲明
本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。

熱門文章