財通證券:計算機行業“AI操作系統”時代已至
財中社12月2日電財通證券發布計算機行業專題報告,AI+OS,操作系統級Agent開啟人機交互革命。AI賦能OS,操作系統級Agent由于其C端入口特性,有望成為首個“爆款”AI應用。當前市場中長期缺乏“爆款”AI應用,認為主要系C端大眾對AI的感知度仍然較低,盡管有大量可下載、可付費的AI應用存在,但從廣大用戶體驗來講,各類AI軟件對其生活重塑的邊際變化不大。而近期,包括手機端蘋果、榮耀、Vivo等,以及PC端聯想等廠商上新操作系統級Agent作為新的人機交互形態,以端側入口形式首次深入群眾,令其“被迫”體驗接受新的操作范式,有望打造首個“爆款”AI應用,由此將帶動AI端側硬件需求涌現,以及刺激軟件內部AI功能快速迭代。
建立交互數據集,深耕Post-Training,獲得“從Chat走向Act”通用Agent能力。智譜的Agent能力主要來源于其底層大模型的訓練與迭代:CogAgent是18B參數的視覺語言模型(VLM),專門用于GUI理解和導航,基于視覺語言模型CogVLM并結合高分辨率交叉模塊,實現了高效GUI推理;AutoWebGLM通過簡化HTML增強網頁閱讀能力,添加人類與AI混合方法構建的網絡瀏覽數據集進行微調,大幅提升大語言模型的Agent能力;AutoGLM實現圖形用戶界面的自主基礎Agent,可用于網頁瀏覽與安卓手機操作,與人類表現差距進一步縮小。認為,智譜克服了當前Agent訓練的堵點,通過建立網頁瀏覽交互數據集,以及在強化學習、微調階段進行算法創新,實現了在大語言模型上操作系統級Agent突破。
GLM多端Agent家族,打造手機、PC、汽車等終端交互入口。GLM-Phone可實現跨APP操作、支持超長任務流程、支持更多主流APP,針對手機端應用提供了新的解決方案,顯著擴展了其在手機端的應用場景和操作能力;GLM-PC使得辦公領域將迎來生產力躍升,GLM-PC可實現會議替身、文檔處理、網頁搜索與總結、遠程和定時操作等;GLM-Car&More方面,Agent為AI終極形態,加速萬物智能、萬物互聯,未來Agent有望滲透至各類智能設備,落地AI原生設備,實現設備主動服務用戶。
(文章來源:財中社)
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。