蘋果開發出新款AI:可看懂屏幕內容并語音回復
4月2日消息,據媒體報道,蘋果公司近日宣布,成功研發出一款前沿的人工智能系統——ReALM(Reference Resolution As Language Modeling,即基于語言建模的參考解析)。
據悉,該系統具備卓越能力,能夠精準解析屏幕上模糊的內容,同時深入理解相關對話及背景環境,從而為用戶提供更為自然流暢的語音助手交互體驗。
ReALM系統通過運用大語言模型技術,巧妙地將識別屏幕視覺元素這一復雜任務轉化為純語言處理問題。這一創新轉換使得ReALM在性能上相較于傳統技術實現了質的飛躍。
值得一提的是,ReALM的獨特之處在于其能夠重新構建屏幕內容。通過深入分析屏幕上的信息及其位置分布,系統能夠生成精準的文本表示,這對于捕捉視覺布局中的關鍵信息至關重要。
研究人員進一步展示了將ReALM與專門針對內容指向優化的語言模型相結合的方法,結果顯示在執行相關任務時,ReALM的性能已超越業界翹楚GPT-4。
研究人員興奮地表示:“我們對現有系統進行了深度優化和顯著改進,使其在處理各種類型的內容指向任務時均表現出卓越性能。即便是我們的最小模型,也實現了超過5%的性能提升;而大型模型的表現更是顯著超越GPT-4,令人矚目?!?/p>
長期以來,蘋果在創新領域更多扮演跟隨者的角色,然而隨著人工智能技術的迅猛發展,市場格局正發生深刻變革。如今,蘋果正積極迎接挑戰,努力在人工智能領域占據一席之地。
此外,備受矚目的全球開發者大會即將在6月盛大召開。屆時,蘋果預計將推出一系列創新成果,包括全新大語言模型框架、“Apple GPT”聊天機器人及其生態系統中的其他AI功能。
相關推薦
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。