首頁 > AI資訊 > 最新資訊 > 解決百年數學難題谷歌智能體展示強大編程能力Agent最適配場景呼之欲出?

解決百年數學難題谷歌智能體展示強大編程能力Agent最適配場景呼之欲出?

科創板日報    2025-05-16

《科創板日報》5月15日訊 今日凌晨,谷歌Deepmind在官網發布了AI Agent工具AlphaEvolve,基于Gemini 2.0大語言模型,自動化算法發現過程,解決傳統算法設計和科學發現中依賴專家直覺和手動迭代的局限性。

值得一提的是,這款智能體是被專門用于設計高級算法的編程AI Agent,其能夠衡量大模型生成想法與算法的可行性并加以篩選。在性能測試下,AlphaEvolve將大規模矩陣乘法運算拆解為更易于處理的子問題,使Gemini模型架構中的核心計算效率提升了23%,節省了大量成本。

為展示AlphaEvolve的能力,谷歌試圖令其解決數學難題——親吻數問題。這道題的歷史最早可以追溯到1694年,牛頓還和別人辯論、研究過。其難點在于給定維度的空間中,最多可以有多少個相同大小的球體同時接觸一個中心球體,這些球體之間不發生重疊。

結果是,AlphaEvolve發現了由593個外層球體組成的結構型,并在11維空間中建立了新的下界,超越了之前數學家們創造的紀錄。

事實上,近期各個科技巨頭在AI編程等軟件開發領域的商業化動作頻頻。同樣在今日凌晨,OpenAI宣布,應廣大用戶的要求,專攻編碼任務和指令遵循的專用模型GPT-4.1即日起將直接在ChatGPT中提供。

據介紹,在基準測試中,GPT4.1在編程能力方面獲得54.6%的成績,較GPT4o提高了21.4個百分點,較GPT4.5提高了26.6個百分點,成為當前領先的編程模型之一。與此同時,GPT-4.1在小模型和驅動智能體方面表現突出,可廣泛應用于真實世界的軟件工程、大規模文檔洞察提取等復雜任務,且無需過多人工干預。

國內方面,阿里云通義靈碼AI程序員已全面上線,開發效率提升數十倍,已在哈啰集團、長安汽車等公司被應用。騰訊云AI代碼助手已接入DeepSeek-R1,代碼生成準確率提升30%。

有券商指出,2025年將是AI Agent元年,也是軟件大革命的起點。編程領域的規則明確性為Agent應用提供了天然約束框架,編程環境的技術特性為Agent自糾錯提供了理想試驗場,同時編程原子化任務與大模型鏈式推理機制深度契合。

西部證券表示,AI大模型在編程中的應用發展分為三個階段,目前各大廠商產品多處于第一階段向第二階段邁進的關鍵節點:

大模型作為Copilot,輔助程序員完成任務,但并不改變軟件工程的專業分工。

Agent能夠自主完成一部分任務,成為一個單一職能專家,能夠自主使用工具完成預定的任務。人在這個階段的作用是給定上下文完成知識對齊。

多智能體互相協作完成復雜任務,人類則負責創意、糾偏和確認的工作。

從投資層面來看,該機構認為,國內軟件目前估值水平普遍較低,存在顯著修復空間。類似“云化”,當前國內軟件公司的估值修復可基于“AI化”程度,AI化程度越高即AI收入越高時,估值越高。

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章