首頁 > AI資訊 > 最新資訊 > 給機器人裝上大腦和眼睛!商湯推出新一代多模態大模型,賦能具身智能

給機器人裝上大腦和眼睛!商湯推出新一代多模態大模型,賦能具身智能

廣州日報    2025-04-17

  當你站在傅利葉通用人形機器人GRx面前時,它能夠精準識別眼前人所穿衣服的顏色,并判斷這種搭配是否協調;另一位具身智能機器人飛燕在現場跳舞,動作流暢絲滑......這些多模態能力來自商湯近期發布的新一代“日日新SenseNova V6”(以下簡稱:日日新V6)大模型。

  記者了解到,日日新V6大模型通過多模態長思維鏈訓練、全局記憶、強化學習的技術突破,形成領先的多模態推理能力,并突破成本邊界。在長思維鏈、推理、數理、全局記憶方面,日日新V6對標OpenAI o1,數據分析能力大幅領先GPT-4o,同時涵蓋國內首個支持10分鐘中長視頻深度解析的大模型,對標Gemini 2.5 Turbo達到同類型最強。商湯科技董事長兼首席執行官徐立表示:“AI之道,在于百姓之日用。商湯日日新V6將跨越多模態邊界,釋放推理與智能的無限可能。”

  大模型是本次發布的關鍵詞。多模態融合模型可增強感知能力,成為機器人的大腦和眼睛,像人一樣進行深入思考和自然表達,例如它可看懂人的手勢,回答人們對周圍環境及物品的提問,帶給我們更真實的互動體驗。

  具身智能將是商湯多模態推理模型的重要場景之一。記者注意到,本次商湯大裝置發布的具身智能端到端解決方案,聚焦行業數據成本高、工具鏈分散、模型泛化不足等痛點。方案覆蓋數據生產(仿真+真機采集)、工具支撐(集成300+場景數據類別與30+成熟行業模型)及模型研發全流程,支持10TB+/天數據匯聚。針對數據短缺,提供"仿真+真機"雙通道,真機采集可實現跨地域數采,并依托商湯全國AI云平臺實現分鐘級同步,結合智能分層存儲大幅降低成本。仿真端仿真數據端依托國產化高保真仿真平臺,通過遙操數據采集和環境變量增廣,生成海量標準化數據,可實現毫米級精度數據捕獲,支持50+設備并發,經云上渲染處理,生產效率提升10倍。

  商湯還展示了與伙伴基于大裝置SenseCore 2.0訓練的具身智能成果——AI超市"雙機協作"采購全流程,生動呈現了群體智能的落地應用。其全流程AI研發體系覆蓋從模型訓練到推理評測,通過端到端一站式平臺支持千機并行仿真訓練,實現復雜任務協同;結合彈性推理與仿真驗證,確保模型穩定高效。該方案兼具集群彈性調度與降本增效優勢,為具身智能提供從開發到驗證的完整閉環支持。

  例如,傅利葉GRx通用人形機器人與商湯日日新SenseNovaV6 Omni的合作,將傅利葉領先的機器人硬件本體技術與商湯多模態融合模型的強大深度思考能力相結合。SenseNova V6 Omni可對圖像、視頻、語音、文本等多種信息進行深度融合與推理,有效提升傅利葉GRx在復雜場景中的理解能力,包括精準的上下文語義分析、意圖推理及對人類情感的細致感知與回應。

  “從去年開始到今年,具身智能包括機器人領域的增量客戶明顯增多。選擇具身智能并不是我主動的選擇,更多的還是主要在服務科技創新的群體發現的。”商湯科技聯合創始人、大裝置事業群總裁楊帆接受采訪時透露。同時,他發現具身智能領域的場景客戶需求遠不止于獲取基礎設施。他們在訓練數據方面也面臨諸多挑戰。不過,商湯在過去的發展歷程中,積累了豐富的技術經驗,比如在3D場景重建以及自動駕駛領域,其曾面臨過類似的挑戰。雖然這些領域與機器人不同,但其具備相關的歷史平臺技術能力。通過針對性的改造和優化,他們可以將這些技術轉化為客戶服務的一部分。

  多模態AI的應用潛力大。根據中研普華產業研究院發布的《2025-2030年中國多模態AI行業市場深度調研與發展趨勢報告》顯示,中國多模態AI市場近年來呈現出快速增長的態勢。2024年,中國多模態AI市場規模已達到約150億元人民幣,同比增長約30%。預計未來幾年,隨著技術的不斷成熟與應用場景的拓展,中國多模態AI市場將繼續保持高速增長態勢,到2025年市場規模有望突破200億元人民幣大關。

  隨著技術的不斷進步和應用場景的拓展,市場競爭也將日益激烈。業內人士表示,如何持續保持技術創新,例如提高模型的泛化能力、確保數據的安全性與隱私性等,都是行業入局者需要關注的重點。

(文章來源:廣州日報)

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章