“大模型六虎”階躍星辰3月將開源圖生視頻模型,并成立新的生態(tài)基金|鈦媒體AGI
階躍星辰創(chuàng)始人、CEO姜大昕
DeepSeek熱潮下,“大模型六虎”們逐步開始“分化”,更多轉(zhuǎn)向產(chǎn)業(yè)界和落地商業(yè)化階段。
鈦媒體AGI 2月21日消息,今天舉行的首屆Step UP生態(tài)開放日上,AI“大模型六虎”之一的階躍星辰公布開源大模型、Agent智能體進展和全新的開源推理和視頻推理模型等。
階躍星辰創(chuàng)始人、CEO姜大昕在演講中表示,公司朝著實現(xiàn)AGI的目標穩(wěn)步前進,目前已進入Agent(智能體)的發(fā)展階段。他指出,智能體的發(fā)展依賴于兩大關(guān)鍵要素:一是多模態(tài)能力,讓智能體充分地感知和理解世界;二是推理能力,使智能體能夠進行長思維鏈的慢思考,主動規(guī)劃、嘗試、反思,通過不斷糾錯提供準確的答案。
同時,姜大昕透露,今年3月,階躍星辰將開源新的圖生視頻模型。此外,階躍星辰還發(fā)布全新升級的“繁星計劃”2.0,其中包括與國有企業(yè)上海儀電、上海國有資本投資有限公司、徐匯資本等籌集一個階躍星辰生態(tài)基金,但未透露具體金額,但該項計劃旨在為Agent應(yīng)用開發(fā)者提供模型、算力、資本、數(shù)據(jù)和企業(yè)孵化等全方位支持,并將聯(lián)合模速空間為優(yōu)質(zhì)創(chuàng)業(yè)項目提供辦公場地支持,在上海打造大模型產(chǎn)業(yè)聚集效應(yīng)。
據(jù)悉,階躍星辰成立于2023年4月,由微軟前全球副總裁姜大昕創(chuàng)辦,ResNet作者之一的AI科學(xué)家張祥雨、擁有豐富大規(guī)模集群與系統(tǒng)建設(shè)經(jīng)驗的AI系統(tǒng)專家朱亦博等都先后加入階躍星辰,主要瞄準AGI。
2024年12月,階躍星辰宣布完成B輪融資,總?cè)谫Y金額達數(shù)億美元,核心投資方包括上海國有資本投資有限公司及其旗下基金,戰(zhàn)略和財務(wù)投資人包括騰訊投資、五源資本、啟明創(chuàng)投等。
過去一年,階躍星辰共發(fā)布11款多模態(tài)大模型,覆蓋語音識別、語音生成、多模態(tài)理解、圖像及視頻生成的全面能力。今年1月,階躍星辰發(fā)布了 Step R-mini,成為Step系列的首款推理模型,進一步拓展了大模型的能力邊界。
階躍星辰近期持續(xù)發(fā)力開源,已陸續(xù)開源兩款模型——300億參數(shù)的圖生視頻模型Step-Video-T2V,以及1300億參數(shù)的語音模型Step-Audio。此外,就在2月18日,階躍星辰與清華大學(xué)聯(lián)合開源了大規(guī)模強化學(xué)習(xí)RL的推理模型Open-Reasoner-Zero,擁有7B、32B版本。其中,32B版表現(xiàn)優(yōu)于DeepSeek-R1-Zero-Qwen-32B,訓(xùn)練步驟減少到原有1/30,效率提升了25倍。
對于開源的原因,姜大昕表示,在DeepSeek感召下,階躍星辰在多模態(tài)領(lǐng)域有個深厚的積累,也創(chuàng)建了強大的模型,開發(fā)者也熱切的盼望在多模態(tài)領(lǐng)域是否也能夠出現(xiàn)非常強大的多模態(tài)模型,因此,階躍星辰選擇在近期發(fā)布開源多模態(tài)模型技術(shù)。
“多模理解持續(xù)領(lǐng)先,多模推理率先探索。”顯然,從訓(xùn)練轉(zhuǎn)移到推理,多模態(tài)會成為主流的需求。
姜大昕還透露了階躍星辰未來兩個重點關(guān)注的方向:多模態(tài)推理以及Agent智能體技術(shù),以實現(xiàn)階躍星辰AGI的技術(shù)路線“單模態(tài)—多模態(tài)—多模理解和生成的統(tǒng)一—世界模型—AGI”。
其中,在多模態(tài)推理,階躍星辰正在進行“視覺推理模型”研發(fā),他提到,這一模型能夠?qū)崿F(xiàn)視覺空間下的慢思考。
“模擬世界這個階段,訓(xùn)練模型的主要范式是模仿學(xué)習(xí),而學(xué)習(xí)的主要目標是各種模態(tài)的表征,包括從聲音、文本、圖像、視頻一直到4D時空的物理世界。對于復(fù)雜問題的求解,人腦是啟動了一套‘第二系統(tǒng)’,或者就是說慢思考的能力。在每個步驟,如果我們發(fā)現(xiàn)開始的思路不對,可能還會重新設(shè)想我們的思路,不斷探索,直到解決成功為止。”姜大昕稱。
Agent層面,階躍星辰將智能終端Agent視為大模型技術(shù)落地的核心突破點,在姜大昕看來,影響Agent的兩個關(guān)鍵因素,多模態(tài)和慢思考在2024年都有了顯著的進展。因此,階躍星辰重點布局垂類Agent(企業(yè)和開發(fā)者)、智能終端Agent(汽車、手機、具身智能、IoT)智能體落地,包括與吉利汽車集團、千里科技、OPPO、智元機器人、TCL等企業(yè)展開合作,共同打造垂直場景下的創(chuàng)新C端應(yīng)用體驗。
“那么所謂主動就是Agent,能夠主動的觀察用戶所處周圍的環(huán)境,或者說他周圍的context是主動的發(fā)起或者完成任務(wù),而不是僅僅被動的接受任務(wù)。大家要想能夠自主完成復(fù)雜任務(wù),這個目標還需要一些輔助的功能。”姜大昕表示,隨著底座大模型能力的不斷增強,Agent能力還會不斷進化,會經(jīng)歷五個階段。最終,Level 5從智商上升到了情商。
此外,值得一提的是,“AI四小龍”(商湯、曠視、依圖、云從)之一的曠視科技聯(lián)合創(chuàng)始人印奇,帶著新身份“千里科技董事長”,與吉利汽車集團副總裁、吉利汽車研究院院長李傳海,一同出現(xiàn)在生態(tài)日圓桌論壇上。
這是印奇首次亮相。
據(jù)悉,2月18日,力帆科技正式更名為千里科技(SH:601777,前稱為力帆股份),而蛻變升級而來的全新品牌將聚焦“AI+車”的核心戰(zhàn)略,以科技創(chuàng)新為核心競爭力,創(chuàng)新產(chǎn)業(yè)發(fā)展模式,全面增進自動駕駛、智能座艙等領(lǐng)域的研發(fā)實力。而印奇是千里科技的股東、公司董事長,吉利產(chǎn)投也是千里科技股東之一。
AI一日,世上一年,現(xiàn)在千里,一日千里。印奇表示,目前最成功的AI產(chǎn)品,仍然是特斯拉和抖音,不過,大模型也將給應(yīng)用帶來更大的市場空間。
鈦媒體AGI整理了印奇首次亮相的現(xiàn)場提到的重要信息:
印奇認為身份沒有變化,一直還是AI創(chuàng)業(yè),他認為AGI、機器人(robotic)在過去創(chuàng)業(yè)歷程中是非常重要的兩個方向。
印奇稱,一個產(chǎn)業(yè)的發(fā)展方向和節(jié)奏,有可能節(jié)奏比方向更重要。因為在中國創(chuàng)業(yè),大家經(jīng)歷了十幾年,出現(xiàn)一輪又一輪的AI創(chuàng)業(yè)者,每個領(lǐng)域技術(shù)發(fā)展一直往前,而商業(yè)模式也有很多變化。因此,我們需要在技術(shù)成熟之后,同時找到一個最核心的載體,而新一輪大模型時代有可能是AI創(chuàng)業(yè)者最幸福的時代,技術(shù)上AGI載體有可能是車,這是面向“具身智能”的必要路徑。
今天沒有真正的AI+的核心應(yīng)用場景出來。過去十年,+AI的兩個最重要的成功案例,一個是特斯拉,一個可能是抖音,一個是線下一個是線上,這些都是原有產(chǎn)業(yè)的領(lǐng)軍者,用AI給產(chǎn)業(yè)做的巨大賦能。但是,AI+的概念是,用AI大模型時代做全新的應(yīng)用,且它AI比重超過50%,創(chuàng)造的是10倍的價值,這樣應(yīng)用至今還沒有出現(xiàn)。而我相信,未來的AI+車,有可能是第一個落地的場景。
關(guān)于智能駕駛和智能駕艙:智駕領(lǐng)域,我自己的判斷,未來3年應(yīng)該是收斂期,L3、L4逐步的去推廣化,這是整個車生態(tài)化智能化的開端,甚至這可能是“第一季剛打完”,只有當這個車能自動行駛,可能是給車后面的大眾化和像人化提供基礎(chǔ)。這是大模型在車上的Agent應(yīng)用有潛力和有希望的一個點。
千里科技的核心定位是“AI+車”,主要構(gòu)建AI原生以及軟硬結(jié)合,希望基于吉利汽車服務(wù)好吉利生態(tài),利用好階躍大模型的能力,需要有一個整體解決方案的供應(yīng)商,真正把技術(shù)、產(chǎn)品、軟硬件結(jié)合在一起。
談DeepSeek:春節(jié)很熱鬧,我認為所有的產(chǎn)業(yè)發(fā)展都是連續(xù)的,DeepSeek是非常優(yōu)秀的中國開源模型嗲表,而中國AI發(fā)展是連續(xù)的過程,也是厚積薄發(fā)的過程。
當前發(fā)展中,最重要的是Agent和終端的關(guān)系,隨著Agent到來,我聽到的“把終端做三個分類”這一觀點:我、你、他。其中,“我”這種類型的硬件是手機為代表的,眼鏡、耳機都是器官的延伸,一類大的硬件;第二是“你”類硬件,汽車、未來的具身智能;第三是“他”類硬件,當年小米生態(tài)IoT之類。
因此,Agent最重要的兩個硬件就是手機和車。未來,和Agent結(jié)合的切口和爆發(fā)點有不一樣的點在于,Agent能讓終端跨過細分應(yīng)用,變成直接給用戶提供服務(wù)。大家可以設(shè)想,偏效率和工具的應(yīng)用如果有一個更好的生態(tài),對用戶來講是越來越無感的,每個硬件能夠幫用戶觸達,幫他解決一些物理的執(zhí)行,那么用戶真不在乎服務(wù)的提供商是誰,需要的是可靠的,高性能低價格的服務(wù),硬件會變得史無前例的重要,當年我們覺得手機很重要,但是未來終端會更重要。而看整個產(chǎn)業(yè)鏈,其實終端并沒有發(fā)揮最大的商業(yè)價值,而移動互聯(lián)網(wǎng)做了大量的價值分享,我認為,和好的終端構(gòu)建更親密、戰(zhàn)略關(guān)系,以及將終端利益的新價值分配,匹配大模型時代,可能是未來三年比較重要的話題。
現(xiàn)在,差異化變得重要,AI 和硬件都沒有卷到第一,但是做“組合拳”,將真正在AI閉環(huán)上走通價值鏈條。
隨著Agent擁有情感化,人和車的關(guān)系將會重構(gòu)。如果5年后,使用車的時長平均超過3小時,那么車的屬性可能就變了,可能就不僅是交通工具,它會變成一個“第三空間”,因此,車就會變成繼手機之后另外一個“大腦”,把“駕駛角色+空間角色+機器人陪伴角色”等三種角色融合到一起。
此次開放日上,吉利汽車集團、千里科技和階躍星辰聯(lián)合宣布,將進一步加強三方現(xiàn)有技術(shù)合作伙伴關(guān)系,推動“AI+車”的深度融合。
“我覺得,聊天機器人現(xiàn)在和人類連接還是非常膚淺的,因為聊天機器人只能通過聊天內(nèi)容來知道用戶情況,而人類是可以陪伴在用戶的左右,Agent產(chǎn)品需要真正的做到感同身受,從而提供情緒價值。”姜大昕在演講結(jié)尾表示。
(作者|林志佳)
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內(nèi)容相關(guān)的任何行動之前,請務(wù)必進行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產(chǎn)生的任何金錢損失負任何責任。