首頁 > AI資訊 > 最新資訊 > 階躍星辰CEO姜大昕:多模態(tài)是實(shí)現(xiàn)AGI的必經(jīng)之路

階躍星辰CEO姜大昕:多模態(tài)是實(shí)現(xiàn)AGI的必經(jīng)之路

科創(chuàng)板日?qǐng)?bào)    2025-05-10

《科創(chuàng)板日?qǐng)?bào)》5月9日訊(記者 張洋洋)“我認(rèn)同‘多模態(tài)卷王’這個(gè)名字,我們的多模態(tài)布局是非常完整的,有視頻、圖像、音樂、語音,有多條線,每條戰(zhàn)線都是經(jīng)過了幾個(gè)月或者是半年的積累才出來一個(gè)新的迭代?!?/p>

今日,在一場(chǎng)小范圍的媒體采訪當(dāng)中,當(dāng)被問及如何平衡模型的性能與迭代頻率時(shí),階躍星辰CEO姜大昕做出如是解答。

在AI大模型“六小虎”當(dāng)中,階躍星辰一直是以多模態(tài)特色著稱。成立2年累計(jì)發(fā)布22款自研基座模型,研發(fā)保持月更速度,幾乎平均每個(gè)月都會(huì)發(fā)布一款基礎(chǔ)大模型。也因此,這家公司被業(yè)內(nèi)戲稱為“多模態(tài)卷王”。

多模態(tài)的一大難點(diǎn)是融合過程中不能損失單個(gè)模態(tài)的性能,尤其是不能降智。在姜大昕看來,階躍采用原生多模的方式,在多模融合技術(shù)上有自己的經(jīng)驗(yàn)和認(rèn)知。

目前,階躍星辰的模型覆蓋文字、語音、圖像、視頻、音樂、推理等全系列,其中,16款是多模態(tài)模型,占比超7成。多模態(tài)模型矩陣覆蓋圖像理解、視頻理解、圖像生成視頻生成、圖像編輯、音樂生成,多模態(tài)推理全系列。

▍“多模態(tài)是實(shí)現(xiàn)AGI的必經(jīng)之路”

之所以堅(jiān)持多模態(tài)的道路并且全線布局,姜大昕認(rèn)為是AGI初心使然,多模態(tài)是實(shí)現(xiàn)AGI的必經(jīng)之路。

在接受《科創(chuàng)板日?qǐng)?bào)》等媒體采訪時(shí),他表示,AGI 對(duì)標(biāo)的是人類的智能,人的智能是多元化的,每個(gè)人除了有來自語言的符號(hào)智能,還包括視覺智能、空間智能和運(yùn)動(dòng)智能等等,這些智能是需要通過視覺和其他模態(tài)來進(jìn)行學(xué)習(xí)的。在多模態(tài)領(lǐng)域任何一個(gè)方向出現(xiàn)短板,都會(huì)延緩實(shí)現(xiàn) AGI 的進(jìn)程。

除了AGI本身的標(biāo)準(zhǔn)和定義,如果從應(yīng)用的角度來看,不管是做垂直領(lǐng)域的應(yīng)用還是做C端的應(yīng)用,多模態(tài)都是必不可少的。用戶是需要AI能聽、能看、能說,這樣AI才能更好地理解用戶所處的環(huán)境,并且和用戶進(jìn)行更為自然的交流。

“目前的大模型公司有能力去全面自研預(yù)訓(xùn)練模型,并構(gòu)成這樣一個(gè)模型矩陣的,即使是大公司也不多,更不用說是初創(chuàng)公司了,這是階躍星辰的一個(gè)特色,也是我們的一個(gè)優(yōu)勢(shì)?!苯箨空f。

當(dāng)下,階躍星辰的多模態(tài)模型商業(yè)應(yīng)用也正在快速落地。大量頭部企業(yè)及大量AI應(yīng)用開發(fā)者正在接入其多模態(tài)模型,調(diào)用量持續(xù)快速增長(zhǎng)。據(jù)開發(fā)者反饋,階躍多模態(tài)模型用戶付費(fèi)率最高。

以頭部茶飲品牌茶百道為例,其已與階躍星辰達(dá)成深度合作,通過后者多模態(tài)技術(shù),探索大模型技術(shù)在茶飲行業(yè)的應(yīng)用,進(jìn)行智能巡檢、AIGC營(yíng)銷,打造新型數(shù)字化門店生產(chǎn)運(yùn)營(yíng)方式,為用戶帶來更加安全、便捷和豐富的消費(fèi)體驗(yàn)。目前全國(guó)數(shù)千家茶百道門店已經(jīng)接入階躍星辰Step-1V多模態(tài)理解大模型,平均每天上百萬杯茶飲在大模型智能巡檢的守護(hù)下送到消費(fèi)者手中。

網(wǎng)紅AI應(yīng)用“胃之書”也基于階躍星辰多模態(tài)能力,幫助用戶以更快捷有趣的方式記錄飲食,開發(fā)者趙純想公開表示曾對(duì)國(guó)內(nèi)大部分模型做過AB測(cè)試,最終發(fā)現(xiàn)階躍星辰多模態(tài)模型用戶付費(fèi)率最高。

▍發(fā)力智能終端Agent

眼下,隨著大模型市場(chǎng)格局暫時(shí)進(jìn)入穩(wěn)定階段,AI廠商漸漸找到適合各自的路線深耕。階躍星辰也將重心放在了Agent方向,充分發(fā)揮多模態(tài)基礎(chǔ)大模型優(yōu)勢(shì),發(fā)力智能終端Agent。

為什么會(huì)選擇智能終端Agent作為發(fā)力方向?姜大昕告訴《科創(chuàng)板日?qǐng)?bào)》記者,其實(shí)很多的終端是用戶的感知和體驗(yàn)的延伸,Agent能去理解用戶所處的環(huán)境和任務(wù)的上下文,更好地幫助人類去完成任務(wù)。階躍在其中扮演的角色就是提供一個(gè)平臺(tái),能夠圍繞著這樣平臺(tái)去構(gòu)建智能終端Agent生態(tài)。

在智能終端上,階躍星辰也選取了幾個(gè)重要的終端——手機(jī)、車、具身智能和IoT,目前已經(jīng)與各個(gè)方向的頭部企業(yè)展開了深度的合作。

面向智能汽車,階躍星辰與吉利汽車集團(tuán)、千里科技深化技術(shù)合作,進(jìn)一步加強(qiáng)技術(shù)合作伙伴關(guān)系,共同推動(dòng)“AI+車”的深度融合。

面向手機(jī)終端,階躍星辰與OPPO等手機(jī)廠商深度共建,將Agent技術(shù)深度集成到手機(jī)中,共同打造更好的交互體驗(yàn)?;陔A躍星辰多模態(tài)技術(shù),OPPO先后推出了“一鍵問屏”、“一鍵全能搜”功能,應(yīng)用在Find X8、Find N5等旗艦機(jī)型中。

面向具身智能,階躍星辰與智元機(jī)器人、原力靈機(jī)達(dá)成戰(zhàn)略合作,共同探索AI+具身機(jī)器人應(yīng)用場(chǎng)景;面向IoT終端,階躍星辰通過生態(tài)開放的方式,與包括TCL在內(nèi)的一系列IoT平臺(tái)和設(shè)備廠商緊密協(xié)作,推動(dòng)設(shè)備間的智能化升級(jí)和體驗(yàn)的無縫連接。

截至目前,在階躍星辰多模態(tài)技術(shù)的支持下,數(shù)百萬部手機(jī)用戶獲得了全新的AI服務(wù)體驗(yàn)。

“大模型領(lǐng)域發(fā)展非常快,在你追我趕、輪番發(fā)布的背后,我們其實(shí)可以感受到一個(gè)趨勢(shì),就是‘追求智能的上限’,我們認(rèn)為追求智能的上限仍然是當(dāng)下最重要的一件事。”姜大昕說,階躍星辰目前的狀態(tài)是堅(jiān)持基礎(chǔ)大模型的研發(fā),追求AGI是公司的初心,這一點(diǎn)不會(huì)改變。

姜大昕認(rèn)為,在當(dāng)前的競(jìng)爭(zhēng)格局中,階躍星辰差異化的特點(diǎn)就是多模態(tài)的能力,不僅眼下很多模態(tài)在業(yè)界的性能是領(lǐng)先的,而且也在積極地探索前沿的方向,這里還存在著非常巨大的機(jī)會(huì)。在應(yīng)用的層面,階躍星辰也走了一條差異化的路線,攜手合作伙伴在智能終端Agent這個(gè)方向上發(fā)力,最終形成一個(gè)從模型到Agent,從云側(cè)到端側(cè)的生態(tài)體系。

相關(guān)推薦
免責(zé)聲明
本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。

熱門文章