首頁 > AI資訊 > 行業動態 > 國內首個!商湯科技發布“日日新5o”,實時多模態流式交互對標GPT-4o

國內首個!商湯科技發布“日日新5o”,實時多模態流式交互對標GPT-4o

新火種    2024-08-22

2024年7月5日,上海——2024世界人工智能大會暨人工智能全球治理高級別會議(WAIC 2024)戰略合作伙伴商湯科技召開“大愛無疆·向新力”人工智能論壇,發布國內首個所見即所得模型“日日新5o”,交互體驗對標GPT-4o,實現全新AI交互模式。

通過整合跨模態信息,基于聲音、文本、圖像和視頻等多種形式,國內首個所見即所得模型“日日新5o”帶來一種全新的AI交互模式,即實時的流式多模態交互。現場也為大家展示了這種創新交互模式——

工作人員剛開始僅是和“日日新5o”打個招呼,它就自動識別出工作人員脖子佩戴的胸卡帶子上的字眼,判斷出現場就是世界人工智能大會會場,并表示在這個地方可以“好好學習”。

國內首個!商湯科技發布“日日新5o”,實時多模態流式交互對標GPT-4o

接下來工作人員拿了一只可愛小狗玩偶,“日日新5o”準確描述了小狗的外貌、表情以及重要穿戴——一個帶著印有商湯科技logo白帽子,很給主場人排面。

國內首個!商湯科技發布“日日新5o”,實時多模態流式交互對標GPT-4o

再上些難度,隨便翻開一本書的任何一頁,“日日新5o”都能自動介紹,不是簡單的OCR識別文字,而是識別圖文給出好理解的總結,這一切在瞬間即可完成,真正做到實時交互。

國內首個!商湯科技發布“日日新5o”,實時多模態流式交互對標GPT-4o

工作人員還現場發揮了“畫功”,隨手畫了一只簡筆畫小兔子,“日日新5o”直呼畫得可愛,而后工作人員又畫了一個微笑表情,它從這個平靜的表情中捕捉到了笑意,工作人員又改了一筆把嘴巴畫大增添了舌頭,“日日新5o”看到后立馬說道這表情開心多了。

能聽會看更會找話題,就如同真人聊天一般的交流對話,這種交互模式特別適用于實時對話和語音識別等應用,其多任務適應性強,能夠在同一模型中自然處理多種任務,且根據不同上下文自適應調整行為和輸出,能夠實現對標GPT-4o的交互體驗正是源于“日日新5.5”基礎模型能力的全面提升。

今年4月發布的“日日新5.0”是國內首個對標GPT-4 Turbo的國產大模型,短短兩個多月時間,全新“日日新5.5”體系迎來多項升級,綜合性能較“日日新5.0”平均提升30%,在數學推理、英文能力和指令跟隨等能力明顯增強,交互效果和多項核心指標實現對標GPT-4o。

國內首個!商湯科技發布“日日新5o”,實時多模態流式交互對標GPT-4o

“日日新5.5”采用混合端云協同專家架構,最大限度發揮云邊端協同,降低推理成本,模型訓練基于超過10TB tokens高質量訓練數據,包括大量合成的思維鏈數據,提升推理思維能力。

國內首個!商湯科技發布“日日新5o”,實時多模態流式交互對標GPT-4o

為了讓更多企業用戶低門檻接入并使用“日日新”大模型體系的強大能力,商湯于近期推出了“大模型0元Go”計劃。凡是“日日新”的新注冊用戶,都可獲得涉及調用、遷徙、訓練等多項免費服務大禮包。同時,商湯還將免費贈送5000萬Tokens包,并且派出專屬搬家顧問,幫助OpenAI用戶實現零服務成本遷移。

國內首個!商湯科技發布“日日新5o”,實時多模態流式交互對標GPT-4o

Tags:
相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章