首頁(yè) > AI資訊 > 行業(yè)動(dòng)態(tài) > 百度文小言升級(jí):支持多模型調(diào)度、全新語(yǔ)音大模型、圖片問(wèn)答

百度文小言升級(jí):支持多模型調(diào)度、全新語(yǔ)音大模型、圖片問(wèn)答

新火種    2025-05-23

3月31日,文小言宣布完成功能升級(jí),支持多模型融合調(diào)度,升級(jí)全新語(yǔ)音大模型、圖片問(wèn)答、AI生圖生視頻等多項(xiàng)能力。

文小言此次升級(jí)的核心亮點(diǎn)在于“多模型融合調(diào)度”。通過(guò)整合百度自研的文心X1、文心4.5等頂尖模型,并接入DeepSeek-R1、可靈等第三方優(yōu)質(zhì)模型,文小言實(shí)現(xiàn)了多模型間的智能協(xié)同。用戶(hù)只需選擇“自動(dòng)模式”,即可一鍵調(diào)用最優(yōu)模型組合,或根據(jù)需求靈活選擇單一模型完成特定任務(wù),大幅提升響應(yīng)速度與任務(wù)處理能力。

以“設(shè)計(jì)三種風(fēng)格的南偏東客廳效果圖”為例,文小言能夠精準(zhǔn)解析裝修風(fēng)格差異,調(diào)用文心X1完成深度推理,生成三幅風(fēng)格迥異但視角一致的裝修效果圖;隨手拍攝一張茅臺(tái)鎮(zhèn)的照片,文小言就可以調(diào)用文心4.5的多模態(tài)分析能力,精準(zhǔn)識(shí)別出地理位置、當(dāng)?shù)禺a(chǎn)業(yè)、建筑風(fēng)格等詳細(xì)信息。

全新語(yǔ)音大模型支持方言對(duì)話(huà)、復(fù)雜知識(shí)問(wèn)答及隨時(shí)打斷等場(chǎng)景,用戶(hù)可進(jìn)行語(yǔ)音知識(shí)問(wèn)答或趣味角色扮演。百度語(yǔ)音首席架構(gòu)師賈磊透露,該模型是百度在業(yè)界首個(gè)推出、基于全新互相關(guān)注意力的端到端語(yǔ)音語(yǔ)言大模型。在語(yǔ)音場(chǎng)景滿(mǎn)足一定交互指標(biāo)下,大模型調(diào)用成本比行業(yè)平均降低50%-90%。

圖片問(wèn)答功能讓用戶(hù)可以通過(guò)拍攝或上傳圖片,以文字或語(yǔ)音提問(wèn)直接獲取深度解析。例如,拍攝一道數(shù)學(xué)題可實(shí)時(shí)生成解題思路與視頻解析;上傳多款商品圖可對(duì)比參數(shù)、價(jià)格,輔助購(gòu)物決策;拍攝杯子設(shè)計(jì)圖后,AI可自動(dòng)解析風(fēng)格并生成同款手機(jī)殼、支架等周邊產(chǎn)品。

值得一提的是,新增的“圖個(gè)冷知識(shí)”功能更富趣味性,用戶(hù)可預(yù)設(shè)“歷史學(xué)者”“科技達(dá)人”等人設(shè)視角,為同一圖片賦予多維解讀。例如,當(dāng)用戶(hù)詢(xún)問(wèn)“貓窗探秘,為何貓愛(ài)窗邊的科學(xué)真相?",文小言能從狩獵本能、能量獲取、領(lǐng)地意識(shí)等角度給出獨(dú)特解讀。

文/北京青年報(bào)記者 溫婧

編輯/樊宏偉

相關(guān)推薦
免責(zé)聲明
本文所包含的觀(guān)點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀(guān)點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴(lài)本文觀(guān)點(diǎn)而產(chǎn)生的任何金錢(qián)損失負(fù)任何責(zé)任。

熱門(mén)文章