首頁 > AI資訊 > 最新資訊 > AI早知道|ChatGPT免費開放高級語音模式;B站推出IndexTTS文本轉語音模型

AI早知道|ChatGPT免費開放高級語音模式;B站推出IndexTTS文本轉語音模型

新火種    2025-04-08

1.字節跳動與中國和新加坡大學研究團隊聯合推出的PhotoDoodle,利用Flux.1模型重新定義圖像創作。該系統通過少量樣本學習藝術風格,精準執行編輯指令,極大地提高了創意表達的可能性。

2.B站推出的IndexTTS模型是基于XTTS和Tortoise的GPT風格文本轉語音系統,具備獨特的拼音糾正漢字發音能力和精準的停頓控制。

3.微軟開源了名為“Magma”的多模態AI Agent基礎模型。Magma能夠跨越數字和物理世界,處理圖像、視頻和文本等多種數據類型,并具備心理預測功能,能夠更準確地理解人物或物體的意圖。

4.ChatGPT的高級語音模式正式向用戶免費開放。該模式基于GPT-4o mini模型,通過優化計算效率,性能已接近完整版GPT-4o。

5.DeepSeek在開源周最后一天發布了Fire-flyer File system(3Fs)和Smallpond數據處理框架。3FS是一種高性能并行文件系統,專為AI訓練和推理設計,支持大規模集群的高吞吐量數據訪問,峰值讀取吞吐量達6.6 TiB/s。Smallpond基于3FS和DuckDB構建,支持高效數據處理,可擴展至PB級數據集。

6.ElevenLabs 最近推出了其最新的語音轉文本模型 Scribe v1,聲稱在多種語言中達到了最高的準確性。該模型支持99種語言,能夠在復雜音頻環境中準確區分多達32位不同說話者。

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章