一曲封神!“音樂界Sora”Udio發布,效果直逼人類唱歌|鈦媒體AGI
本周一,鈦媒體AGI發布了“比Suno好10倍的 AI 音樂應用”消息,引發關注,甚至當時名字都還沒得到正式確認。
如今,這款 AI 音樂產品終于被官宣了。
北京時間4月11日凌晨,全新的音樂生成應用Udio正式亮相,輸出效果超越熱門的Suno,尤其是中文歌曲甚至直逼人類唱歌水平,堪稱“錄音室”級別,成為Suno勁敵,引發廣泛關注。
目前,Udio已經開始公測,用戶可免費體驗,每月可生成1200首作品。體驗地址:https://www.udio.com/
據了解,Udio采用先進的AI技術,通過簡單的文字輸入,就能生成各類風格的原創音樂作品。從抒情的福音音樂,到滄桑的藍調,再到夢幻的流行電音,應有盡有。同時,Udio還支持多種語言,用戶可以創作出日語流行、俄羅斯流行、拉丁節奏等多元化的音樂作品。
就目前體驗來看,Udio的優勢和特點包括兩部分:體驗比Suno好,更好的可擴展性。
其中,Udio生成的音樂效果比前段時間大火的Suno有了質的提升;同時,可擴展性方面,用戶不僅可以指定音樂的引子和尾聲,還能以此為基礎向前向后延伸,生成更長的音樂作品。完成創作后,只需點擊"發布",作品就能與Udio社區的其他創作者們分享交流。
注冊 Udio 帳戶后,任何人都可以通過輸入文本提示來創建曲目,其中可以包括歌詞、故事方向和音樂流派標簽。然后,Udio 分兩個階段處理該任務。首先,它利用類似于 ChatGPT 的大型語言模型 (LLM) 根據提供的提示生成歌詞(如果需要)。接下來,它使用 Udio 沒有公開的方法合成音樂,但這很可能是一種擴散模型,類似于 Stability AI 的Stable Audio。
根據給定的提示,Udio 的 AI 模型會生成兩個不同的歌曲片段供您選擇。然后,您可以將歌曲發布到 Udio 社區,下載音頻或視頻文件以在其他平臺上共享,或直接在社交媒體上共享。其他 Udio 用戶也可以重新混音或在現有歌曲的基礎上進行創作。Udio 的服務條款規定,該公司對音樂世代不享有任何權利,并且它們可以用于商業目的。
企業層面,公開消息顯示,Udio的創始團隊來自谷歌DeepMind等頂尖AI機構,團隊在音樂和技術領域均有深厚積淀。他們的目標是讓Udio成為一款真正改變游戲規則的音樂創作工具,不僅面向專業音樂人,也希望讓廣大非音樂人也能輕松參與到音樂創作當中。
盡管 Udio 團隊尚未透露其模型或訓練數據的具體細節(其中可能充滿了受版權保護的材料),但它告訴《tom指南》,該系統具有內置措施來識別和阻止與特定的藝術家,確保生成的音樂保持原創。
當前,Suno、Udio 也讓一些人類音樂家感到害怕。上周,超過 200 名音樂藝術家簽署了一封公開抗議信,批評Udio這種由 AI 驅動的音樂生成服務,影響音樂者創作。一位 Reddit 評論者在有關 Udio 的帖子中寫道:“說實話,這太令人沮喪了。” “我仍然普遍樂觀地認為,從長遠來看,音樂在某種程度上會很好。但是,為什么要這樣做?為什么要自動化藝術?”
也有分析稱,就像Sora一樣,Udio生成的音樂和 Spotify 上聽到的歌曲幾乎沒有任何區別。而且根據他的感受,“要比Suno好10倍。”
早前鈦媒體注意到相關報道,Udio稱為xgboost技術,后來被證實后者是一種數據集技術,它采用開源數據集Medley-solos-DB,最初發布時間為2019年9月29日。該研究參與方包括紐約大學、加州大學伯克利分校、Spotify等機構人員。另據論文顯示,山東理工大學工程與信息技術系Yijie Liu,Yanfang Yin,Qigang Zhu,Wenzhuo Cui等人采用利用XGBoost結合特征融合進行樂器識別。
據報道,Udio團隊正在快速迭代優化,計劃未來陸續推出更長音頻、更高音質,以及更強大的可控性等眾多新功能。
針對 AI 音樂生成生態,Suno首席執行官Mikey Shulman在紅杉資本活動上表示,這是一個非常酷的工具,它正在擴大用戶,從而讓我們對傾聽創造性音樂的品味能夠引起更多人的共鳴。未來suno會有大量的玩家,占比或超過80%。
(本文首發鈦媒體App,作者|林志佳)
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。