英偉達(dá)展示新型人工智能模型:可修改聲音和生成新聲音
鞭牛士報道,11月26日消息,據(jù)路透社報道,英偉達(dá)周一展示了一種用于生成音樂和音頻的新型人工智能模型,該模型可以修改聲音并生成新的聲音——該技術(shù)針對的是音樂、電影和視頻游戲制作者。
英偉達(dá)是全球最大的人工智能系統(tǒng)芯片和軟件供應(yīng)商,該公司表示,目前還沒有公開發(fā)布這項技術(shù)的計劃,該技術(shù)被稱為 Fugatto,是 Foundational Generative Audio Transformer Opus 1 的縮寫。
它加入了 Runway 等初創(chuàng)公司和 Meta Platforms等大型公司所展示的其他技術(shù),可以根據(jù)文本提示生成音頻或視頻,包括像狗叫一樣吹響喇叭等新奇的聲音。
它與其他人工智能技術(shù)的不同之處在于,它能夠接收和修改現(xiàn)有音頻,例如,將鋼琴彈奏的一段歌詞轉(zhuǎn)換成人聲唱出的歌詞,或者將口語錄音改變所使用的口音和表達(dá)的情緒。
英偉達(dá)應(yīng)用深度學(xué)習(xí)研究副總裁 Bryan Catanzaro 表示:如果我們回顧過去 50 年的合成音頻,就會發(fā)現(xiàn)現(xiàn)在的音樂聽起來已經(jīng)不同了,因為有了計算機(jī)和合成器。我認(rèn)為生成式人工智能將為音樂、視頻游戲和想要創(chuàng)造事物的普通人帶來新的功能。
雖然 OpenAI 等公司正在與好萊塢電影公司就是否以及如何將人工智能應(yīng)用于娛樂行業(yè)進(jìn)行談判,但科技界和好萊塢之間的關(guān)系變得緊張,特別是在好萊塢明星斯嘉麗約翰遜指責(zé) OpenAI 模仿她的聲音之后。
英偉達(dá)的新模型是在開源數(shù)據(jù)上進(jìn)行訓(xùn)練的,該公司表示仍在討論是否以及如何公開發(fā)布它。
「任何生成技術(shù)都存在一定的風(fēng)險,因為人們可能會利用它生成我們不希望他們生成的東西。」卡坦扎羅說。「我們需要對此保持謹(jǐn)慎,這就是為什么我們暫時沒有發(fā)布這項技術(shù)的計劃。」
生成式人工智能模型的創(chuàng)建者尚未確定如何防止濫用該技術(shù),例如用戶生成錯誤信息或通過生成受版權(quán)保護(hù)的角色來侵犯版權(quán)。
OpenAI 和 Meta 也沒有透露何時計劃向公眾發(fā)布能夠生成音頻或視頻的模型。
- 免責(zé)聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認(rèn)可。 交易和投資涉及高風(fēng)險,讀者在采取與本文內(nèi)容相關(guān)的任何行動之前,請務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。