推動(dòng)多語(yǔ)言語(yǔ)音科技邁向新高度:INTERSPEECH2025ML-SUPERB2.0挑戰(zhàn)賽
隨著語(yǔ)音技術(shù)在各領(lǐng)域應(yīng)用的迅速擴(kuò)展,全球語(yǔ)言與口音的多樣性成為技術(shù)進(jìn)一步突破的重大挑戰(zhàn)。為了應(yīng)對(duì)這一難題,來(lái)自卡內(nèi)基梅隆大學(xué)(CMU)、斯坦福大學(xué)(Stanford University)、喬治梅森大學(xué)(George Mason University)、臺(tái)灣大學(xué)與芝加哥豐田技術(shù)學(xué)院(TTIC)的研究團(tuán)隊(duì)連手,在即將舉行的 INTERSPEECH 2025 國(guó)際會(huì)議上推出了 ML-SUPERB 2.0 挑戰(zhàn)賽(Multilingual SUPERB 2.0 Challenge)。該挑戰(zhàn)旨在推動(dòng)多語(yǔ)言語(yǔ)音技術(shù)邁向新高度,為語(yǔ)音科技的全球化應(yīng)用奠定堅(jiān)實(shí)基礎(chǔ)。
語(yǔ)言數(shù)量規(guī)模
ML-SUPERB 2.0提供了包含大量不同語(yǔ)言的語(yǔ)音數(shù)據(jù)集。
●訓(xùn)練集:涵蓋141種語(yǔ)言的豐富語(yǔ)音數(shù)據(jù),從主流語(yǔ)言到稀有方言,為參賽者提供多元化的語(yǔ)言資源以訓(xùn)練模型。
●開(kāi)發(fā)集:包含訓(xùn)練集中的141種語(yǔ)言,和另外的56 種方言與口音,為模型性能的全面評(píng)估提供支持。
這些數(shù)據(jù)反映了全球語(yǔ)言的多樣性,確保技術(shù)不僅服務(wù)于主流語(yǔ)言,更覆蓋小眾語(yǔ)言。
新型評(píng)估機(jī)制
ML-SUPERB 2.0 在評(píng)估機(jī)制上進(jìn)行了創(chuàng)新,模型評(píng)估指針除了傳統(tǒng)的語(yǔ)音識(shí)別和語(yǔ)言識(shí)別錯(cuò)誤率外,還強(qiáng)調(diào)模型在每種語(yǔ)言上都具備穩(wěn)定性能,真正做到對(duì)所有語(yǔ)言的友好支持,激勵(lì)研究者關(guān)注小眾語(yǔ)言與弱勢(shì)語(yǔ)言的平等支持,最終實(shí)現(xiàn)“No Language Left Behind”。
主辦方提供算力進(jìn)行推論
為提升參賽體驗(yàn),降低參賽門坎,挑戰(zhàn)賽引入了在線實(shí)時(shí)排名系統(tǒng)。參賽者只需提交模型,即可由主辦單位提供算力進(jìn)行推論,實(shí)現(xiàn)快速評(píng)估與實(shí)時(shí)反饋。
引領(lǐng)語(yǔ)音科技的未來(lái)
ML-SUPERB 2.0挑戰(zhàn)賽不僅是一場(chǎng)技術(shù)比拼,更是推動(dòng)語(yǔ)音科技邁向新紀(jì)元的重要一步。通過(guò)凝聚全球研究者與開(kāi)發(fā)者的力量,挑戰(zhàn)賽將加速多語(yǔ)言語(yǔ)音技術(shù)的創(chuàng)新與普及,為語(yǔ)音技術(shù)的應(yīng)用場(chǎng)景帶來(lái)更多可能性。參賽者可前往官方網(wǎng)站 (https://multilingual.superbbenchmark.org/) 獲取詳細(xì)信息,并在 2025 年 2 月 7 日前提交結(jié)果。讓我們攜手參與這場(chǎng)語(yǔ)音技術(shù)的盛會(huì),見(jiàn)證語(yǔ)音科技未來(lái)的開(kāi)啟!
- 免責(zé)聲明
- 本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。