首頁 > AI資訊 > 最新資訊 > 打造“多語種”名片科大訊飛實(shí)現(xiàn)智能語音自主創(chuàng)新生態(tài)

打造“多語種”名片科大訊飛實(shí)現(xiàn)智能語音自主創(chuàng)新生態(tài)

人民網(wǎng)-安徽頻道 原創(chuàng)稿    2024-11-15

在教室,老師通過遙控器和智能黑板直接對話;在家里,空調(diào)、電視機(jī)等家電早已實(shí)現(xiàn)語音控制;駕車行駛在路上,一句指令就能操控汽車;會(huì)議室里,多人發(fā)言都能立刻被清晰錄音并轉(zhuǎn)寫成文字、生成會(huì)議紀(jì)要……近年來,智能語音正潤物細(xì)無聲地改變著人們的生活,也創(chuàng)造了巨大的市場價(jià)值。

據(jù)國際數(shù)據(jù)公司IDC分析,預(yù)計(jì)到2030年,全球智能語音服務(wù)市場規(guī)模將達(dá)約731.6 億美元,復(fù)合增長率27%。如此龐大的市場、如此關(guān)鍵的技術(shù),中國如何不被“卡脖子”?以科大訊飛為代表的中國科技企業(yè)給出答案:自主創(chuàng)新。

中國的語音技術(shù)要掌握在中國人自己手里

作為新一代信息技術(shù)和人工智能產(chǎn)業(yè)的重要組成部分,智能語音不斷實(shí)現(xiàn)關(guān)鍵技術(shù)突破,精度、速度與智能化水平正在逐年提升。在實(shí)際應(yīng)用環(huán)境的匹配度方面,相關(guān)技術(shù)產(chǎn)品已經(jīng)可以滿足“混合語種”“復(fù)雜環(huán)境”“多人交互”等更為高端的任務(wù)需求。而在20世紀(jì)90年代,中國的智能語音技術(shù)和語音產(chǎn)業(yè)還是外國人的天下,微軟、谷歌、英特爾等企業(yè)紛紛在中國設(shè)研究院。如今的人工智能龍頭企業(yè)科大訊飛正是在這種情況下誕生。

據(jù)了解,科大訊飛創(chuàng)始人劉慶峰當(dāng)時(shí)還是中國科學(xué)技術(shù)大學(xué)的學(xué)生,在導(dǎo)師王仁華的支持下,他和幾位同學(xué)立志“中文語音技術(shù)要由中國人做到世界最好,中文語音產(chǎn)業(yè)要掌握在中國人自己手上”,于是創(chuàng)立了科大訊飛。

經(jīng)過多年研究和實(shí)踐,科大訊飛不僅將中文語音技術(shù)做到最好,也將多語種技術(shù)做到全球領(lǐng)先。語音識別的準(zhǔn)確率達(dá)到98%,多人會(huì)議場景的說話人分離和識別的準(zhǔn)確率達(dá)到95%。2021年,科大訊飛在美國國家標(biāo)準(zhǔn)與技術(shù)研究院NIST發(fā)起的國際低資源多語種語音識別競賽OpenASR中,獲得全部受限賽道的15個(gè)語種冠軍及7個(gè)語種非受限賽道冠軍。

如今,在中國智能語音市場,科大訊飛的市場占有率多年保持第一。以大熱的智能汽車行業(yè)為例,2023年,中國汽車出口量超過日本,躍居全球第一,而出海十強(qiáng)企業(yè)中,有8家都在和科大訊飛合作。科大訊飛多語種技術(shù)已經(jīng)可以覆蓋全球60多個(gè)語種,訊飛智能車載語音系統(tǒng)覆蓋23個(gè)主要語種,搭載車型已銷往亞洲、歐洲、南美等地的60多個(gè)國家和地區(qū)。

語音大模型,要建立在自主可控的國產(chǎn)平臺上

2006—2019年,連續(xù)十四年榮獲國際語音合成大賽冠軍;2016—2023年,連續(xù)4屆獲得國際多通道語音分離和識別比賽CHiME冠軍;2021—2023年,連續(xù)三年獲得國際語音翻譯比賽IWSLT冠軍……

作為中國人工智能“國家隊(duì)”,科大訊飛代表中國取得了多項(xiàng)重要標(biāo)志性成果,逐漸構(gòu)建起獨(dú)立的語音自主知識產(chǎn)權(quán)技術(shù)體系。

如今,大模型的出現(xiàn)發(fā)展給語音技術(shù)帶來了新的前進(jìn)動(dòng)力,結(jié)合大語言模型更精準(zhǔn)的語義理解和更精細(xì)的描述能力,語音合成表現(xiàn)力、長時(shí)的語音識別等語音各類任務(wù)也能快速突破效果的上限。

今年1月30日,科大訊飛發(fā)布基于首個(gè)全國產(chǎn)算力訓(xùn)練的訊飛星火V3.5,正式發(fā)布星火語音大模型,首批37個(gè)主流語種效果超過OpenAI Whisper V3。4月26日,訊飛星火大模型V3.5再次更新,發(fā)布業(yè)界首個(gè)支持長文本、長圖文以及長語音的大模型產(chǎn)品。

其長語音功能,可以實(shí)現(xiàn)會(huì)議錄音、學(xué)習(xí)視頻等的一鍵研讀,實(shí)現(xiàn)音視頻場景的高效知識獲取。新版大模型將科大訊飛國際領(lǐng)先的語音識別和翻譯技術(shù)結(jié)合起來,讓英文資料也能像純文字內(nèi)容一樣進(jìn)行快速獲取和學(xué)習(xí)。

如今,一個(gè)自主可控的多語種智能語音技術(shù)及全球產(chǎn)業(yè)生態(tài)正在構(gòu)建。科大訊飛的技術(shù)算法全部自研,目前,已建成5個(gè)國產(chǎn)化集群,語音合成、識別、翻譯、交互等國產(chǎn)化能力日服務(wù)8.73億次。2023年,訊飛與華為聯(lián)合攻關(guān)大模型國產(chǎn)化算力底座核心難題,建設(shè)首個(gè)全國產(chǎn)算力平臺“飛星一號”,填補(bǔ)了國產(chǎn)超大模型訓(xùn)練平臺空白。

科大訊飛董事長劉慶峰表示:“我們應(yīng)正視差距,聚焦自主創(chuàng)新的底座大模型‘主戰(zhàn)場’,從國家層面聚焦資源加快追趕,同時(shí)系統(tǒng)性構(gòu)建通用人工智能生態(tài)和應(yīng)用,打造綜合優(yōu)勢。”(汪日貴)

(責(zé)編:范曉琳、張磊)

分享讓更多人看到

相關(guān)推薦
免責(zé)聲明
本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。

熱門文章