新技術(shù)浪潮下的智能視聽步入深度變革新階段——2023年人工智能賦能網(wǎng)絡(luò)視聽產(chǎn)業(yè)觀察報告
新技術(shù)浪潮下的智能視聽步入深度變革新階段
——2023年人工智能賦能網(wǎng)絡(luò)視聽產(chǎn)業(yè)觀察報告
2023年,生成式人工智能技術(shù)突破式發(fā)展,在全球范圍內(nèi)掀起熱潮,通用大語言模型和垂直模型應(yīng)用探索爆發(fā)式推進(jìn),人工智能對各行業(yè)的影響進(jìn)一步加速。網(wǎng)絡(luò)視聽成為人工智能新技術(shù)加速應(yīng)用的核心場景,圍繞影視劇、短視頻、網(wǎng)絡(luò)直播等視聽形態(tài),在人工智能促進(jìn)深度合成、視頻修復(fù)及智能推薦等方面,涌現(xiàn)出諸多創(chuàng)新應(yīng)用案例,推動智能視聽逐漸步入深度變革新階段。
中共中央總書記、國家主席、中央軍委主席習(xí)近平近日對宣傳思想文化工作作出重要指示強(qiáng)調(diào),“新時代新征程,世界百年未有之大變局加速演進(jìn),中華民族偉大復(fù)興進(jìn)入關(guān)鍵時期,戰(zhàn)略機(jī)遇和風(fēng)險挑戰(zhàn)并存,宣傳思想文化工作面臨新形勢新任務(wù),必須要有新氣象新作為”。
網(wǎng)絡(luò)視聽作為我國文化產(chǎn)業(yè)的重要組成部分,在扎實推進(jìn)社會主義文化強(qiáng)國建設(shè)中承擔(dān)著全新使命。人工智能新技術(shù)的創(chuàng)新應(yīng)用,對推動網(wǎng)絡(luò)視聽產(chǎn)業(yè)高質(zhì)量發(fā)展具有重要作用。梳理典型案例,研判未來趨勢,對智能視聽發(fā)展意義重大。
一、人工智能賦能網(wǎng)絡(luò)視聽創(chuàng)新應(yīng)用案例
2023年,生成式人工智能空前火爆,極大拓展了視聽產(chǎn)品生產(chǎn)想象空間。人工智能技術(shù)的突破式發(fā)展與創(chuàng)新應(yīng)用,給視聽行業(yè)帶來了“質(zhì)量與效率”變革,推動視聽產(chǎn)品實現(xiàn)更多創(chuàng)意、更高效率、更新體驗與更高品質(zhì)。
(一)綜合視頻:AI深度滲透產(chǎn)品創(chuàng)作,創(chuàng)造全新體驗
2023年,隨著AI大模型和多模態(tài)AI技術(shù)的融合發(fā)展,人工智能生成內(nèi)容的創(chuàng)作能力、通用化能力以及工業(yè)化水平快速提升。影視創(chuàng)作中的AI前沿技術(shù)應(yīng)用進(jìn)入新階段,貫通影視內(nèi)容策劃、開發(fā)、制作和宣發(fā)等各個環(huán)節(jié)。
杭州亞運(yùn)會期間,央視網(wǎng)《大咖陪你看》節(jié)目首次探索將人工智能運(yùn)用在內(nèi)容采集、生產(chǎn)環(huán)節(jié)中。欄目組通過人工智能大模型智能分析每天最受關(guān)注的熱點(diǎn)話題,向亞運(yùn)選手們發(fā)起提問。除此之外,為了提升觀眾和運(yùn)動員的互動參與感,《大咖陪你看》還與人工智能進(jìn)行了內(nèi)容共創(chuàng),推出了《亞運(yùn)頌詩》欄目,海報素材和文案靈感均由人工智能輔助生成,在社交媒體上吸引了眾多用戶參與共創(chuàng),該欄目為中國跳水夢之隊寫下了“如飛似燕輕盈躍,十米懸落水不驚”的詩句。
影視制作公司和長視頻平臺方面,AI更全面滲透到內(nèi)容生產(chǎn)、視頻運(yùn)營等各個環(huán)節(jié),更多創(chuàng)作者探索通過“人工+AI”方式進(jìn)行影視畫面生產(chǎn),尤其在一些動畫電影中AI技術(shù)應(yīng)用更加廣泛。影視制作機(jī)構(gòu)光線傳媒相關(guān)負(fù)責(zé)人認(rèn)為,“AI對動畫電影主要環(huán)節(jié)效率的提升可能會達(dá)到50%,對整個動畫電影制作的周期效率提升30%。”
視頻平臺愛奇藝在2023年第二季度財報中透露,大語言模型能力與多模態(tài)視頻理解技術(shù)等AI技術(shù)已被應(yīng)用到長視頻的劇情理解、提煉等環(huán)節(jié),實現(xiàn)了自動化批量產(chǎn)出拆條、解說、混剪等多類型視頻內(nèi)容及多元化圖文內(nèi)容。該技術(shù)目前對場景和人物拆解的準(zhǔn)確率超過90%,有效提升了劇本評估、預(yù)算規(guī)劃和資源管理等方面的效率。
業(yè)內(nèi)普遍認(rèn)為,雖然當(dāng)前AI能在極短的時間內(nèi)提供一個大致接近構(gòu)想的作品,但當(dāng)需要進(jìn)一步精細(xì)化、風(fēng)格化、個性化加工時,目前的AI工具仍無法做到。同時,AI的原創(chuàng)性不夠,隨著“生成—篩選”這一過程被不斷重復(fù),開始逐漸呈現(xiàn)出審美同質(zhì)化等問題。作為創(chuàng)意產(chǎn)業(yè),影視劇輔助生產(chǎn)所需要的AI工具不宜采用某種通用模型,而應(yīng)走向垂直化、個性化模型。
(二)短視頻:AI創(chuàng)作功能快速迭代,催生“超級生產(chǎn)者”
相對于專業(yè)的影視制作,AI技術(shù)在短視頻方面的應(yīng)用門檻相對更低。在生成式人工智能概念火爆之前,市面上已經(jīng)有很多AI短視頻制作工具,幫助降低短視頻制作難度,如抖音官方視頻剪輯軟件“剪映”此前已經(jīng)有AI圖片轉(zhuǎn)視頻等功能。
在關(guān)鍵詞自動提取、字幕自動生成等基本操作基礎(chǔ)上,文本自動配音、文本轉(zhuǎn)視頻、數(shù)字人播報、個性化文案、多元風(fēng)格等升級功能在2023年加速發(fā)展。
2023年10月3日,在杭州亞運(yùn)會跳水比賽收官之際,央視網(wǎng)體育發(fā)布了一條由AI技術(shù)智能生成的短視頻——《為智能亞運(yùn)點(diǎn)贊 全紅嬋和陳芋汐的每次對決都注定是一場“神仙打架”》。央視網(wǎng)借助能實現(xiàn)畫面快速傳輸?shù)摹盁o影”云電腦、嵌入預(yù)設(shè)模版、匹配字幕等多項AI技術(shù)進(jìn)行短視頻內(nèi)容的創(chuàng)制。該短視頻不僅通過AI實現(xiàn)了高效智能檢選創(chuàng)作素材,還可以對已有素材進(jìn)行合理化剪輯和拼接,并利用大數(shù)據(jù)算法評估視頻畫面的傳播潛力,即觀眾的“愛看”程度。同時,該短視頻還運(yùn)用了大語言模型和繪畫創(chuàng)作大模型等AI產(chǎn)品,涉及的主要功能包括多輪對話、文案創(chuàng)作、邏輯推理、多模態(tài)理解、多語言支持以及輔助圖片創(chuàng)作等。AI技術(shù)的應(yīng)用提高了短視頻的創(chuàng)作與傳播效率,拉近了觀眾與賽場的距離。
《每日經(jīng)濟(jì)新聞》2022年12月推出AI短視頻自動生成平臺,實現(xiàn)了從文字創(chuàng)作到媒資庫智能匹配,再到短視頻自動生成,最后到多平臺一鍵分發(fā)的全流程AI化。通過該平臺,《每日經(jīng)濟(jì)新聞》完成了所有文字稿件的全量視頻化。平臺試運(yùn)行期間,每經(jīng)視頻號和抖音號的日均播放量環(huán)比增長143%和17%;日凈增粉絲數(shù)環(huán)比增長超過70%。日產(chǎn)視頻達(dá)到200余條,產(chǎn)能相比之前實現(xiàn)了十多倍的增長。
隨著AI技術(shù)發(fā)展,內(nèi)容平臺的服務(wù)能力迎來升級。以創(chuàng)作者的圖文轉(zhuǎn)視頻需求為例,“剪映”為此推出“圖文成片”功能,即輸入一段文字,該平臺會智能匹配圖片素材,添加字幕、旁白和音樂,最終自動生成視頻。快手旗下的視頻剪輯類產(chǎn)品“快影”和功能拍攝類產(chǎn)品“一甜相機(jī)”,已于今年陸續(xù)內(nèi)測包括“AI動漫視頻”、“AI文案推薦”、“AI瞬息宇宙”、“AI簡筆畫”在內(nèi)的多款創(chuàng)作功能。騰訊旗下短視頻動畫智創(chuàng)產(chǎn)品“玩句”、B站官方剪輯軟件“必剪”等平臺也提供了AI剪輯創(chuàng)作相關(guān)的功能。
作為創(chuàng)作基礎(chǔ)工具的AI模型與產(chǎn)品、平臺加速發(fā)展,初步獲得可觀的商業(yè)流量。據(jù)相關(guān)負(fù)責(zé)人2023年4月透露, “快影”的“一鍵成片”AI功能日均消費(fèi)量超4.5億,文案成片日均作品消費(fèi)量超4000萬。分析認(rèn)為,AI未來將賦能個體,打造諸多短視頻的“超級生產(chǎn)者”,從而為內(nèi)容迭代和行業(yè)發(fā)展帶來更多可能性。
(三)網(wǎng)絡(luò)直播:數(shù)字人涌入直播間,豐富消費(fèi)場景
2023年,人工智能技術(shù)進(jìn)一步應(yīng)用到電商直播、音樂會直播、體育直播等多種場景中,催生直播行業(yè)創(chuàng)新玩法,網(wǎng)絡(luò)直播的消費(fèi)場景和商業(yè)模式迎來新突破。
大批數(shù)字人虛擬主播涌入直播間帶貨,成為當(dāng)前網(wǎng)絡(luò)直播行業(yè)的火熱景象。在直播電商流量和人力成本高漲的情況下,數(shù)字人直播成為不少平臺和企業(yè)探索的方向。
2023年618電商促銷節(jié)期間,京東推出虛擬主播產(chǎn)品。據(jù)京東戰(zhàn)報顯示,“開門紅”開啟10分鐘,數(shù)字人直播間開播商家數(shù)較去年雙11的增幅接近400%。雅詩蘭黛、歐萊雅、寶潔等知名品牌均嘗試接入虛擬主播服務(wù)于電商直播。
直播尤其是直播帶貨過程中引進(jìn)虛擬主播優(yōu)勢明顯。AI數(shù)字人主播具備專業(yè)過硬、情緒穩(wěn)定、永不疲勞的特點(diǎn),可以幫助企業(yè)大大降低人工成本和運(yùn)營費(fèi)用。不過,數(shù)字人直播目前處在發(fā)展應(yīng)用的初期,受多方面因素制約,直播效果仍有待提升優(yōu)化。數(shù)字人在一些平臺的使用規(guī)則尚處于探索中,相關(guān)法律法規(guī)及細(xì)則也有待進(jìn)一步明確和完善。
體育賽事直播方面,今年杭州亞運(yùn)會期間,依托中國移動能力中臺的智能字幕能力,咪咕智能字幕升級為低時延雙行滾動字幕,并在原普通話解說字幕的基礎(chǔ)上,首次推出了中國七大方言中的閩南語、粵語直播智能字幕,字幕中文準(zhǔn)確率達(dá)92%,為提升用戶觀賽體驗賦能。據(jù)了解,為實現(xiàn)更加精準(zhǔn)的字幕轉(zhuǎn)寫服務(wù),咪咕針對方言轉(zhuǎn)寫準(zhǔn)確率普遍偏低、運(yùn)動員姓名及運(yùn)動專業(yè)術(shù)語易錯等難題,運(yùn)用了方言聲學(xué)模型優(yōu)化技術(shù),并進(jìn)行垂類翻譯干預(yù)訓(xùn)練,讓粵語、閩南語等不同解說語言的智能字幕均能準(zhǔn)確呈現(xiàn)。
演唱會音樂會直播方面,利用視頻修復(fù)等人工智能技術(shù),不少年代久遠(yuǎn)的演唱會直播視頻重新推出,引發(fā)了網(wǎng)民情感共振。此外,基于直播與元宇宙概念的結(jié)合,多家直播平臺搭建沉浸式場景,探索更具顛覆性的社交方式和多元化的興趣營銷場景。
(四)網(wǎng)絡(luò)音頻:AI席卷“耳朵經(jīng)濟(jì)”,大模型重塑音頻行業(yè)
2023年,部分垂直類音頻平臺通過引入AI大模型,促進(jìn)了AI領(lǐng)域前沿技術(shù)在音頻產(chǎn)業(yè)落地應(yīng)用。
相比于圖像和視頻,AI技術(shù)進(jìn)入音頻行業(yè)的步伐雖相對較晚,但目前在語音識別、語音合成、語音互動、語音信號處理等領(lǐng)域中的應(yīng)用已較為成熟。內(nèi)容創(chuàng)作方面,AI提高音頻內(nèi)容生產(chǎn)效率,解放創(chuàng)作者的內(nèi)容生產(chǎn)力,促進(jìn)音頻及播客創(chuàng)作生態(tài)的繁榮。語音交互方面,AI提高音頻產(chǎn)品科技水平,提升消費(fèi)者體驗,滿足用戶多樣化需求。
截至2023年初,喜馬拉雅平臺已通過AI技術(shù)創(chuàng)作有聲書專輯超37000部,其中“單田芳聲音重現(xiàn)”系列專輯總播放量超1億次。2023年7月,喜馬拉雅推出AI智能創(chuàng)作工具“云剪輯”,集合智能音量、智能配樂、音轉(zhuǎn)文剪輯、AI分段、智能檢測、一鍵成片等功能,目的是降低音頻播客內(nèi)容創(chuàng)作的門檻,提升創(chuàng)作效率。據(jù)介紹,喜馬拉雅“云剪輯”的“音頻轉(zhuǎn)文字剪輯”功能,是利用AI技術(shù)把音頻內(nèi)容轉(zhuǎn)成文字,創(chuàng)作者可以直接通過“看”對照文字,像編輯word文檔一樣剪輯音頻,從而提高后期剪輯效率。“智能檢測”功能則可以幫助創(chuàng)作者一鍵識別氣口、口水音等,并將不需要的口癖等進(jìn)行刪除,不必再逐字逐句地剪輯。此外,“智能配樂、智能音量”功能,方便創(chuàng)作者通過AI為播客內(nèi)容選擇具備版權(quán)的并與內(nèi)容匹配的音樂,對音頻音量也能做到一鍵調(diào)節(jié)音量均衡、淡入淡出,提升創(chuàng)作效率。
在音樂領(lǐng)域,隨著AI技術(shù)的成熟,AI變音、調(diào)音技術(shù)等得到應(yīng)用推廣,通過收集大量語音素材進(jìn)行模型訓(xùn)練和后期處理,AI可以生成模仿不同音色翻唱的歌曲,B站、QQ音樂、網(wǎng)易云音樂等平臺上逐漸涌現(xiàn)了一批使用AI技術(shù)模擬當(dāng)紅歌手翻唱歌曲的作品。如今年5月“AI孫燕姿”翻唱的作品憑借極具辨識度的音色以及對各種曲風(fēng)的駕馭能力火爆全網(wǎng)。由此引發(fā)的版權(quán)問題引發(fā)討論,一些機(jī)構(gòu)積極探索版權(quán)問題解決方案。
分析認(rèn)為,雖然利用AI技術(shù)生成音頻可大幅減少時間和成本,提高生產(chǎn)效率和水平,但是AI在音頻內(nèi)容生產(chǎn)方面也存在一些局限性。AI無法模仿出真人特有的語調(diào)和情感,因技術(shù)因素限制在生成音視頻時可能存在一些不真實的細(xì)節(jié)和瑕疵,需要不斷改進(jìn)和優(yōu)化。
除了內(nèi)容的生產(chǎn)創(chuàng)作,大模型還廣泛應(yīng)用于語音交互服務(wù)領(lǐng)域。國內(nèi)音頻企業(yè)荔枝主要將AI技術(shù)應(yīng)用于機(jī)器人語音聊天方面,開發(fā)并上線AI聊天機(jī)器人應(yīng)用產(chǎn)品,為用戶提供在線AI對話等功能。2023年2月下旬,荔枝在其全球化聲音社交產(chǎn)品內(nèi)接入了AI大模型,推出人工智能聊天機(jī)器人模塊,并在3月底推出了全新升級版的聊天機(jī)器人。該聊天機(jī)器人不僅能幫助用戶創(chuàng)建在線理想好友,還能為用戶提供更加個性化的AI聊天體驗和廣泛的互動場景,推動AI機(jī)器人與原有社交生態(tài)的有效融合,從而為用戶提供更多情緒傾訴和情感陪伴價值。
分析認(rèn)為,AI音頻行業(yè)將快速實現(xiàn)商業(yè)化落地,并觸發(fā)各細(xì)分應(yīng)用場景全面變革。圍繞音頻生成、語音交互、識別翻譯、個性化推薦等領(lǐng)域,其應(yīng)用產(chǎn)品將覆蓋在線辦公、移動社交、廣告營銷、學(xué)校教育、體育比賽、居家養(yǎng)老等多元場景。
二、相關(guān)法規(guī)政策與行業(yè)規(guī)范
隨著人工智能技術(shù)的進(jìn)一步成熟和應(yīng)用場景的擴(kuò)展,人工智能創(chuàng)新應(yīng)用給行業(yè)和全社會帶來的治理挑戰(zhàn)不容忽視。國家相關(guān)部門密集出臺相關(guān)政策法規(guī),推動人工智能技術(shù)合理有效利用,及時劃定“底線”和“紅線”。相關(guān)行業(yè)規(guī)范及平臺自治規(guī)定陸續(xù)發(fā)布。
(一)人工智能相關(guān)法律法規(guī)與政策規(guī)定
2022年12月,國家互聯(lián)網(wǎng)信息辦公室、工業(yè)和信息化部、公安部聯(lián)合發(fā)布《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》,該規(guī)定在《網(wǎng)絡(luò)安全法》《個人信息保護(hù)法》等法律法規(guī)框架下,對使用深度合成技術(shù)提供互聯(lián)網(wǎng)信息服務(wù)的情形提出了專門性、具體性要求。其中提到:深度合成服務(wù)提供者對使用其服務(wù)生成或編輯的信息內(nèi)容,應(yīng)當(dāng)添加不影響使用的標(biāo)識。提供智能對話、合成人聲、人臉生成、沉浸式擬真場景等生成或者顯著改變信息內(nèi)容功能的服務(wù)的,應(yīng)當(dāng)進(jìn)行顯著標(biāo)識,避免公眾混淆或者誤認(rèn)。規(guī)定還要求,深度合成服務(wù)提供者建立健全管理制度和技術(shù)保障措施,制定公開管理規(guī)則、平臺公約,對使用者進(jìn)行真實身份信息認(rèn)證,加強(qiáng)深度合成內(nèi)容管理,建立健全辟謠機(jī)制和申訴、投訴、舉報機(jī)制。
2023年4月,由廣播電視人工智能應(yīng)用國家廣播電視總局重點(diǎn)實驗室組織編制的《廣播電視和網(wǎng)絡(luò)視聽深度偽造防范技術(shù)要求(2022版)》對外公示。該文件重點(diǎn)在深度偽造鑒別、面部識別、黑名單、深度偽造防范能力評估等方面提出要求,為廣播電視和網(wǎng)絡(luò)視聽機(jī)構(gòu)在內(nèi)容審核、發(fā)布等環(huán)節(jié)提升深度偽造防范能力提供參考。
2023年7月,國家網(wǎng)信辦聯(lián)合國家發(fā)展改革委、教育部、科技部、工業(yè)和信息化部、公安部、國家廣電總局公布《生成式人工智能服務(wù)管理暫行辦法》(以下稱《辦法》),自2023年8月15日起施行。這是中國首次對生成式AI研發(fā)及服務(wù)作出明確規(guī)定。《辦法》提出國家堅持發(fā)展和安全并重、促進(jìn)創(chuàng)新和依法治理相結(jié)合的原則,采取有效措施鼓勵生成式人工智能創(chuàng)新發(fā)展,對生成式人工智能服務(wù)實行包容審慎和分類分級監(jiān)管,明確了提供和使用生成式人工智能服務(wù)的總體要求。
2023年9月,科技部、教育部、工信部等十個部門聯(lián)合發(fā)布《科技倫理審查辦法(試行)》,對科技倫理審查主體、審查程序、監(jiān)督管理等內(nèi)容作出明確規(guī)定。其中規(guī)定,從事生命科學(xué)、醫(yī)學(xué)、人工智能等科技活動的單位,研究內(nèi)容涉及科技倫理敏感領(lǐng)域的,應(yīng)設(shè)立科技倫理(審查)委員會。
(二)相關(guān)標(biāo)準(zhǔn)規(guī)范與平臺自治規(guī)定
2023年4月,中國移動通信聯(lián)合會元宇宙產(chǎn)業(yè)工作委員會、中國通信工業(yè)協(xié)會區(qū)塊鏈專業(yè)委員會等共同發(fā)布“關(guān)于元宇宙生成式人工智能(類ChatGPT)應(yīng)用的行業(yè)提示”。該提示提出,要嚴(yán)格遵守國家及行業(yè)相關(guān)法律法規(guī)要求,增強(qiáng)合規(guī)謹(jǐn)慎經(jīng)營的理念,全面提高風(fēng)險管控水平;提供生成式人工智能服務(wù)應(yīng)當(dāng)真實準(zhǔn)確客觀多樣,應(yīng)采取相應(yīng)措施防止生成虛假信息,不得上傳或留存含有侵犯知識產(chǎn)權(quán)的內(nèi)容,防止對生成式人工智能應(yīng)用進(jìn)行濫用,避免擾亂健康市場秩序等等。
2023年10月,全國信息安全標(biāo)準(zhǔn)化技術(shù)委員會官網(wǎng)發(fā)布《生成式人工智能服務(wù)安全基本要求》(征求意見稿),面向社會公開征求意見。這是國內(nèi)首個專門面向生成式AI安全領(lǐng)域的規(guī)范意見稿,也是對今年7月推出的《生成式人工智能服務(wù)管理暫行辦法》的支撐。該意見稿給出了生成式人工智能服務(wù)在安全方面的基本要求,包括語料安全、模型安全、安全措施、安全評估等,適用于面向我國境內(nèi)公眾提供生成式人工智能服務(wù)的提供者提高服務(wù)安全水平,或是提供者自行或委托第三方開展安全評估,也可為相關(guān)主管部門評判生成式人工智能服務(wù)的安全水平提供參考。
2023年5月,抖音發(fā)布《抖音關(guān)于人工智能生成內(nèi)容的平臺規(guī)范暨行業(yè)倡議》,針對人工智能生成的視頻、圖片和衍生的虛擬人直播,首次明確其在平臺內(nèi)的行為規(guī)范。其中提到,創(chuàng)作者、主播、用戶、商家、廣告主等平臺生態(tài)參與者,在抖音應(yīng)用生成式人工智能技術(shù)時,發(fā)布者應(yīng)對人工智能生成內(nèi)容進(jìn)行顯著標(biāo)識,幫助其他用戶區(qū)分虛擬與現(xiàn)實,特別是易混淆場景。此外,發(fā)布者需對人工智能生成內(nèi)容產(chǎn)生的相應(yīng)后果負(fù)責(zé),無論內(nèi)容是如何生成的;虛擬人需在平臺進(jìn)行注冊,虛擬人技術(shù)使用者需實名認(rèn)證。抖音還禁止用戶利用生成式人工智能技術(shù)創(chuàng)作、發(fā)布侵權(quán)內(nèi)容,包括但不限于肖像權(quán)、知識產(chǎn)權(quán)等。一經(jīng)發(fā)現(xiàn),平臺將嚴(yán)格處罰。
三、未來發(fā)展趨勢與建議
面對新形勢新任務(wù)新使命,視聽行業(yè)必須在人工智能等科技浪潮下抓住機(jī)遇,積極拓展創(chuàng)新應(yīng)用,推動行業(yè)高質(zhì)量發(fā)展。
(一)網(wǎng)絡(luò)視聽成為AI大模型垂直應(yīng)用探索落地核心場景
當(dāng)前,在通用大模型研發(fā)競爭加速的基礎(chǔ)上,AI技術(shù)發(fā)展的重點(diǎn)未來將轉(zhuǎn)向?qū)嵱眯院涂沙掷m(xù)性方向,關(guān)注如何將大模型與實際應(yīng)用場景相結(jié)合,實現(xiàn)真正的商業(yè)化應(yīng)用。垂直領(lǐng)域應(yīng)用將是大模型的主戰(zhàn)場,相關(guān)技術(shù)的飛速發(fā)展已在金融、零售、制造、物流等多個領(lǐng)域催生出商業(yè)價值,并將更廣泛地賦能各行各業(yè)。
其中,網(wǎng)絡(luò)視聽始終是信息網(wǎng)絡(luò)新技術(shù)創(chuàng)新應(yīng)用的前沿領(lǐng)域,未來也將進(jìn)一步成為大模型垂直應(yīng)用探索落地的核心場景,推動網(wǎng)絡(luò)視聽生產(chǎn)方式變革,并融合VR等新技術(shù)發(fā)展,催生新業(yè)態(tài)新模式,最終重塑視聽傳播生態(tài)格局。
對于視聽行業(yè)相關(guān)企業(yè)和平臺來說,應(yīng)積極加快產(chǎn)業(yè)布局,與人工智能企業(yè)開展深度合作,加快研發(fā)基于人工智能的視聽新應(yīng)用。針對技術(shù)發(fā)展的難點(diǎn)焦點(diǎn)問題,圍繞相關(guān)產(chǎn)業(yè)發(fā)展與治理需求,主管部門應(yīng)積極推動產(chǎn)學(xué)研用協(xié)同,推動行業(yè)在算力、算法、技術(shù)落地等方面的聯(lián)合攻關(guān),突破發(fā)展瓶頸。
(二)生成式人工智能迭代升級,打造視聽行業(yè)深度變革新起點(diǎn)
目前,人工智能生成內(nèi)容對于視聽行業(yè)的影響直觀體現(xiàn)在降低行業(yè)門檻、降低制作成本和提升生產(chǎn)力方面。同時,生成式人工智能技術(shù)的局限性仍比較突出,其算法和技術(shù)仍處于不斷發(fā)展和完善的過程中,可靠性和普適性仍有待進(jìn)一步提高。
另一方面,不能因當(dāng)前的應(yīng)用局限而忽視生成式人工智能對行業(yè)的深度變革影響。目前生成式人工智能的底層技術(shù)和產(chǎn)業(yè)生態(tài)已形成了新格局,未來在更多行業(yè)的海量應(yīng)用場景有望打開。隨著數(shù)據(jù)規(guī)模快速膨脹、算力性能不斷提升以及人工智能算法不斷發(fā)展,未來生成式人工智能能夠替代內(nèi)容創(chuàng)作者完成更多內(nèi)容挖掘、素材查詢調(diào)用等基礎(chǔ)性勞動,創(chuàng)新內(nèi)容生產(chǎn)范式,為更具藝術(shù)性和創(chuàng)造性的內(nèi)容創(chuàng)作提供可能。
在此背景下,“平均水平的基礎(chǔ)勞動”加速被取代,未來視聽創(chuàng)作焦點(diǎn)更多轉(zhuǎn)向高質(zhì)量創(chuàng)意、藝術(shù)審美與內(nèi)容共情,推動更高水平競爭。技術(shù)應(yīng)用與生產(chǎn)范式的突破性創(chuàng)新,也將成為整個視聽產(chǎn)業(yè)新變局的起點(diǎn),推動視聽形態(tài)、場景、體驗、產(chǎn)業(yè)布局的多維變革,并對文化發(fā)展、社會交往等方面產(chǎn)生深遠(yuǎn)影響。這一過程中,除了提升對新技術(shù)應(yīng)用的敏感性,還需提升對技術(shù)深刻、深遠(yuǎn)影響的認(rèn)知水平,更好理解視聽產(chǎn)業(yè)在新時期的角色使命。
(三)新技術(shù)交叉融合發(fā)展,助力“視聽+”產(chǎn)業(yè)新生態(tài)
當(dāng)前,人工智能新技術(shù)的發(fā)展演進(jìn)不是單一升級,而是與5G、VR等新技術(shù)發(fā)展相互融合、多點(diǎn)突破,以技術(shù)的融合發(fā)展應(yīng)用提升創(chuàng)新密度、解決復(fù)雜問題、豐富產(chǎn)品體驗。正如人工智能的突破式發(fā)展,對元宇宙的真正“脫虛向?qū)崱睂l(fā)揮關(guān)鍵作用,最終推動實現(xiàn)視聽形態(tài)的升維創(chuàng)新重構(gòu)。
另一方面,在“萬物皆媒”的時代,視聽作為一種低門檻、生活化的溝通方式,具備巨大的信息交流“基礎(chǔ)設(shè)施”優(yōu)勢,使得網(wǎng)絡(luò)視聽行業(yè)不斷與教育、健康、旅游、制造等各行業(yè)交叉融合發(fā)展,推動形成“大視聽”的產(chǎn)業(yè)發(fā)展新生態(tài)。
隨著技術(shù)融合與產(chǎn)業(yè)融合相互促進(jìn),跨模態(tài)、多元化、邊界消融將成為重要特征。這一過程中,以系統(tǒng)思維布局新技術(shù)發(fā)展,打破阻礙競爭的壁壘至關(guān)重要。
(四)治理協(xié)調(diào)性有效性加強(qiáng),AI治理框架逐步完善
在人工智能快速發(fā)展過程中,如何做好AI技術(shù)應(yīng)用與治理的平衡,建立合理審慎的AI倫理和治理框架,塑造負(fù)責(zé)任的AI生態(tài),越來越受到社會各界的重視。
在當(dāng)前政策措施基礎(chǔ)上,下一階段圍繞人工智能技術(shù)應(yīng)用的敏捷治理、分類分級管理將進(jìn)一步加強(qiáng),人工智能治理體系逐步完善。在智能視聽方面,尤其需要統(tǒng)籌推進(jìn)“技術(shù)”監(jiān)管與“內(nèi)容”治理,實現(xiàn)發(fā)展與規(guī)范的動態(tài)平衡。近年來,我國頒布《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》《網(wǎng)絡(luò)數(shù)據(jù)安全管理條例(征求意見稿)》《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》和《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》《生成式人工智能服務(wù)管理暫行辦法》等規(guī)定,從宏觀上劃定了人工智能技術(shù)發(fā)展的紅線,但就細(xì)節(jié)而言,涉及應(yīng)用安全、知識產(chǎn)權(quán)保護(hù)等探索尚處于起步階段,仍需根據(jù)現(xiàn)實發(fā)展不斷細(xì)化和完善。
行業(yè)共治在人工智能治理框架中的作用尤為重要。仍需倡導(dǎo)相關(guān)行業(yè)聯(lián)盟、龍頭企業(yè)、研究機(jī)構(gòu)以及標(biāo)準(zhǔn)組織等發(fā)揮資源整合優(yōu)勢,圍繞人工智能的合法合規(guī)應(yīng)用和健康有序發(fā)展聯(lián)合制定行業(yè)制度規(guī)范,共同打造人工智能良性發(fā)展生態(tài)。
2023年,面對人工智能新浪潮帶來的巨大沖擊,不少聲音也提醒,技術(shù)催動的深遠(yuǎn)生態(tài)性變革尚需時日,產(chǎn)業(yè)仍需在喧囂中沉淀發(fā)展、平穩(wěn)落地,一方面防止“高估一項技術(shù)在短期內(nèi)的影響”,另一方面防止“低估其在長期內(nèi)的影響”,人工智能賦能視聽行業(yè)的創(chuàng)新探索仍任重道遠(yuǎn)。
(本報告由人民網(wǎng)研究院出品。 報告執(zhí)筆人:人民網(wǎng)研究院研究員劉珊)
- 免責(zé)聲明
- 本文所包含的觀點(diǎn)僅代表作者個人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認(rèn)可。 交易和投資涉及高風(fēng)險,讀者在采取與本文內(nèi)容相關(guān)的任何行動之前,請務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。