AI視頻生成:技術(shù)革新與商業(yè)化的競(jìng)逐之路
導(dǎo)讀:2024年12月30日,愛詩(shī)科技旗下AI視頻生成模型PixVerse V3.5正式上線,其在生成速度、運(yùn)動(dòng)控制、動(dòng)畫效果等方面均取得明顯進(jìn)步,在PixVerse V3.5 Turbo極速生成模式下,最快5秒、平均10秒生成視頻,進(jìn)一步推動(dòng)AI視頻生成的普及。自2024年2月OpenAI首次發(fā)布AI視頻生成模型Sora以來,快手、字節(jié)跳動(dòng)、騰訊、谷歌等多家企業(yè)也相繼推出了AI視頻生成模型,行業(yè)競(jìng)爭(zhēng)愈加激烈。AI視頻生成現(xiàn)狀如何?商業(yè)化進(jìn)展如何?投融資情況如何?本文嘗試分析和探討。
01 AI視頻生成現(xiàn)狀
AI視頻生成是指利用深度學(xué)習(xí)、自然語言處理、計(jì)算機(jī)視覺等人工智能相關(guān)技術(shù),自動(dòng)生成視頻內(nèi)容的過程。相較傳統(tǒng)視頻的制作,AI視頻生成產(chǎn)品具有以下特點(diǎn):(1)高效性:AI視頻生成產(chǎn)品可在短時(shí)間內(nèi)快速產(chǎn)出視頻,大幅節(jié)省人力和時(shí)間成本。例如,制作一個(gè)常規(guī)的宣傳視頻,傳統(tǒng)視頻的制作可能需數(shù)天甚至數(shù)周時(shí)間,但AI視頻生成產(chǎn)品僅需幾分鐘到幾小時(shí);(2)靈活性:用戶僅需調(diào)整文本描述、參數(shù)設(shè)置等,AI視頻生成產(chǎn)品便可根據(jù)用戶不同的需求和輸入條件生成多元化的視頻內(nèi)容;(3)創(chuàng)新性:AI技術(shù)為視頻創(chuàng)作帶來豐富的思路和風(fēng)格,幫助用戶突破傳統(tǒng)創(chuàng)作的限制。
AI視頻生成技術(shù)的發(fā)展經(jīng)歷了多個(gè)階段,從最初的圖像拼接生成階段,到GAN(生成對(duì)抗網(wǎng)絡(luò))、VAE(變分自編碼器)、Flow-based(流模型)的應(yīng)用,再到自回歸和擴(kuò)散模型的興起。早期的視頻生成主要依賴于圖像拼接技術(shù),通過將靜態(tài)圖像序列拼接成視頻流,但這種方法生成的視頻質(zhì)量較低,連貫性較差。隨著深度學(xué)習(xí)技術(shù)的突破,2016年后GAN、VAE、Flow-based等技術(shù)開始被應(yīng)用于視頻生成,生成視頻的質(zhì)量和連貫性得到顯著提升。2020年以來,自回歸模型和擴(kuò)散模型的出現(xiàn)進(jìn)一步推動(dòng)AI視頻生成技術(shù)的發(fā)展,使其生成更加逼真和連貫的視頻內(nèi)容,且應(yīng)用場(chǎng)景更為廣泛。
當(dāng)前AI視頻生成技術(shù)逐步從實(shí)驗(yàn)階段邁向?qū)嵱没蔀锳I領(lǐng)域的重要分支。快手、字節(jié)跳動(dòng)、OpenAI、Runway等眾多國(guó)內(nèi)外企業(yè)和研究機(jī)構(gòu)紛紛投入大量資源進(jìn)行技術(shù)研發(fā)和產(chǎn)品創(chuàng)新,推動(dòng)AI視頻生成行業(yè)的快速發(fā)展。例如,OpenAI發(fā)布的Sora可根據(jù)文本、圖像和視頻輸入生成高質(zhì)量的視頻,其采用Transformer+Diffusion模型的組合,實(shí)現(xiàn)視頻生成的連貫性和準(zhǔn)確性,驗(yàn)證了Transformer和Diffusion模型結(jié)合的有效性,為AI視頻生成的研究提供新的思路和方向。
盡管OpenAI率先發(fā)布Sora,在AI視頻生成領(lǐng)域占據(jù)先發(fā)優(yōu)勢(shì),但國(guó)內(nèi)企業(yè)不斷追趕,模型性能持續(xù)提升,目前愛詩(shī)科技的PixVerse、快手的可靈等AI視頻生成模型在綜合性能上表現(xiàn)出色,甚至在某些方面已超越Sora。據(jù)AGI-Eval(上海交通大學(xué)、同濟(jì)大學(xué)等高校和機(jī)構(gòu)合作發(fā)布的大模型評(píng)測(cè)社區(qū)),2024年12月,PixVerse-V3、Kling1.5、Video-01的得分(評(píng)測(cè)維度包括視頻-文本一致性、視頻質(zhì)量、運(yùn)動(dòng)質(zhì)量等)超越Sora。
圖表 1:2024年12月文生視頻模型評(píng)測(cè)榜單Top10
數(shù)據(jù)來源:AGI-Eval、RimeData來覓數(shù)據(jù)整理
AI視頻生成領(lǐng)域參與者眾多,行業(yè)仍處于早期階段。AI視頻生成的主要參與者包括:
(1)大型互聯(lián)網(wǎng)/科技企業(yè):騰訊、字節(jié)跳動(dòng)、快手、谷歌等全球互聯(lián)網(wǎng)/科技企業(yè)憑借自身在人工智能領(lǐng)域的深厚積累和強(qiáng)大的技術(shù)實(shí)力,先后推出了多個(gè)具有影響力的AI視頻生成模型;
(2)初創(chuàng)企業(yè):愛詩(shī)科技、生數(shù)科技、OpenAI、Pika、Runway等眾多初創(chuàng)公司具有創(chuàng)新的思維和技術(shù)實(shí)力,在AI視頻生成領(lǐng)域進(jìn)行積極探索和創(chuàng)新,為市場(chǎng)注入新鮮血液和活力;
(3)研究機(jī)構(gòu):央國(guó)企搭建的 AI 研究院和新型研發(fā)機(jī)構(gòu),如 TeleAI(中國(guó)電信人工智能研究院)、智源研究院等,在政策支持和資源投入方面具有優(yōu)勢(shì),致力于推動(dòng) AI 視頻生成技術(shù)的研發(fā)和應(yīng)用。
但眾多企業(yè)的入局,也在加劇AI視頻領(lǐng)域的競(jìng)爭(zhēng)程度。自2024年2月Sora發(fā)布以來,AI視頻生成的產(chǎn)品已有較大的進(jìn)步,基礎(chǔ)生成時(shí)長(zhǎng)不斷增加。同時(shí),這些AI視頻生成產(chǎn)品在分辨率、幀率等方面也有較大的提高,生成的視頻效果持續(xù)提升。AI視頻行業(yè)技術(shù)不斷革新,產(chǎn)品迭代速度快,整體市場(chǎng)競(jìng)爭(zhēng)格局仍較為分散。
02 AI視頻生成商業(yè)化進(jìn)展
現(xiàn)階段,AI視頻生成領(lǐng)域正在不斷探索商業(yè)化路徑,主要通過To C端和To B端兩種服務(wù)模式實(shí)現(xiàn)商業(yè)化。To C端主要通過提供付費(fèi)訂閱服務(wù),如快手可靈、字節(jié)即夢(mèng)、智象未來(HiDream.ai)等,這些平臺(tái)提供不同等級(jí)的訂閱服務(wù),如免費(fèi)版、標(biāo)準(zhǔn)版、高級(jí)版、尊享版,價(jià)格為每月數(shù)元到數(shù)百元不等。To B端則主要通過API接口和解決方案服務(wù),如快手可靈、生數(shù)科技、愛詩(shī)科技等,服務(wù)領(lǐng)域涵蓋了影視、互聯(lián)網(wǎng)、營(yíng)銷廣告等,價(jià)格為每月數(shù)十元到數(shù)萬元不等。
部分AI視頻生成產(chǎn)品在商業(yè)化方面已取得初步成果。例如,愛詩(shī)科技的核心AI視頻生成產(chǎn)品PixVerse在全球的用戶數(shù)累計(jì)已超1,200萬,月活躍用戶數(shù)近600萬,其通過C端產(chǎn)品功能不斷優(yōu)化和拓展,如內(nèi)置數(shù)十種特效模版等降低用戶使用門檻來實(shí)現(xiàn)用戶增長(zhǎng)和商業(yè)變現(xiàn)。
快手可靈累計(jì)服務(wù)用戶超600萬,累計(jì)生成超6,500萬個(gè)視頻、1.75億張圖片,截至2024年第三季度,可靈的商業(yè)化單月流水超千萬人民幣。HeyGen在2022年9月推出AI視頻創(chuàng)作應(yīng)用后,7個(gè)月內(nèi) ARR(年度經(jīng)常性收入)達(dá)到100萬美元,在2023年底其ARR達(dá)1,800萬美元。愛詩(shī)科技、快手可靈、HeyGen的市場(chǎng)表現(xiàn),表明了市場(chǎng)對(duì)AI視頻生成具有較大的需求。
但AI視頻生成長(zhǎng)期看仍面臨商業(yè)化困境。在產(chǎn)品層面,AI視頻生成產(chǎn)品單次生成的視頻時(shí)長(zhǎng)較短(通常不超過60秒),等待時(shí)間較長(zhǎng),同時(shí)視頻生成效果不穩(wěn)定,存在事實(shí)性錯(cuò)誤、一致性不足等問題,其復(fù)雜場(chǎng)景、真實(shí)感等也有待提升。此外,高昂的計(jì)算成本和服務(wù)器資源需求也限制了商業(yè)化進(jìn)程。在市場(chǎng)層面,普通用戶對(duì)視頻生成的需求低,自媒體從業(yè)者、視頻制作者等對(duì)視頻生成的需求高,但現(xiàn)有產(chǎn)品無法滿足其工作需求。而影視行業(yè)近3年來較為低迷,目前對(duì)AI視頻生成的需求也較低。
03 AI視頻生成市場(chǎng)規(guī)模
AI視頻生成的市場(chǎng)規(guī)模有望進(jìn)一步擴(kuò)大。據(jù)Fortune business insights測(cè)算,2024年全球AI視頻生成市場(chǎng)規(guī)模約為6.1億美元,預(yù)計(jì)到2032年將達(dá)25.6億美元,2024-2032年的年復(fù)合增長(zhǎng)率約為19.5%。AI視頻生成市場(chǎng)規(guī)模持續(xù)增長(zhǎng)的主要驅(qū)動(dòng)因素如下:
(1)AI生成視頻的成本低:AI生成視頻的成本遠(yuǎn)低于現(xiàn)有視頻內(nèi)容的制作成本,據(jù)量子位智庫(kù)數(shù)據(jù),頂級(jí)動(dòng)畫電影(迪士尼、皮克斯等制作)每分鐘的制作成本約達(dá)200萬美元,而AI視頻生成的內(nèi)容成本每分鐘約300美元,降本效果明顯;
(2)應(yīng)用場(chǎng)景廣泛:AI視頻已逐步在影視制作、廣告營(yíng)銷、短視頻、電商、動(dòng)漫等多個(gè)領(lǐng)域進(jìn)行應(yīng)用,有效提升各領(lǐng)域視頻制作的效果,同時(shí)降低制作成本;
(3)內(nèi)容視頻化是主流趨勢(shì):據(jù)QuestMobile顯示,截至2024年9月,移動(dòng)視頻行業(yè)總體月活用戶規(guī)模達(dá)11.36億,視頻已逐步成為流量的核心形式。此外,在2024年10月的中國(guó)移動(dòng)全球合作伙伴大會(huì)上,華為董事長(zhǎng)梁華表示,目前在線視頻流量占據(jù)網(wǎng)絡(luò)流量的70%,用戶對(duì)視頻內(nèi)容的依賴度高;
(4)技術(shù)創(chuàng)新:深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、自然語言處理等關(guān)鍵技術(shù)的突破,為AI視頻生成提供了強(qiáng)大的技術(shù)支持,使AI在視頻生成和處理時(shí)更為高效和準(zhǔn)確,進(jìn)而生成更加逼真的視頻內(nèi)容;
(5)政策支持:隨著AI產(chǎn)業(yè)的快速發(fā)展,國(guó)家和地方政府出臺(tái)了一系列政策文件,在資金、人才、政策等方面均給予大力支持,加快推動(dòng)人工智能相關(guān)技術(shù)與產(chǎn)業(yè)的融合。
圖表 2:2023-2032E全球AI視頻生成市場(chǎng)規(guī)模(億美元)
數(shù)據(jù)來源:Fortune business insights、RimeData來覓數(shù)據(jù)整理
04 AI視頻生成投融動(dòng)態(tài)
AI視頻生成領(lǐng)域技術(shù)不斷迭代升級(jí),逐步可生成視頻時(shí)長(zhǎng)更長(zhǎng)、場(chǎng)景更復(fù)雜的視頻內(nèi)容,應(yīng)用范圍進(jìn)一步拓寬,增加了投資者的信心。2024年,全球AI視頻生成領(lǐng)域融資規(guī)模合計(jì)已超600億元,整體以早期融資為主,行業(yè)仍處于快速發(fā)展階段。
同時(shí),知名投資機(jī)構(gòu)、產(chǎn)業(yè)投資基金、科技巨頭等多元投資主體參與AI視頻生成領(lǐng)域的融資,如啟明創(chuàng)投參與生數(shù)科技的融資,螞蟻集團(tuán)、北京市人工智能產(chǎn)業(yè)投資基金(北京國(guó)管旗下)參與愛詩(shī)科技的融資,百度參與生數(shù)科技的投資,不同背景的投資主體也為AI視頻生成領(lǐng)域的發(fā)展提供強(qiáng)大的資金支持和多元化的資源。
下表是2024年AI視頻生成賽道億元及以上投融事件,感興趣的讀者可以登錄Rime PEVC平臺(tái)獲取AI視頻生成領(lǐng)域全量融資案例、被投項(xiàng)目及深度數(shù)據(jù)分析。
圖表 3:2024年AI視頻生成賽道億元及以上投融事件
數(shù)據(jù)來源:RimeData來覓數(shù)據(jù)
- 免責(zé)聲明
- 本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。