文生視頻爆發(fā)生數(shù)科技商業(yè)化重點(diǎn)仍在B端市場(chǎng)
《科創(chuàng)板日?qǐng)?bào)》9月12日訊(記者 張洋洋) “我們目前判斷下來(lái)的話(huà),B端市場(chǎng)有比較明確直接的需求,所以B端是我們長(zhǎng)期非常重點(diǎn)的一個(gè)方向。C端的話(huà),我們也在不斷的探索過(guò)程中。”昨日,在生數(shù)科技媒體開(kāi)放日活動(dòng)上,當(dāng)問(wèn)及產(chǎn)品商業(yè)化時(shí),生數(shù)科技CEO唐家渝如是回復(fù)到。
4月底,由生數(shù)科技和清華大學(xué)聯(lián)合研發(fā)的國(guó)內(nèi)首個(gè)純自研原創(chuàng)視頻大模型Vidu面向全球發(fā)布,7月底正式上線,全面開(kāi)放使用,該模型生成視頻時(shí)長(zhǎng)最長(zhǎng)為16秒,公司稱(chēng)全面對(duì)標(biāo)Sora。
按照唐家渝的說(shuō)法,Vidu目前采取SaaS訂閱和API接口兩種商業(yè)化模式。從收入角度來(lái)看,目前階段B端市場(chǎng)收入更大,C端增長(zhǎng)曲線“非常高”。
Sora之后,今年上半年,大模型領(lǐng)域最熱鬧的細(xì)分賽道要數(shù)文生視頻,國(guó)內(nèi)AI廠商加速趕來(lái),一眾產(chǎn)品在6-7月迎來(lái)發(fā)布更新潮。
不過(guò),做好文生視頻這件事并不簡(jiǎn)單,這一點(diǎn)從OpenAI在今年初發(fā)布了Sora之后,仍未正式對(duì)外開(kāi)放便可見(jiàn)一斑。
這主要是因?yàn)楫?dāng)前的視頻生成技術(shù)產(chǎn)出的結(jié)果與用戶(hù)期望之間仍存在較大差距,這些模型在理解和應(yīng)用物理規(guī)則方面表現(xiàn)不足,并且在生成過(guò)程中缺乏有效的可控性。
在讓視頻生成更加穩(wěn)定、可控這件事情上,昨日,Vidu更新了一項(xiàng)功能,全球首發(fā)“主體參照”功能,該功能能夠?qū)崿F(xiàn)對(duì)任意主體的一致性生成,讓視頻生成更加穩(wěn)定、可控。
所謂“主體參照”,就是允許用戶(hù)上傳任意主體的一張圖片,Vidu就能夠鎖定該主體的形象,通過(guò)描述詞任意切換場(chǎng)景,輸出主體一致的視頻。
唐家渝表示, "主體參照”這一全新功能的上線,代表著AI完整敘事的開(kāi)端,AI視頻創(chuàng)作也將邁向更高效、更靈活的階段。無(wú)論是制作短視頻、動(dòng)畫(huà)作品還是廣告片,在敘事的藝術(shù)中,一個(gè)完整的敘事體系是“主體一致、場(chǎng)景一致、風(fēng)格一致”等要素的有機(jī)結(jié)合。
可以看到的是,生數(shù)科技寄希望于“主體參照”功能,在競(jìng)爭(zhēng)激烈的視頻大模型領(lǐng)域維持競(jìng)爭(zhēng)優(yōu)勢(shì)。
視頻作為圖像模態(tài)的再擴(kuò)展,將AIGC的技術(shù)推向高潮,也讓AIGC的應(yīng)用離大眾越來(lái)越近。在技術(shù)路徑上,國(guó)內(nèi)視頻生成的主流選擇是基于Transformer架構(gòu)的擴(kuò)散模型,這一架構(gòu)能使模型在處理語(yǔ)言、計(jì)算機(jī)視覺(jué)、圖像生成等領(lǐng)域表現(xiàn)出擴(kuò)展能力。
商業(yè)方面,從公開(kāi)情況來(lái)看,國(guó)內(nèi)外廠商的商業(yè)選擇上還是比較類(lèi)似,即便是像Sora、Runway,都在積極擁抱好萊塢,或者服務(wù)廣告企業(yè)。
在技術(shù)路線和商業(yè)化路徑上,行業(yè)內(nèi)幾乎已經(jīng)處在同質(zhì)化狀態(tài)。
對(duì)此,唐家渝認(rèn)為,在技術(shù)路線上,現(xiàn)在處于底層架構(gòu)收斂的狀態(tài),同質(zhì)化并不代表大家所有進(jìn)展的能力都相同。因?yàn)樵诩軜?gòu)這一大的基礎(chǔ)上,中間有非常多的環(huán)節(jié),例如怎么有效地去進(jìn)行Scale up,例如視頻如何有效的壓縮,都會(huì)有非常多的一些技巧、實(shí)踐的經(jīng)驗(yàn)在里面。包括說(shuō)生成的速度,在保證質(zhì)量的情況下能否保證快速,這些其實(shí)都是在所謂架構(gòu)收斂的大思路下,還涉及到的非常多的算法技巧、算法難點(diǎn),包括算法工程化的一些難點(diǎn),這些是導(dǎo)致大家差異性的主要原因。
“商業(yè)化選擇雖然比較類(lèi)似,但整體AI生成視頻領(lǐng)域,還處于發(fā)展前期,國(guó)際頭部玩家在齊頭并進(jìn)或者叫共同擴(kuò)大市場(chǎng)。”唐家渝表示,“關(guān)于目前的客戶(hù)選擇,生數(shù)科技會(huì)關(guān)注企業(yè)和視頻的相關(guān)性,最直接用于各種視頻內(nèi)容創(chuàng)作的,以及天然與視頻內(nèi)容相關(guān)的領(lǐng)域,比如廣告、游戲、短劇和影視等。”
面對(duì)激烈的市場(chǎng)競(jìng)爭(zhēng),他坦言,技術(shù)仍是關(guān)鍵因素,目前的視頻生成只是初步符合物理規(guī)律,還有很高的天花板需要突破,比如更強(qiáng)的模型能力以及更多模態(tài)的協(xié)同生成。
- 免責(zé)聲明
- 本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴(lài)本文觀點(diǎn)而產(chǎn)生的任何金錢(qián)損失負(fù)任何責(zé)任。