3D版抖音有望誕生,零門檻3D創(chuàng)作時(shí)代來臨
全球用戶累計(jì)生成700萬3D模型,海外上千用戶上傳自己生成的3D動(dòng)畫短片……
這就是3D大模型公司VAST及其旗下3D大模型“Tripo”系列的傲人成果。
相比于文字生成、圖片生成、視頻生成,3D生成技術(shù)的發(fā)展更像AIGC賽道的隱形前行者,但其實(shí)到了今天,輸入語段文字或圖片,已經(jīng)可以得到一個(gè)完整的、有價(jià)值的、可用的3D的模型。

在新火種MEET 2025智能未來大會(huì)上,VAST創(chuàng)始人兼CEO宋亞宸帶來了他所看到的3D生成的世界,以及3D生成賽道的新的機(jī)遇。
為了完整體現(xiàn)宋亞宸的思考,在不改變原意的基礎(chǔ)上,新火種對演講內(nèi)容進(jìn)行了編輯整理,希望能給你帶來更多啟發(fā)。
MEET 2025智能未來大會(huì)是由新火種主辦的行業(yè)峰會(huì),20余位產(chǎn)業(yè)代表與會(huì)討論。線下參會(huì)觀眾1000+,線上直播觀眾320萬+,獲得了主流媒體的廣泛關(guān)注與報(bào)道。
核心觀點(diǎn)梳理技術(shù)層面上,3D生成的發(fā)展分為靜態(tài)內(nèi)容生成、動(dòng)態(tài)內(nèi)容生成、人人零門檻可用三個(gè)階段。有了創(chuàng)作平臺(tái)后,有機(jī)會(huì)誕生3D版抖音。明年,Tripo的成熟度會(huì)達(dá)到1080p、甚至4k的水平。預(yù)計(jì)到2026年,原生AI 3D創(chuàng)作者會(huì)探索出一些新的3D內(nèi)容范式。3D生成會(huì)帶來一種新的交互形式,就像成語“言出法隨”形容的那樣。……(以下為宋亞宸演講全文)
3D生成到什么階段了?我們公司VAST是一家做3D大模型的公司,希望大家能夠在我的分享當(dāng)中找到自己喜歡的一些有意思的點(diǎn)。
先給大家介紹一下什么叫作3D大模型。
我們的3D大模型叫作Tripo,它的功能非常簡單,輸入一段文字,或者說一張圖片,當(dāng)然也可以同時(shí)輸入圖片、視頻等不同模態(tài),就能輸出一個(gè)完整的、有價(jià)值的、可用的3D的模型。
它的表達(dá)方式是mesh,帶貼圖材質(zhì)PBR,并且可以在像游戲、動(dòng)畫、元宇宙、XR、MR,包括數(shù)字孿生、仿真模擬等等行業(yè)里去用起來。

同時(shí)我們做了很多有意思的風(fēng)格化,比如像素化、樂高化、網(wǎng)絡(luò)化等,可以讓大家端到端地在各個(gè)行業(yè)里面使用,例如3D打印、鞋服家具等場景。
我們不只做了靜態(tài)的模型,還做了骨骼的自動(dòng)綁定,動(dòng)作的生成,也就是用戶可以在3D空間里進(jìn)行實(shí)時(shí)交互,和朋友社交,一起探索新的世界。
相較于語言大模型、圖片大模型、視頻大模型,3D生成模型(及背后技術(shù))可能比較新。
2024年年初Tripo1.0剛剛發(fā)布的時(shí)候,我們認(rèn)為它的水平類似于手機(jī)攝像頭360p分辨率的水平;現(xiàn)在Tripo2.0上線,成熟度已經(jīng)達(dá)到了類似于720p分辨率的水平;明年,Tripo的成熟度會(huì)達(dá)到1080p、甚至4k的水平。
雖然3D生成技術(shù)現(xiàn)在還是半成熟的狀態(tài),但是發(fā)展速度是非常快的。
3D生成技術(shù)的三步走計(jì)劃來到新火種的MEET2025大會(huì),我們想“炫耀”一下我們的論文。
2023年,VAST發(fā)了一系列論文,包括六投六中的CVPR,還有ECCV 、SIGGRAPH;今年又發(fā)了幾十篇新的論文。剛剛在東京結(jié)束的SIGGRAPH Aisa,我們拿了Best Paper Honorable Mention,技術(shù)團(tuán)隊(duì)上周剛剛從東京領(lǐng)完獎(jiǎng)回來。
VAST還做了很多開源的社區(qū)貢獻(xiàn),這個(gè)也非常關(guān)鍵。
我們開源的項(xiàng)目包括世界最大的3D生成算法框架ThreeStudio、圖生3D的鼻祖Wonder3D,還和Stability AI一起開源了TripoSR。最近又開源了一些新的項(xiàng)目,也歡迎大家關(guān)注。
技術(shù)層面上,我們認(rèn)為主要分3步走——
第一步是靜態(tài)的內(nèi)容生成。這個(gè)很好理解,就像生成一個(gè)個(gè)雕塑。
第二步是動(dòng)態(tài)的內(nèi)容生成。原本靜態(tài)的雕塑可以動(dòng)起來,和用戶互動(dòng)(甚至可以把雕塑的頭擰下來當(dāng)頭踢)。
第三步,我們認(rèn)為明年年底之前,每個(gè)人都可以零門檻、零成本地進(jìn)行實(shí)時(shí)的3D內(nèi)容創(chuàng)作。

大家可能會(huì)問,除了愛玩游戲,我本人還有什么別的理由要要投身3D生成技術(shù)領(lǐng)域?
3D其實(shí)非常特殊。文字、圖片、視頻、3D包括音頻這些信息載體或內(nèi)容媒介中,3D是一直缺乏屬于自己的UGC內(nèi)容平臺(tái)的內(nèi)容媒介的。
所以說我們認(rèn)為,3D版抖音是有機(jī)會(huì)誕生的。
可以看到,不管在移動(dòng)互聯(lián)網(wǎng)時(shí)代還是互聯(lián)網(wǎng)時(shí)代,文字、圖片、視頻的UCG內(nèi)容平臺(tái),一直是巨頭之所以為巨頭的關(guān)鍵路徑。那么3D是不是也會(huì)有自己的類抖音平臺(tái)?
經(jīng)過VAST自己和一些合作伙伴的大量嘗試,我們發(fā)現(xiàn)3D現(xiàn)在的創(chuàng)作門檻還是太高了,還是缺乏一個(gè)屬于自己的“攝像頭”——你很難想象沒有手機(jī)攝像頭,你怎么玩小紅書、怎么用抖音去分享你自己每天的生活。
3D是不是有機(jī)會(huì)先出現(xiàn)一個(gè)大眾級(jí)別的創(chuàng)作工具,降低用戶創(chuàng)作的門檻、降低用戶創(chuàng)作的成本,并且讓大家實(shí)時(shí)進(jìn)行創(chuàng)作,才有機(jī)會(huì)誕生一個(gè)所謂的3D版抖音。
3D版抖音誕生需要什么樣的創(chuàng)作工具?那么這個(gè)大眾級(jí)別的創(chuàng)作工具是什么?就是剛剛提到的3D大模型。
我們認(rèn)為在第一階段,也就是截至快結(jié)束的今年,3D生成技術(shù)已經(jīng)達(dá)到720p分辨率水平,并聚攏百萬級(jí)開發(fā)者;到了2025年,開發(fā)者數(shù)量會(huì)達(dá)到千萬級(jí)別。
這些AI 3D的原生創(chuàng)作者,不會(huì)再去做很重磅的游戲。就像之前米哈游創(chuàng)始人蔡浩宇講過的,未來0.0001%的頂尖人才還是會(huì)繼續(xù)做游戲,但99.99%的人其實(shí)轉(zhuǎn)向根據(jù)自己的興趣隨意創(chuàng)造游戲。
到2026年,這些原生的AI 3D創(chuàng)作者會(huì)探索出一些新的3D內(nèi)容范式,這就需要有一個(gè)全新的UGC 3D內(nèi)容平臺(tái)去承載和分發(fā)。
而且現(xiàn)在還處于第一階段時(shí),3D生成已經(jīng)在一些場景里實(shí)際落地了,比如說傳統(tǒng)的CG、游戲、動(dòng)畫、影視、虛擬制作,還有傳統(tǒng)的TMT,涉及到直播、教育、電商等等;還包括傳統(tǒng)的工業(yè)、3D打印、工業(yè)設(shè)計(jì)、鞋服、家居、首飾、玩具、文具、燈具、香薰、蠟燭、文創(chuàng)、食品等行業(yè);當(dāng)然還包括所謂的新興行業(yè),也就是空間智能(這個(gè)行業(yè)會(huì)得到長足的發(fā)展),比如說元宇宙、XR、MR、具身智能的仿真模擬、數(shù)字孿生、數(shù)字人等。
3D生成已經(jīng)解決了一些核心的問題:
原來我們做3D模型,需要幾百美金,便宜點(diǎn)也需要幾十美金。現(xiàn)在你去做一個(gè)3D模型,只需要0元。原來需要幾天甚至幾周時(shí)間做一個(gè)3D模型,現(xiàn)在只需要幾十秒。原來需要高昂的設(shè)備的成本,需要專業(yè)的兩三年建模經(jīng)驗(yàn)的建模師,現(xiàn)在零門檻。同時(shí)我們還可以實(shí)現(xiàn)規(guī)模化和個(gè)性化。

目前,全世界前十的3D打印公司里,超過一半是我們的客戶,并且已經(jīng)上線使用了。
原來的3D打印在全世界有幾百萬人群,他們都不會(huì)建模。現(xiàn)在每個(gè)人都能用AI 3D的能力建自己的模型,生成一條賽博朋克的魚,或者皮卡丘和鋼鐵俠的結(jié)合體,生成后再打印出來,就擁有自己獨(dú)一無二的手辦了——這是完成定制化的需求。
于是,有很多首飾、手辦、積木玩具的廠商,可以利用AI 3D快速生成自己想要的款式,然后放到市面上看大家的反饋。尤其最近要過年了,還能快速做一些定制化的toB禮盒。
除了用于商業(yè)化場景,其實(shí)每一個(gè)人都可以做自己想要的3D的工業(yè)設(shè)計(jì)和產(chǎn)品需求,包括我自己。
所有的普通用戶都可以在Tripo3D.AI里生成自己想要的工業(yè)設(shè)計(jì),而且和想象中一模一樣,然后直接打印出來,比如做一套自己的國際象棋棋子。
今年年中,VAST在海外有上千個(gè)用戶上傳了自己用Tripo生成的一部部動(dòng)畫。
這就是3D生成現(xiàn)在已經(jīng)達(dá)到的成熟度。
我不會(huì)建模,沒有學(xué)過Blander、Maya、3D Max,也不會(huì)Unity或者UE,我也不是一個(gè)3D內(nèi)容創(chuàng)作者。但我自己嘗試借用Tripo的能力,花了一個(gè)早上的時(shí)間,做了人生中第一部動(dòng)畫。
所以我敢說,現(xiàn)在已經(jīng)能夠讓每個(gè)人零門檻地去創(chuàng)作這么有意思的3D內(nèi)容。

我們的用戶里有一個(gè)哥們特別有意思。
他用Tripo生成了幾百個(gè)3D模型,拼成了一個(gè)太空站,做了倆視頻,覺得自己很牛,發(fā)了一個(gè)推特,馬斯克覺得也很牛,就轉(zhuǎn)了,在全球范圍內(nèi)有1億的播放量。
還有另一個(gè)創(chuàng)作者也非常有意思,他用我們的3D生成能力搭建了一個(gè)自己的XR空間。
他把每天遇到的開心、糟心的事情告訴AI,AI根據(jù)內(nèi)容生成各種各樣有意思的手辦、城堡,像是一本3D日記。他既可以邀請別人來逛他的3D日記本,也可以邀請大家來這里一起創(chuàng)作。
我想說的是,在XR的時(shí)代,當(dāng)虛擬現(xiàn)實(shí)世界到來了以后,我們看到3D生成會(huì)帶來一種新的交互形式,就像一個(gè)成語形容的那樣,“言出法隨”。
在虛擬現(xiàn)實(shí)的世界里,很重要的一個(gè)核心技術(shù),就是成熟的3D生成技術(shù)。
最后介紹一下VAST的slogan:
感謝大家的時(shí)間!
- 免責(zé)聲明
- 本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。