首頁 > AI資訊 > 最新資訊 > AIGC邁入3D時代“AI教母”李飛飛創業項目首個成果“虛擬世界生成器”來了

AIGC邁入3D時代“AI教母”李飛飛創業項目首個成果“虛擬世界生成器”來了

科創板日報    2024-12-04

  當地時間12月3日,“AI教母”李飛飛聯合創辦的空間智能初創企業World Labs(世界實驗室)展示首個成果——一張圖、一句話就能生成3D世界的AI系統,堪稱“虛擬世界生成器”。World labs將其稱為邁向空間智能的第一步。

  其亮點在于:直接生成3D場景,且場景具有交互性、可編輯、可擴圖。

  交互性:用戶可以通過W/A/S/D鍵來控制上下左右視角,或者用鼠標拖動畫面探索所生成的世界,不過目前的可移動范圍仍然受限于較小的區域。

  可編輯:該工具配備了可控的攝像機效果和可調節的模擬景深,用戶可改變其中物體顏色、動態調整背景光影、手動變焦、調節景深、在場景中插入其他對象、添加動畫效果。

  可擴圖:這指該AI工具的可預測3D場景能力,可預測3D場景是利用AI技術對3D空間中的物體、環境結構及其動態變化進行預測和理解的能力,即讓AI工具僅憑部分圖片就能“擴圖”,想象出整個3D場景。

  將梵高、霍珀、修拉和康定斯基等作家的知名畫作中的場景擴展

  其中,可預測3D場景,是將World Labs與其他致力于3D內容生成的AI公司區別開的主要能力,World Labs表示,大多數生成模型都會預測像素,而預測 3D 場景有許多好處:

  持久現實:3D場景一旦生成,它就會一直存在。即使你把視線移開然后又回來,場景也不會改變。

  實時控制:3D場景生成后,用戶可以在其中實時移動。你可以仔細觀察花朵的細節,也可以窺視藏在角落里的物體。

  正確的幾何形狀:生成的世界遵循 3D 幾何的基本物理規則。它們兼具真實感和深度感,與某些AI生成視頻的夢幻感形成了鮮明對比。

  空間智能 AI領域的下一個“北極星”

  李飛飛對空間智能的定義是:空間智能是機器在3D空間和時間中感知、推理和行動的能力。在她看來,空間智能是AI領域的下一個前沿技術方向。

  今年9月份,在成功融資2.3億美元后,由著名計算機科學家、斯坦福大學人工智能實驗室聯合主任、斯坦福大學教授李飛飛聯合創辦的World Labs正式啟動。據介紹,World Labs的目標是開發一種能夠理解實體世界的模型。今年7月,有消息稱在完成兩輪融資后,World Labs的估值已超過10億美元,該公司的投資機構可以說是耳熟能詳,包括安德森·霍羅威茨(Andreessen Horowitz,又名a16z)、Adobe、AMD、Databricks、英偉達、AI基金Radical Ventures等。

  同月,在接受a16z的訪談時,李飛飛表示,空間智能是她的下一個北極星,該技術將改變AI的發展進程。她認為,空間智能與語言智能一樣重要,甚至在某些方面可能更古老、更基礎,AI的發展不會局限于處理平面圖像或文本,而是會邁向對三維世界的理解,這是智能發展的自然延伸。

  電影、游戲等內容創作將是空間智能技術的重要應用領域,該技術有望降低3D內容制作的成本、激發更多的沉浸式體驗。World Labs的目標客戶便包括視頻游戲開發商和電影制片廠。除了互動場景之外,World Labs還計劃開發一些對藝術家、設計師、開發人員、電影制作人和工程師等專業人士有用的工具。

  李飛飛還補充了增強現實(AR)和虛擬現實(VR)的應用場景。她曾提到:“這種技術將成為AR/VR的‘操作系統’,幫助人類增強能力。”她舉例說,未來,佩戴AR眼鏡的人可能不需要任何專業技能,就能修理汽車或完成復雜的操作。通過空間智能,虛擬世界與現實世界的融合將大大增強人類與機器的互動能力。

  李飛飛的博士生、World Labs聯合創始人賈斯汀·約翰遜則指出,隨著這項技術的成熟,未來我們可能不再需要使用手機、平板等不同尺寸的屏幕。他表示:“如果你能夠將虛擬內容與物理世界無縫融合,那么對所有這些屏幕的需求就會減少。”

(文章來源:科創板日報)

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章