大模型生成RPG游戲,情節(jié)角色DIY!谷歌出品,一作上海交大校友
根據(jù)初始用戶輸入,它能設(shè)置游戲模擬環(huán)境,并在環(huán)境中生成角色動作。

來自谷歌,北卡羅來納大學(xué)教堂山分校新研究,他們嘗試的第一款游戲叫做Unbounded,靈感來自《模擬人生》。
用戶可以自定義角色的人生,比如這位名叫Archibus的巫師,他的饑餓度、能量和興趣度會隨著環(huán)境進行相應(yīng)更新。

角色可以自由探索各種環(huán)境,進行各種可能的動作和互動。游戲按照交互速度,每秒就會刷新一次。
用大模型生成無限游戲研究團隊引入了一個生成無限游戲這個概念。
“無限游戲”指以延續(xù)游戲為目的游戲,生成無限游戲就是即通過使用生成式模型,超越傳統(tǒng)受限的視頻游戲。
無界(Unbounded)就是一款完全由生成式模型封裝的角色生活模擬游戲。你可以虛擬世界中通過喂養(yǎng)、玩耍和引導(dǎo)角色,與他互動,但需要保證它的健康狀態(tài)。

基于此,他們生成游戲的主要屬性包括:角色個性化、游戲環(huán)境生成、開放式互動、實時生成。

在語言方面,他們開發(fā)了一個基于LLM的游戲引擎。這個游戲引擎能夠保持游戲機制的一致性,生成連貫的敘事,并實時生成上下文角色響應(yīng)。

他們的專業(yè)模型是在兩個協(xié)作性強的LLM Agent自動生成的數(shù)據(jù)基礎(chǔ)上進行微調(diào)的,無需人工注釋。
以Gemma-2B為例,經(jīng)過微調(diào)之后的游戲引擎,在狀態(tài)更新、環(huán)境相關(guān)性、故事連貫性和指令遵循方面都表現(xiàn)得更為出色。

在視覺生成方面,他們引入了新型動態(tài)區(qū)域圖像提示適配器(Regional IP-Adapter)。該適配器可在保持多幅圖像視覺一致性的同時,生成一致的角色和環(huán)境。
具體來說,它將游戲環(huán)境和角色外觀作為圖像生成的條件,而游戲環(huán)境和角色外觀則由交叉注意力層中注意力輸出所獲得的動態(tài)掩碼調(diào)制。
這是為了減少環(huán)境和角色之間的干擾,使兩者都能可靠地出現(xiàn)在場景中。

與之前的方法相比,他們的區(qū)域IP適配器采用了區(qū)塊丟棄技術(shù),能持續(xù)生成具有高度字符一致性和環(huán)境一致性的圖像。


這篇研究主要來自谷歌以及北卡羅來納大學(xué)教堂山分校團隊。

其中一作Jialu Li目前是北卡羅來納大學(xué)教堂山分校五年級博士生,本科畢業(yè)于上海交大,隨后在康奈爾大學(xué)獲得碩士學(xué)位。

對于這項研究,谷歌導(dǎo)師Nataniel Ruiz興奮表示了對生成游戲的看好:未來大多數(shù)游戲都將完全由生成游戲組成。


論文鏈接:https://arxiv.org/abs/2410.18975https://generative-infinite-game.github.io/參考鏈接:[1]https://x.com/JialuLi96/status/1849869554719260721[2]https://x.com/natanielruizg/status/1849807021131874583
- 免責(zé)聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風(fēng)險,讀者在采取與本文內(nèi)容相關(guān)的任何行動之前,請務(wù)必進行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產(chǎn)生的任何金錢損失負任何責(zé)任。