
AI創作正快速演進。短短幾年內,生成式AI已從圖像生成發展至影片創作、AI驅動的3D建模,以及日益互動化的數位內容形式。隨著這些工具變得更加強大,創作者開始將目光從單一圖像或短片段,轉向更豐富、可探索、可修改且能重複使用的數位環境。
作為A1 Art更廣泛的創意AI生態系統的一部分,我們重點介紹來自VAST AI Research(Tripo3D背後的團隊)的最新研究更新。VAST AI Research推出了Project Eden,這是一個世界模型研究預覽,旨在探索持久、可編輯且互動的AI生成世界。
對A1 Art用戶而言,此版本值得關注,因為它指向了創意AI的更廣泛方向:從生成視覺輸出轉向構建能記住變化、支持互動並隨時間保持一致的世界。
為何世界模型重要
過去幾年,生成式AI在產出我們所見的內容(文字、圖像、影片和3D資產)方面不斷進步。世界模型則更深一層。它們不僅關乎視覺輸出,更關乎背後的環境——存在什麼、發生了什麼變化,以及隨時間保持不變的部分。
一個世界不僅僅是螢幕上顯示的內容。它包含物件、地點、動作、記憶、規則和後果。如果火被撲滅,它應該保持熄滅狀態。如果牆上留下記號,它應該保留在那裡。如果物件移出相機視野,它仍應存在於同一個世界中。如果多個用戶進入同一環境,他們不應與獨立的視覺模擬互動,而是與一個共享的底層現實互動。
這正是Project Eden圍繞的核心挑戰:維護世界的狀態,並允許該狀態隨著用戶或代理的行為而轉變。
現有方法的限制
許多現有的AI生成世界方法遵循兩種路徑之一。
第一種路徑是基於動作的影片生成。這些系統能根據用戶動作產生短期的視覺變化,但它們通常運作於像素層面。世界狀態常被壓縮為最近的畫面。一旦物件離開相機視野,模型可能需要從視覺記憶重建它,而非從穩定的底層世界狀態檢索。
這使得長期一致性變得困難,也難以支持真正的多人互動,因為缺乏多個用戶或代理能共享的統一世界狀態。
第二種路徑是靜態3D場景生成。這些系統能創建用戶可查看或導航的3D空間。然而,它們通常移除時間維度,且缺乏物理狀態轉變。靜態場景可被探索,但它並未真正作為一個活生生的環境運行。
一種路徑捕捉運動但缺乏持久記憶,另一種捕捉空間但缺乏動態演變。Project Eden選擇了不同的路線。


渲染前的狀態
Project Eden的核心概念是將世界狀態演變與視覺渲染原生解耦。
在真實環境中,房間不會因為沒人看就消失。被撲滅的火保持熄滅狀態。牆上留下的記號成為場景的一部分。兩名玩家在同一賽道上競速,並非觀看兩個獨立的現實,而是在一個共享世界中行動。
Project Eden遵循此邏輯。它維護一個獨立於任何單一相機視角的底層世界狀態,然後使用視覺渲染從特定視角展示該世界。
這改變了生成的邏輯。Project Eden不再僅問「下一幀應該是什麼樣子?」,而是提出更根本的問題:「世界的當前狀態是什麼?這個視角應如何觀察它?」
這一轉變正是持久AI生成世界得以實現的關鍵。
三層架構
Project Eden採用三層解耦架構來支持這種狀態優先的方法。
第一層是結構化狀態層。此層為世界構建長期的3D基礎,維護場景幾何、物件身份、物件屬性和全局事件邏輯。簡言之,這是世界「存在」的地方,它承載環境的客觀狀態並支持其持續演變。
第二層是條件接口層。此層作為狀態與渲染之間的橋樑,根據不同相機視角,將完整的底層3D狀態轉換為視覺生成的語義和幾何條件。由於所有渲染視圖來自同一世界狀態,系統能更好地保持跨相機和視角的一致性。
第三層是生成渲染層。此層基於底層世界狀態和接口層的條件,產出細緻的視覺輸出,添加視覺豐富性、動態細節、材質、光照和沉浸式外觀。
這三層共同使Project Eden能分離「世界是什麼」與「世界如何被看見」。
三大核心能力
通過將狀態演變與渲染分離,Project Eden實現了傳統方法難以同時提供的三大能力。
長期環境持久性
Project Eden的世界狀態獨立於相機視角存在。它不會因相機移動、用戶離開或物件移出畫面而被抹除。
這使系統能支持在一致環境中的長期探索。物件可保持在原位,行動能產生持久影響,世界能在當前視野之外繼續存在。
例如,若用戶撲滅火災,此行動不僅是短暫的視覺效果,火會在世界狀態中保持熄滅。世界記住所發生的事。

可重複使用與可編輯的場景
Project Eden允許讀取、寫入和動態修改底層世界狀態。
這意味用戶行動可被保存在場景中。若用戶損壞物件、改變環境或留下記號,後續用戶能看到相同變化。場景無需每次從頭重新生成,可被重複使用、更新和擴展。
這對未來互動內容創作至關重要。創作者能構建持續演變的環境,而非產出一次性片段或孤立場景。

並行多人與代理互動
Project Eden也設計為支持多人類用戶和AI代理於同一底層世界內互動。
由於狀態演變與渲染解耦,不同用戶能從不同相機觀察世界,同時仍與同一共享狀態互動。每個用戶行動更新同一世界。
這使得構想AI原生的多人環境、共享創意空間、具身AI訓練環境和多代理模擬系統成為可能。
例如,兩輛車能以不同視角在同一賽道上競速。

不同玩家能在同一射擊場行動,世界能基於共享規則產出不同結果。


從AI 3D資產到AI世界
Project Eden也連接至VAST更廣泛的AI 3D生態系統,包括其AI 3D創作產品Tripo3D。
過去幾年,VAST AI Research持續推動AI 3D生成朝向更高品質、更快產出和更可用資產發展。Tripo3D的3D生成能力協助創意生產從視覺構想轉向空間資產。透過如Image to 3D Model等工具,創作者能將2D參考轉為可查看、編輯並用於下游工作流程的3D模型。
這很重要,因為世界創作不僅依賴圖像,還需要能成為更大互動空間一部分的物件、環境、結構和資產。
VAST的長期方向是降低創建互動世界的門檻。AI 3D模型提供構建塊,Project Eden探索下一層:能維護狀態、隨時間演變並支持互動的世界。
Project Eden的潛能
Project Eden被定位為次世代互動內容創作的基礎。對日常創作者,它指向AI原生的沙盒平台,用戶能透過自然語言和簡單行動創建共享互動世界。
對遊戲、電影、VR/AR、數位孿生和虛擬空間,Project Eden預示AI生成環境不僅視覺豐富,且持久並能響應的未來。
對研究,它可提供具物理規則、長期一致性和可編輯狀態的模擬環境。這對具身AI訓練和多代理評估尤其相關,因代理需要能反應、記憶並產出基於規則結果的環境。
有記憶和規則的世界不僅是內容格式,它成為模擬基礎。
此版本的重要性
Project Eden重要,因為它代表了世界模型的不同研究路徑。
它不將世界建模簡化為影片生成,也未止步於靜態3D場景創作,而是將世界視為可渲染、修改和共享的演變結構化狀態。
這種狀態優先的方法為長期一致性、可重複使用環境和多人互動奠定更強基礎。
隨著生成式AI持續演進,下一前沿可能不僅是更銳利的圖像、更長的影片或更快的3D生成,而是能記憶、響應並隨時間保持一致的世界。
對A1 Art用戶,關鍵不在於此功能今日即登陸A1 Art,而在於Project Eden展示A1 Art生態系夥伴如何探索AI原生世界創作的未來——這一方向可能塑造創作者未來數年對圖像、3D資產和互動環境的思考。
展望未來
Project Eden仍是研究預覽,通往通用世界模型的道路尚處早期。未來工作需強化複雜場景推理、豐富物理動態、擴展自由視角探索、改進細粒度物件互動、建立更強狀態轉變模型,並優化即時渲染效率。
但方向明確。
AI生成正從內容創作邁向世界創作。圖像、影片和3D資產仍重要,但它們可能成為更大事物的構建塊:具記憶、規則和共享體驗的持久互動環境。
Project Eden是邁向那未來的早期一步。
花園沒有圍牆。歡迎來到伊甸園。
閱讀更多
撰稿人
a1.art
發佈時間
Jun 4, 2026
分享文章
