
AI创作正在快速发展。短短几年内,生成式AI已从图像生成扩展到视频创作、AI驱动的3D建模以及日益交互式的数字内容形式。随着这些工具变得更强大,创作者们开始将目光从单张图像或短视频转向更丰富的数字环境——这些环境可被探索、修改和重复利用。
作为A1 Art更广泛创意AI生态系统的一部分,我们重点介绍来自VAST AI研究团队(Tripo3D背后的团队)的最新研究进展。VAST AI研究团队推出了Project Eden,这是一个世界模型研究预览,旨在探索持久、可编辑且交互的AI生成世界。
对于A1 Art用户而言,这一发布值得关注,因为它指向创意AI的更广阔方向:从生成视觉输出转向构建能够记忆变化、支持交互并保持长期一致性的世界。
为何世界模型至关重要
过去几年,生成式AI在生成我们所见的文本、图像、视频和3D资产方面不断进步。世界模型则更深一层。它们不仅关乎视觉输出,更关乎背后的环境——存在什么、发生什么变化以及什么保持不变。
一个世界不仅仅是屏幕上显示的内容。它包含对象、位置、动作、记忆、规则和后果。如果火被扑灭,它应该保持熄灭状态。如果墙上留下标记,它应该保留在那里。如果一个物体移出摄像机视野,它仍应存在于同一世界中。如果多个用户进入同一环境,他们不应与独立的视觉模拟交互,而应共享同一个底层现实。
这正是Project Eden围绕的核心挑战:维护世界的状态,并允许该状态随用户或代理的行为而转变。
当前方法的局限性
许多现有的AI生成世界方法遵循两条路径之一。
第一条路径是动作条件视频生成。这些系统可以根据用户动作产生短期视觉变化,但它们通常在像素级别操作。世界状态往往被压缩到最近的帧中。一旦物体离开摄像机视野,模型可能需要从视觉记忆中重建它,而不是从稳定的底层世界状态中检索。
这使得长期一致性难以实现。这也使得真正的多人互动难以支持,因为没有统一的世界状态供多个用户或代理共享。
第二条路径是静态3D场景生成。这些系统可以创建用户可以查看或导航的3D空间。然而,它们通常去除时间维度,缺乏物理状态转换。静态场景可以被探索,但它并不真正作为一个活生生的环境运行。
一条路径捕捉运动但缺乏持久记忆。另一条路径捕捉空间但缺乏动态演变。Project Eden选择了不同的路线。


渲染前的状态
Project Eden的核心思想是将世界状态演变与视觉渲染原生解耦。
在真实环境中,房间不会因为没人看它就消失。被扑灭的火保持熄灭状态。墙上留下的标记成为场景的一部分。在同一条赛道上比赛的两名玩家看到的不是两个独立的现实。他们在一个共享世界中行动。
Project Eden遵循这一逻辑。它维护一个独立于任何单一摄像机视角的底层世界状态。视觉渲染则用于从特定视角展示这个世界。
这改变了生成的逻辑。Project Eden不再仅仅问“下一帧应该是什么样子?”,而是问一个更根本的问题:“世界的当前状态是什么?这一视角应如何观察它?”
这一转变使得持久的AI生成世界成为可能。
三层架构
Project Eden采用三层解耦架构来支持这种状态优先的方法。
第一层是结构化状态层。这一层为世界构建长期的3D基础。它维护场景几何、对象身份、对象属性和全局事件逻辑。简单来说,这是世界“存在”的地方。它承载环境的客观状态并支持其持续演变。
第二层是条件接口层。这一层充当状态与渲染之间的桥梁。基于不同的摄像机视角,它将完整的底层3D状态转换为视觉生成的语义和几何条件。由于所有渲染视图都来自同一世界状态,系统可以更好地保持跨摄像机和视角的一致性。
第三层是生成式渲染层。这一层基于底层世界状态和接口层的条件生成详细的视觉输出。它为用户增加视觉丰富性、动态细节、材质、光照和沉浸式外观。
这三层共同使Project Eden能够将世界的本质与其呈现方式分离。
三大核心能力
通过将状态演变与渲染分离,Project Eden解锁了传统方法难以同时提供的三大能力。
长期环境持久性
Project Eden的世界状态独立于摄像机视角存在。它不会因摄像机移动、用户离开或物体移出画面而被擦除。
这使得系统能够支持在一致环境中的长期探索。物体可以保持在原位。行动可以产生持久影响。世界可以超越当前视图继续存在。
例如,如果用户扑灭火,这一行动不仅是一个短暂的视觉效果。火在世界状态中被扑灭。世界记住了发生的事情。

可重复使用和可编辑的场景
Project Eden允许读取、写入和动态修改底层世界状态。
这意味着用户行动可以保存在场景中。如果用户损坏物体、改变部分环境或留下标记,后来的用户可以看到相同的变化。场景不需要每次都从头重新生成。它可以被重复使用、更新和扩展。
这对未来的交互式内容创作很重要。创作者可以构建持续演变的环境,而非生产一次性片段或孤立场景。

并发多人和代理交互
Project Eden还设计用于支持多个人类用户和AI代理在同一底层世界内交互。
由于状态演变和渲染解耦,不同用户可以从不同摄像机观察世界,同时仍与同一共享状态交互。每个用户行动更新同一世界。
这使得我们可以设想AI原生的多人环境、共享创意空间、具身AI训练环境和多代理模拟系统。
例如,两辆车可以从不同视角在同一赛道上比赛。

不同玩家可以在同一射击场行动,世界可以根据共享规则产生不同结果。


从AI 3D资产到AI世界
Project Eden还与VAST更广泛的AI 3D生态系统(包括其AI 3D创作产品Tripo3D)相连接。
过去几年,VAST AI研究不断推动AI 3D生成向更高质量、更快生产和更可用资产发展。Tripo3D的3D生成能力帮助创意生产从视觉想法转向空间资产。借助图像转3D模型等工具,创作者可以将2D参考转化为可查看、编辑并用于下游工作流程的3D模型。
这很重要,因为世界创建不仅仅依赖图像。它需要能够成为更大交互空间一部分的物体、环境、结构和资产。
VAST的长期方向是降低创建交互世界的门槛。AI 3D模型提供构建块。Project Eden探索下一层:能够维护状态、随时间演变并支持交互的世界。
Project Eden可能带来的变革
Project Eden被定位为下一代交互内容创作的基础。对于日常创作者,它指向AI原生的沙盒平台,用户可以通过自然语言和简单行动创建共享的交互世界。
对于游戏、电影、VR/AR、数字孪生和虚拟空间,Project Eden预示着一个未来:AI生成的环境不仅视觉丰富,而且持久且响应迅速。
对于研究,它可以提供具有物理规则、长期一致性和可编辑状态的模拟环境。这对具身AI训练和多代理评估尤其重要,因为代理需要能够反应、记忆并产生基于规则结果的环境。
一个有记忆和规则的世界不仅仅是一种内容格式。它成为一个模拟基础。
这一发布为何重要
Project Eden之所以重要,是因为它代表了世界模型的不同研究路径。
它没有将世界建模简化为视频生成。它也没有停留在静态3D场景创建。相反,它将世界视为可渲染、修改和共享的演变结构化状态。
这种状态优先的方法为长期一致性、可重复使用环境和多人互动奠定了更坚实的基础。
随着生成式AI不断发展,下一个前沿可能不仅是更清晰的图像、更长的视频或更快的3D生成。它可能是能够记忆、响应并随时间保持稳定的世界。
对于A1 Art用户,关键要点不是这一功能今天就在A1 Art中推出。相反,Project Eden展示了A1 Art的生态系统合作伙伴之一如何探索AI原生世界创建的未来——这一方向可能在未来几年塑造创作者对图像、3D资产和交互环境的思考方式。
展望未来
Project Eden仍是一个研究预览,通往通用世界模型的道路尚处早期。未来的工作需要加强复杂场景推理、丰富物理动力学、扩展自由视角探索、改进细粒度对象交互、构建更强的状态转换模型并优化实时渲染效率。
但方向是明确的。
AI生成正从内容创作转向世界创建。图像、视频和3D资产仍将重要,但它们可能成为更大事物的构建块:具有记忆、规则和共享体验的持久交互环境。
Project Eden是迈向这一未来的早期一步。
花园没有围墙。欢迎来到伊甸园。
阅读更多
撰稿人
a1.art
发布时间
Jun 4, 2026
分享文章
