合作伙伴聚焦：VAST AI研究推出伊甸园计划

a1是一个在线AI图像生成器，可以帮助您在几秒钟内生成任何风格的AI图像。

立即免费使用。

AI创作正在快速发展。短短几年内，生成式AI已从图像生成扩展到视频创作、AI驱动的3D建模以及日益交互式的数字内容形式。随着这些工具变得更强大，创作者们开始将目光从单张图像或短视频转向更丰富的数字环境——这些环境可被探索、修改和重复利用。

作为A1 Art更广泛创意AI生态系统的一部分，我们重点介绍来自VAST AI研究团队（Tripo3D背后的团队）的最新研究进展。VAST AI研究团队推出了Project Eden，这是一个世界模型研究预览，旨在探索持久、可编辑且交互的AI生成世界。

对于A1 Art用户而言，这一发布值得关注，因为它指向创意AI的更广阔方向：从生成视觉输出转向构建能够记忆变化、支持交互并保持长期一致性的世界。

为何世界模型至关重要

过去几年，生成式AI在生成我们所见的文本、图像、视频和3D资产方面不断进步。世界模型则更深一层。它们不仅关乎视觉输出，更关乎背后的环境——存在什么、发生什么变化以及什么保持不变。

一个世界不仅仅是屏幕上显示的内容。它包含对象、位置、动作、记忆、规则和后果。如果火被扑灭，它应该保持熄灭状态。如果墙上留下标记，它应该保留在那里。如果一个物体移出摄像机视野，它仍应存在于同一世界中。如果多个用户进入同一环境，他们不应与独立的视觉模拟交互，而应共享同一个底层现实。

这正是Project Eden围绕的核心挑战：维护世界的状态，并允许该状态随用户或代理的行为而转变。

当前方法的局限性

许多现有的AI生成世界方法遵循两条路径之一。

第一条路径是动作条件视频生成。这些系统可以根据用户动作产生短期视觉变化，但它们通常在像素级别操作。世界状态往往被压缩到最近的帧中。一旦物体离开摄像机视野，模型可能需要从视觉记忆中重建它，而不是从稳定的底层世界状态中检索。

这使得长期一致性难以实现。这也使得真正的多人互动难以支持，因为没有统一的世界状态供多个用户或代理共享。

第二条路径是静态3D场景生成。这些系统可以创建用户可以查看或导航的3D空间。然而，它们通常去除时间维度，缺乏物理状态转换。静态场景可以被探索，但它并不真正作为一个活生生的环境运行。

一条路径捕捉运动但缺乏持久记忆。另一条路径捕捉空间但缺乏动态演变。Project Eden选择了不同的路线。

渲染前的状态

Project Eden的核心思想是将世界状态演变与视觉渲染原生解耦。

在真实环境中，房间不会因为没人看它就消失。被扑灭的火保持熄灭状态。墙上留下的标记成为场景的一部分。在同一条赛道上比赛的两名玩家看到的不是两个独立的现实。他们在一个共享世界中行动。

Project Eden遵循这一逻辑。它维护一个独立于任何单一摄像机视角的底层世界状态。视觉渲染则用于从特定视角展示这个世界。

这改变了生成的逻辑。Project Eden不再仅仅问“下一帧应该是什么样子？”，而是问一个更根本的问题：“世界的当前状态是什么？这一视角应如何观察它？”

这一转变使得持久的AI生成世界成为可能。

三层架构

Project Eden采用三层解耦架构来支持这种状态优先的方法。

第一层是结构化状态层。这一层为世界构建长期的3D基础。它维护场景几何、对象身份、对象属性和全局事件逻辑。简单来说，这是世界“存在”的地方。它承载环境的客观状态并支持其持续演变。

第二层是条件接口层。这一层充当状态与渲染之间的桥梁。基于不同的摄像机视角，它将完整的底层3D状态转换为视觉生成的语义和几何条件。由于所有渲染视图都来自同一世界状态，系统可以更好地保持跨摄像机和视角的一致性。

第三层是生成式渲染层。这一层基于底层世界状态和接口层的条件生成详细的视觉输出。它为用户增加视觉丰富性、动态细节、材质、光照和沉浸式外观。

这三层共同使Project Eden能够将世界的本质与其呈现方式分离。

三大核心能力

通过将状态演变与渲染分离，Project Eden解锁了传统方法难以同时提供的三大能力。

长期环境持久性

Project Eden的世界状态独立于摄像机视角存在。它不会因摄像机移动、用户离开或物体移出画面而被擦除。

这使得系统能够支持在一致环境中的长期探索。物体可以保持在原位。行动可以产生持久影响。世界可以超越当前视图继续存在。

例如，如果用户扑灭火，这一行动不仅是一个短暂的视觉效果。火在世界状态中被扑灭。世界记住了发生的事情。

可重复使用和可编辑的场景

Project Eden允许读取、写入和动态修改底层世界状态。

这意味着用户行动可以保存在场景中。如果用户损坏物体、改变部分环境或留下标记，后来的用户可以看到相同的变化。场景不需要每次都从头重新生成。它可以被重复使用、更新和扩展。

这对未来的交互式内容创作很重要。创作者可以构建持续演变的环境，而非生产一次性片段或孤立场景。

并发多人和代理交互

Project Eden还设计用于支持多个人类用户和AI代理在同一底层世界内交互。

由于状态演变和渲染解耦，不同用户可以从不同摄像机观察世界，同时仍与同一共享状态交互。每个用户行动更新同一世界。

这使得我们可以设想AI原生的多人环境、共享创意空间、具身AI训练环境和多代理模拟系统。

例如，两辆车可以从不同视角在同一赛道上比赛。

不同玩家可以在同一射击场行动，世界可以根据共享规则产生不同结果。

从AI 3D资产到AI世界

Project Eden还与VAST更广泛的AI 3D生态系统（包括其AI 3D创作产品Tripo3D）相连接。

过去几年，VAST AI研究不断推动AI 3D生成向更高质量、更快生产和更可用资产发展。Tripo3D的3D生成能力帮助创意生产从视觉想法转向空间资产。借助图像转3D模型等工具，创作者可以将2D参考转化为可查看、编辑并用于下游工作流程的3D模型。

这很重要，因为世界创建不仅仅依赖图像。它需要能够成为更大交互空间一部分的物体、环境、结构和资产。

VAST的长期方向是降低创建交互世界的门槛。AI 3D模型提供构建块。Project Eden探索下一层：能够维护状态、随时间演变并支持交互的世界。

Project Eden可能带来的变革

Project Eden被定位为下一代交互内容创作的基础。对于日常创作者，它指向AI原生的沙盒平台，用户可以通过自然语言和简单行动创建共享的交互世界。

对于游戏、电影、VR/AR、数字孪生和虚拟空间，Project Eden预示着一个未来：AI生成的环境不仅视觉丰富，而且持久且响应迅速。

对于研究，它可以提供具有物理规则、长期一致性和可编辑状态的模拟环境。这对具身AI训练和多代理评估尤其重要，因为代理需要能够反应、记忆并产生基于规则结果的环境。

一个有记忆和规则的世界不仅仅是一种内容格式。它成为一个模拟基础。

这一发布为何重要

Project Eden之所以重要，是因为它代表了世界模型的不同研究路径。

它没有将世界建模简化为视频生成。它也没有停留在静态3D场景创建。相反，它将世界视为可渲染、修改和共享的演变结构化状态。

这种状态优先的方法为长期一致性、可重复使用环境和多人互动奠定了更坚实的基础。

随着生成式AI不断发展，下一个前沿可能不仅是更清晰的图像、更长的视频或更快的3D生成。它可能是能够记忆、响应并随时间保持稳定的世界。

对于A1 Art用户，关键要点不是这一功能今天就在A1 Art中推出。相反，Project Eden展示了A1 Art的生态系统合作伙伴之一如何探索AI原生世界创建的未来——这一方向可能在未来几年塑造创作者对图像、3D资产和交互环境的思考方式。

展望未来

Project Eden仍是一个研究预览，通往通用世界模型的道路尚处早期。未来的工作需要加强复杂场景推理、丰富物理动力学、扩展自由视角探索、改进细粒度对象交互、构建更强的状态转换模型并优化实时渲染效率。

但方向是明确的。

AI生成正从内容创作转向世界创建。图像、视频和3D资产仍将重要，但它们可能成为更大事物的构建块：具有记忆、规则和共享体验的持久交互环境。

Project Eden是迈向这一未来的早期一步。

花园没有围墙。欢迎来到伊甸园。

撰稿人

a1.art

发布时间

Jun 4, 2026

分享文章