Искусственный интеллект в творчестве быстро развивается. Всего за несколько лет генеративный ИИ перешел от создания изображений к созданию видео, 3D-моделированию на основе ИИ и все более интерактивным формам цифрового контента. По мере того, как эти инструменты становятся более мощными, создатели начинают выходить за рамки отдельных изображений или коротких клипов, обращаясь к более богатым цифровым средам, которые можно исследовать, изменять и использовать повторно.
Как часть более широкой экосистемы творческого ИИ A1 Art, мы освещаем последнее обновление исследований от VAST AI Research, команды, стоящей за Tripo3D. VAST AI Research представила
Project Eden, превью исследования мировой модели, предназначенное для изучения постоянных, редактируемых и интерактивных миров, созданных ИИ.
Для пользователей A1 Art этот релиз заслуживает внимания, потому что он указывает на более широкое направление в творческом ИИ: переход от генерации визуальных результатов к созданию миров, которые могут запоминать изменения, поддерживать взаимодействие и оставаться последовательными с течением времени.
Почему мировые модели важны
Генеративный ИИ последние несколько лет становился лучше в создании того, что мы видим: текста, изображений, видео и 3D-ассетов. Мировые модели углубляются на один уровень. Они не только о визуальном результате, но и о среде за ним — что существует, что изменяется и что остается неизменным с течением времени.
Мир — это не только то, что появляется на экране. В нем есть объекты, места, действия, память, правила и последствия. Если огонь потушен, он должен оставаться потушенным. Если на стене остался след, он должен оставаться там. Если объект выходит за пределы камеры, он должен продолжать существовать в том же мире. И если несколько пользователей входят в одну и ту же среду, они должны взаимодействовать не с отдельными визуальными симуляциями, а с одной общей реальностью.
Это основная задача, вокруг которой разработан Project Eden: поддержание состояния мира и возможность его изменения по мере действий пользователей или агентов в нем.
Ограничения текущих подходов
Многие существующие подходы к созданию миров на основе ИИ следуют одному из двух путей.
Первый путь — генерация видео, обусловленная действиями. Эти системы могут производить краткосрочные визуальные изменения на основе действий пользователя, но обычно они работают на уровне пикселей. Состояние мира часто сжимается в последние кадры. Как только объект выходит из поля зрения камеры, модель может потребовать его реконструкции из визуальной памяти, а не извлечения из стабильного состояния мира.
Это затрудняет долгосрочную согласованность. Это также затрудняет поддержку истинного многопользовательского взаимодействия, потому что нет единого состояния мира, которым могли бы поделиться несколько пользователей или агентов.
Второй путь — генерация статических 3D-сцен. Эти системы могут создавать 3D-пространства, которые пользователи могут просматривать или перемещаться по ним. Однако они часто удаляют временное измерение и не имеют физических изменений состояния. Статическую сцену можно исследовать, но она не функционирует как живая среда.
Один путь захватывает движение без долговременной памяти. Другой захватывает пространство без динамической эволюции. Project Eden выбирает другой путь.
Состояние перед рендерингом
Основная идея Project Eden — это естественное разделение эволюции состояния мира и визуального рендеринга.
В реальной среде комната не исчезает, когда на нее никто не смотрит. Потухший огонь остается потухшим. След, оставленный на стене, становится частью сцены. Два игрока, соревнующиеся на одной трассе, не наблюдают две отдельные реальности. Они действуют внутри одного общего мира.
Project Eden следует этой логике. Он поддерживает базовое состояние мира, которое существует независимо от любого отдельного вида камеры. Затем визуальный рендеринг используется для отображения этого мира с определенной точки зрения.
Это меняет логику генерации. Вместо того чтобы спрашивать только: "Как должен выглядеть следующий кадр?", Project Eden задает более фундаментальный вопрос: "Каково текущее состояние мира, и как эта точка зрения должна его наблюдать?"
Этот сдвиг делает возможными постоянные миры, созданные ИИ.
Трехуровневая архитектура
Project Eden использует трехуровневую разделенную архитектуру для поддержки этого подхода, ориентированного на состояние.
Первый уровень — это структурированный уровень состояния. Этот уровень создает долгосрочную 3D-основу для мира. Он поддерживает геометрию сцены, идентификаторы объектов, атрибуты объектов и глобальную логику событий. Проще говоря, это место, где мир "живет". Он несет объективное состояние среды и поддерживает ее дальнейшую эволюцию.
Второй уровень — это условный интерфейсный уровень. Этот уровень действует как мост между состоянием и рендерингом. На основе различных точек зрения камеры он преобразует полное базовое 3D-состояние в семантические и геометрические условия для визуальной генерации. Поскольку все отображаемые виды происходят из одного и того же состояния мира, система может лучше поддерживать согласованность между камерами и перспективами.
Третий уровень — это генеративный уровень рендеринга. Этот уровень создает детализированный визуальный вывод на основе базового состояния мира и условий из интерфейсного уровня. Он добавляет визуальное богатство, динамические детали, материалы, освещение и иммерсивный внешний вид для пользователя.
Вместе эти три уровня позволяют Project Eden разделить то, что представляет собой мир, от того, как он воспринимается.
Три основные возможности
Разделяя эволюцию состояния и рендеринг, Project Eden открывает три основные возможности, которые традиционные подходы с трудом обеспечивают одновременно.
Долгосрочная устойчивость среды
Состояние мира Project Eden существует независимо от вида камеры. Оно не стирается при перемещении камеры, уходе пользователя или выходе объекта за пределы кадра.
Это позволяет системе поддерживать долгосрочное исследование внутри согласованной среды. Объекты могут оставаться на своих местах. Действия могут иметь долгосрочные эффекты. Мир может продолжать существовать за пределами текущего вида.
Например, если пользователь потушил огонь, это действие не просто временный визуальный эффект. Огонь становится потухшим в состоянии мира. Мир помнит, что произошло.
Многоразовые и редактируемые сцены
Project Eden позволяет читать, записывать и динамически изменять базовое состояние мира.
Это означает, что действия пользователя могут сохраняться внутри сцены. Если пользователь повредил объект, изменил часть среды или оставил следы, последующие пользователи могут увидеть те же изменения. Сцену не нужно каждый раз генерировать с нуля. Ее можно использовать повторно, обновлять и расширять.
Это важно для будущего создания интерактивного контента. Вместо создания одноразовых клипов или изолированных сцен создатели могли бы строить среды, которые продолжают развиваться.
Совместное многопользовательское взаимодействие и взаимодействие с агентами
Project Eden также разработан для поддержки нескольких человеческих пользователей и ИИ-агентов внутри одного и того же базового мира.
Поскольку эволюция состояния и рендеринг разделены, разные пользователи могут наблюдать мир с разных камер, все еще взаимодействуя с одним и тем же общим состоянием. Каждое действие пользователя обновляет один и тот же мир.
Это делает возможным представление многопользовательских сред на основе ИИ, общих творческих пространств, сред обучения воплощенного ИИ и систем симуляции с множеством агентов.
Например, две машины могли бы соревноваться на одной трассе с разных точек зрения.

Разные игроки могли бы действовать внутри одного и того же стрельбища, и мир мог бы производить разные результаты на основе общих правил.
От 3D-ассетов ИИ к мирам ИИ
Project Eden также связан с более широкой экосистемой 3D ИИ VAST, включая Tripo3D, его продукт для создания 3D ИИ.
За последние несколько лет VAST AI Research продолжала продвигать генерацию 3D ИИ в сторону более высокого качества, более быстрого производства и более удобных ассетов. Возможности генерации 3D Tripo3D помогают переместить творческое производство от визуальных идей к пространственным ассетам. С такими инструментами, как
Image to 3D Model, создатели могут превращать 2D-ссылки в 3D-модели, которые можно просматривать, редактировать и использовать в последующих рабочих процессах.
Это важно, потому что создание мира зависит не только от изображений. Оно требует объектов, сред, структур и ассетов, которые могут стать частью большего интерактивного пространства.
Долгосрочное направление VAST — снизить барьер для создания интерактивных миров. 3D-модели ИИ предоставляют строительные блоки. Project Eden исследует следующий уровень: миры, которые могут поддерживать состояние, развиваться со временем и поддерживать взаимодействие.
Что может обеспечить Project Eden
Project Eden позиционируется как основа для создания интерактивного контента следующего поколения. Для обычных создателей он указывает на платформы-песочницы на основе ИИ, где пользователи могут создавать общие интерактивные миры с помощью естественного языка и простых действий.
Для игр, кино, VR/AR, цифровых двойников и виртуальных пространств Project Eden предполагает будущее, где среды, созданные ИИ, не только визуально богаты, но и постоянны и отзывчивы.
Для исследований это может предоставить среды симуляции с физическими правилами, долгосрочной согласованностью и редактируемыми состояниями. Это особенно актуально для обучения воплощенного ИИ и оценки множества агентов, где агентам нужны среды, которые могут реагировать, запоминать и производить результаты на основе правил.
Мир с памятью и правилами — это больше, чем формат контента. Он становится базой симуляции.
Почему этот релиз важен
Project Eden важен, потому что он представляет собой другой путь исследований для мировых моделей.
Он не сводит моделирование мира к генерации видео. Он также не останавливается на создании статических 3D-сцен. Вместо этого он рассматривает мир как развивающееся структурированное состояние, которое можно визуализировать, изменять и делиться им.
Этот подход, ориентированный на состояние, создает более прочную основу для долгосрочной согласованности, многоразовых сред и многопользовательского взаимодействия.
По мере того, как генеративный ИИ продолжает развиваться, следующая граница может быть не только в более четких изображениях, более длинных видео или более быстрой генерации 3D. Это могут быть миры, которые помнят, реагируют и остаются последовательными с течением времени.
Для пользователей A1 Art ключевой вывод не в том, что эта функция запускается внутри A1 Art сегодня. Скорее, Project Eden показывает, как один из партнеров экосистемы A1 Art исследует будущее создания миров на основе ИИ — направление, которое может определить, как создатели думают об изображениях, 3D-ассетах и интерактивных средах в ближайшие годы.
Взгляд в будущее
Project Eden все еще находится на стадии превью исследований, и путь к универсальным мировым моделям остается ранним. Будущая работа потребует усиления сложного рассуждения о сценах, обогащения физической динамики, расширения исследования свободных точек зрения, улучшения взаимодействия с объектами на детальном уровне, построения более сильных моделей перехода состояний и оптимизации эффективности рендеринга в реальном времени.
Но направление ясно.
Генерация ИИ переходит от создания контента к созданию миров. Изображения, видео и 3D-ассеты останутся важными, но они могут стать строительными блоками для чего-то большего: постоянных интерактивных сред с памятью, правилами и общим опытом.
Project Eden — это ранний шаг к этому будущему.
У сада нет стен. Добро пожаловать в Эдем.