La création par IA évolue rapidement. En quelques années seulement, l'IA générative est passée de la génération d'images à la création vidéo, à la modélisation 3D alimentée par l'IA et à des formes de contenu numérique de plus en plus interactives. Alors que ces outils deviennent plus puissants, les créateurs commencent à regarder au-delà des images uniques ou des clips courts vers des environnements numériques plus riches qui peuvent être explorés, modifiés et réutilisés.
Dans le cadre de l'écosystème créatif plus large d'A1 Art, nous mettons en lumière une mise à jour récente de la recherche de VAST AI Research, l'équipe derrière Tripo3D. VAST AI Research a introduit
Project Eden, une prévisualisation de recherche sur les modèles de monde conçue pour explorer des mondes générés par l'IA persistants, modifiables et interactifs.
Pour les utilisateurs d'A1 Art, cette version mérite d'être suivie car elle indique une direction plus large dans l'IA créative : passer de la génération de sorties visuelles à la construction de mondes qui peuvent se souvenir des changements, supporter l'interaction et rester cohérents dans le temps.
Pourquoi les modèles de monde sont importants
L'IA générative a passé les dernières années à s'améliorer dans la production de ce que nous voyons : texte, images, vidéos et actifs 3D. Les modèles de monde vont un niveau plus profond. Ils ne concernent pas seulement la sortie visuelle, mais aussi l'environnement derrière elle — ce qui existe, ce qui change et ce qui reste cohérent dans le temps.
Un monde n'est pas seulement ce qui apparaît à l'écran. Il a des objets, des lieux, des actions, de la mémoire, des règles et des conséquences. Si un feu est éteint, il devrait rester éteint. Si une marque est laissée sur un mur, elle devrait y rester. Si un objet se déplace hors de la vue de la caméra, il devrait toujours exister dans le même monde. Et si plusieurs utilisateurs entrent dans le même environnement, ils ne devraient pas interagir avec des simulations visuelles séparées, mais avec une seule réalité sous-jacente partagée.
C'est le défi central autour duquel Project Eden est conçu : maintenir l'état d'un monde et permettre à cet état de transitionner lorsque les utilisateurs ou les agents agissent en son sein.
Les limites des approches actuelles
De nombreuses approches existantes des mondes générés par l'IA suivent l'une des deux voies.
La première voie est la génération vidéo conditionnée par l'action. Ces systèmes peuvent produire des changements visuels à court terme basés sur les actions des utilisateurs, mais ils opèrent généralement au niveau des pixels. L'état du monde est souvent compressé dans les dernières images. Une fois qu'un objet quitte la vue de la caméra, le modèle peut avoir besoin de le reconstruire à partir de la mémoire visuelle plutôt que de le récupérer à partir d'un état de monde sous-jacent stable.
Cela rend difficile la cohérence à long terme. Cela rend également difficile le support d'une véritable interaction multijoueur, car il n'y a pas d'état de monde unifié que plusieurs utilisateurs ou agents peuvent partager.
La deuxième voie est la génération de scènes 3D statiques. Ces systèmes peuvent créer des espaces 3D que les utilisateurs peuvent voir ou naviguer. Cependant, ils suppriment souvent la dimension temporelle et manquent de transitions d'état physique. Une scène statique peut être explorée, mais elle ne fonctionne pas vraiment comme un environnement vivant.
Une voie capture le mouvement sans mémoire durable. L'autre capture l'espace sans évolution dynamique. Project Eden prend une route différente.
État avant le rendu
L'idée centrale derrière Project Eden est la dissociation native de l'évolution de l'état du monde et du rendu visuel.
Dans un environnement réel, une pièce ne disparaît pas lorsque personne ne la regarde. Un feu qui a été éteint reste éteint. Une marque laissée sur un mur fait partie de la scène. Deux joueurs courant sur la même piste ne regardent pas deux réalités séparées. Ils agissent à l'intérieur d'un monde partagé.
Project Eden suit cette logique. Il maintient un état de monde sous-jacent qui existe indépendamment de toute vue unique de la caméra. Le rendu visuel est ensuite utilisé pour montrer ce monde à partir d'une perspective spécifique.
Cela change la logique de la génération. Au lieu de demander seulement, "À quoi devrait ressembler la prochaine image ?", Project Eden pose une question plus fondamentale : "Quel est l'état actuel du monde, et comment ce point de vue devrait-il l'observer ?"
Ce changement est ce qui rend possible les mondes générés par l'IA persistants.
Architecture à trois couches
Project Eden utilise une architecture découplée à trois couches pour supporter cette approche centrée sur l'état.
La première couche est la couche d'état structuré. Cette couche construit une fondation 3D à long terme pour le monde. Elle maintient la géométrie de la scène, les identités des objets, les attributs des objets et la logique des événements globaux. En termes simples, c'est là que le monde "vit". Il porte l'état objectif de l'environnement et supporte son évolution continue.
La deuxième couche est la couche d'interface conditionnelle. Cette couche agit comme un pont entre l'état et le rendu. Basée sur différents points de vue de la caméra, elle convertit l'état 3D sous-jacent complet en conditions sémantiques et géométriques pour la génération visuelle. Parce que toutes les vues rendues proviennent du même état de monde, le système peut mieux maintenir la cohérence entre les caméras et les perspectives.
La troisième couche est la couche de rendu génératif. Cette couche produit une sortie visuelle détaillée basée sur l'état de monde sous-jacent et les conditions de la couche d'interface. Elle ajoute de la richesse visuelle, des détails dynamiques, des matériaux, un éclairage et une apparence immersive pour l'utilisateur.
Ensemble, ces trois couches permettent à Project Eden de séparer ce qu'est le monde de la façon dont le monde est vu.
Trois capacités clés
En séparant l'évolution de l'état du rendu, Project Eden débloque trois capacités majeures que les approches traditionnelles ont du mal à fournir en même temps.
Persistance environnementale à long terme
L'état de monde de Project Eden existe indépendamment de la vue de la caméra. Il n'est pas effacé lorsque la caméra bouge, lorsque l'utilisateur part ou lorsqu'un objet sort du cadre.
Cela permet au système de supporter une exploration à long terme à l'intérieur d'un environnement cohérent. Les objets peuvent rester où ils sont. Les actions peuvent avoir des effets durables. Le monde peut continuer à exister au-delà de la vue actuelle.
Par exemple, si un utilisateur éteint un feu, cette action n'est pas seulement un effet visuel passager. Le feu devient éteint dans l'état du monde. Le monde se souvient de ce qui s'est passé.
Scènes réutilisables et modifiables
Project Eden permet à l'état de monde sous-jacent d'être lu, écrit et modifié dynamiquement.
Cela signifie que les actions des utilisateurs peuvent être préservées à l'intérieur de la scène. Si un utilisateur endommage un objet, change une partie de l'environnement ou laisse des marques, les utilisateurs ultérieurs peuvent voir les mêmes changements. La scène n'a pas besoin d'être régénérée à partir de zéro chaque fois. Elle peut être réutilisée, mise à jour et étendue.
C'est important pour la future création de contenu interactif. Au lieu de produire des clips jetables ou des scènes isolées, les créateurs pourraient construire des environnements qui continuent à évoluer.
Interaction multijoueur et agent simultanée
Project Eden est également conçu pour supporter plusieurs utilisateurs humains et agents IA à l'intérieur du même monde sous-jacent.
Parce que l'évolution de l'état et le rendu sont découplés, différents utilisateurs peuvent observer le monde à partir de différentes caméras tout en interagissant avec le même état partagé. Chaque action utilisateur met à jour le même monde.
Cela permet d'imaginer des environnements multijoueur natifs IA, des espaces créatifs partagés, des environnements de formation IA incarnés et des systèmes de simulation multi-agents.
Par exemple, deux voitures pourraient courir sur la même piste à partir de points de vue différents.

Différents joueurs pourraient agir à l'intérieur du même champ de tir, et le monde pourrait produire différents résultats basés sur des règles partagées.
Des actifs 3D IA aux mondes IA
Project Eden se connecte également à l'écosystème 3D IA plus large de VAST, y compris Tripo3D, son produit de création 3D IA.
Au cours des dernières années, VAST AI Research a continué à pousser la génération 3D IA vers une qualité supérieure, une production plus rapide et des actifs plus utilisables. Les capacités de génération 3D de Tripo3D aident à déplacer la production créative des idées visuelles vers les actifs spatiaux. Avec des outils tels que
Image to 3D Model, les créateurs peuvent transformer des références 2D en modèles 3D qui peuvent être visualisés, modifiés et utilisés dans les workflows en aval.
Cela importe car la création de monde dépend de plus que des images. Elle nécessite des objets, des environnements, des structures et des actifs qui peuvent faire partie d'un espace interactif plus large.
La direction à long terme de VAST est de réduire la barrière à la création de mondes interactifs. Les modèles 3D IA fournissent des blocs de construction. Project Eden explore la couche suivante : des mondes qui peuvent maintenir un état, évoluer dans le temps et supporter l'interaction.
Ce que Project Eden pourrait permettre
Project Eden est positionné comme une fondation pour la création de contenu interactif de nouvelle génération. Pour les créateurs quotidiens, il pointe vers des plateformes bac à sable natives IA où les utilisateurs peuvent créer des mondes interactifs partagés à travers le langage naturel et des actions simples.
Pour les jeux, les films, la VR/AR, les jumeaux numériques et les espaces virtuels, Project Eden suggère un avenir où les environnements générés par l'IA ne sont pas seulement visuellement riches, mais aussi persistants et réactifs.
Pour la recherche, il pourrait fournir des environnements de simulation avec des règles physiques, une cohérence à long terme et des états modifiables. Cela est particulièrement pertinent pour la formation d'IA incarnée et l'évaluation multi-agents, où les agents ont besoin d'environnements qui peuvent réagir, se souvenir et produire des résultats basés sur des règles.
Un monde avec mémoire et règles est plus qu'un format de contenu. Il devient une base de simulation.
Pourquoi cette version est importante
Project Eden est important car il représente une voie de recherche différente pour les modèles de monde.
Il ne réduit pas la modélisation du monde à la génération vidéo. Il ne s'arrête pas non plus à la création de scènes 3D statiques. Au lieu de cela, il traite le monde comme un état structuré en évolution qui peut être rendu, modifié et partagé.
Cette approche centrée sur l'état crée une fondation plus solide pour la cohérence à long terme, les environnements réutilisables et l'interaction multijoueur.
Alors que l'IA générative continue d'évoluer, la prochaine frontière pourrait ne pas être seulement des images plus nettes, des vidéos plus longues ou une génération 3D plus rapide. Ce pourrait être des mondes qui se souviennent, répondent et restent cohérents dans le temps.
Pour les utilisateurs d'A1 Art, le message clé n'est pas que cette capacité est lancée dans A1 Art aujourd'hui. Plutôt, Project Eden montre comment l'un des partenaires de l'écosystème d'A1 Art explore l'avenir de la création de monde native IA — une direction qui pourrait façonner la façon dont les créateurs pensent aux images, aux actifs 3D et aux environnements interactifs dans les années à venir.
Perspectives futures
Project Eden est toujours une prévisualisation de recherche, et la route vers des modèles de monde à usage général reste précoce. Les travaux futurs devront renforcer le raisonnement sur les scènes complexes, enrichir la dynamique physique, étendre l'exploration en vue libre, améliorer l'interaction fine avec les objets, construire des modèles de transition d'état plus solides et optimiser l'efficacité du rendu en temps réel.
Mais la direction est claire.
La génération IA passe de la création de contenu à la création de monde. Les images, les vidéos et les actifs 3D resteront importants, mais ils pourraient devenir des blocs de construction pour quelque chose de plus grand : des environnements interactifs persistants avec mémoire, règles et expérience partagée.
Project Eden est un premier pas vers cet avenir.
Le jardin n'a pas de murs. Bienvenue à Eden.