a1은 몇 초 만에 어떤 스타일이든 AI 이미지를 생성할 수 있는 AI 이미지 생성기입니다.

지금 무료로 사용해 보세요.

AI 창작은 빠르게 진화하고 있습니다. 불과 몇 년 만에 생성형 AI는 이미지 생성에서 비디오 제작, AI 기반 3D 모델링, 점점 더 상호작용이 가능한 디지털 콘텐츠 형태로 발전했습니다. 이러한 도구들이 더 강력해짐에 따라 창작자들은 단일 이미지나 짧은 클립을 넘어 탐색하고, 변경하고, 재사용할 수 있는 더 풍부한 디지털 환경을 고려하기 시작했습니다.
A1 Art의 더 광범위한 창의적 AI 생태계의 일환으로, 우리는 Tripo3D를 개발한 VAST AI Research의 최근 연구 업데이트를 소개합니다. VAST AI Research는 프로젝트 에덴(Project Eden)을 발표했는데, 이는 지속적이고 편집 가능하며 상호작용이 가능한 AI 생성 세계를 탐구하기 위한 세계 모델 연구 프리뷰입니다.
A1 Art 사용자들에게 이번 발표는 주목할 가치가 있습니다. 왜냐하면 이는 창의적 AI의 더 넓은 방향을 가리키기 때문입니다: 시각적 출력을 생성하는 것에서 변화를 기억하고, 상호작용을 지원하며, 시간이 지나도 일관성을 유지하는 세계를 구축하는 것으로 나아가는 것입니다.

세계 모델이 중요한 이유

생성형 AI는 지난 몇 년 동안 우리가 보는 것(텍스트, 이미지, 비디오, 3D 자산)을 더 잘 만들어내는 데 집중해 왔습니다. 세계 모델은 한 단계 더 깊이 들어갑니다. 이는 시각적 출력뿐만 아니라 그 뒤에 있는 환경—무엇이 존재하는지, 무엇이 변하는지, 시간이 지나도 무엇이 일관성을 유지하는지—에 관한 것입니다.
세계는 단순히 화면에 나타나는 것이 아닙니다. 세계에는 객체, 위치, 행동, 기억, 규칙, 결과가 있습니다. 불이 꺼지면 그 상태를 유지해야 합니다. 벽에 흔적을 남기면 그 흔적이 남아 있어야 합니다. 객체가 카메라 시야 밖으로 이동하면 여전히 같은 세계에 존재해야 합니다. 그리고 여러 사용자가 같은 환경에 들어가면 별개의 시각적 시뮬레이션이 아닌 하나의 공유된 기본 현실과 상호작용해야 합니다.
이것이 프로젝트 에덴이 해결하고자 하는 핵심 과제입니다: 세계의 상태를 유지하고, 사용자나 에이전트가 그 안에서 행동할 때 그 상태가 전환될 수 있도록 하는 것입니다.

현재 접근법의 한계

AI 생성 세계에 대한 많은 기존 접근법은 두 가지 경로 중 하나를 따릅니다.
첫 번째 경로는 행동 조건 비디오 생성입니다. 이러한 시스템은 사용자 행동에 기반한 단기적인 시각적 변화를 생성할 수 있지만, 일반적으로 픽셀 수준에서 작동합니다. 세계 상태는 종종 최근 프레임으로 압축됩니다. 객체가 카메라 시야를 벗어나면 모델은 안정적인 기본 세계 상태에서 검색하는 대신 시각적 기억에서 재구성해야 할 수 있습니다.
이는 장기적인 일관성을 어렵게 만듭니다. 또한 진정한 멀티플레이어 상호작용을 지원하기 어렵게 만듭니다. 왜냐하면 여러 사용자나 에이전트가 공유할 수 있는 통합된 세계 상태가 없기 때문입니다.
두 번째 경로는 정적 3D 장면 생성입니다. 이러한 시스템은 사용자가 보고 탐색할 수 있는 3D 공간을 생성할 수 있습니다. 그러나 시간 차원을 제거하고 물리적 상태 전환이 부족한 경우가 많습니다. 정적 장면은 탐색할 수 있지만 진정한 살아있는 환경으로 작동하지는 않습니다.
한 경로는 지속적인 기억 없이 운동을 포착합니다. 다른 경로는 동적 진화 없이 공간을 포착합니다. 프로젝트 에덴은 다른 길을 택합니다.

렌더링 이전의 상태

프로젝트 에덴의 핵심 아이디어는 세계 상태 진화와 시각적 렌더링의 기본적인 분리입니다.
실제 환경에서는 아무도 보지 않을 때 방이 사라지지 않습니다. 꺼진 불은 계속 꺼진 상태를 유지합니다. 벽에 남은 흔적은 장면의 일부가 됩니다. 같은 트랙에서 경주하는 두 명의 플레이어는 두 개의 별개 현실을 보는 것이 아닙니다. 그들은 하나의 공유된 세계 안에서 행동하고 있습니다.
프로젝트 에덴은 이 논리를 따릅니다. 이는 단일 카메라 뷰와 독립적으로 존재하는 기본 세계 상태를 유지합니다. 그런 다음 시각적 렌더링을 사용하여 특정 관점에서 그 세계를 보여줍니다.
이것은 생성의 논리를 바꿉니다. "다음 프레임은 어떻게 보여야 하는가?"라는 질문만 하는 대신, 프로젝트 에덴은 더 근본적인 질문을 던집니다: "현재 세계의 상태는 무엇이며, 이 관점은 그것을 어떻게 관찰해야 하는가?"
이러한 전환이 지속적인 AI 생성 세계를 가능하게 합니다.

3계층 아키텍처

프로젝트 에덴은 이러한 상태 우선 접근을 지원하기 위해 3계층 분리 아키텍처를 사용합니다.
첫 번째 계층은 구조화된 상태 계층입니다. 이 계층은 세계를 위한 장기적인 3D 기반을 구축합니다. 장면 기하학, 객체 식별자, 객체 속성, 글로벌 이벤트 논리를 유지합니다. 간단히 말해, 이것은 세계가 "살아있는" 곳입니다. 환경의 객관적인 상태를 전달하고 그 지속적인 진화를 지원합니다.
두 번째 계층은 조건부 인터페이스 계층입니다. 이 계층은 상태와 렌더링 사이의 다리 역할을 합니다. 다양한 카메라 관점에 기반하여 완전한 기본 3D 상태를 시각적 생성을 위한 의미론적 및 기하학적 조건으로 변환합니다. 모든 렌더링된 뷰가 동일한 세계 상태에서 나오기 때문에 시스템은 카메라와 관점 간의 일관성을 더 잘 유지할 수 있습니다.
세 번째 계층은 생성적 렌더링 계층입니다. 이 계층은 기본 세계 상태와 인터페이스 계층의 조건에 기반하여 상세한 시각적 출력을 생성합니다. 사용자를 위한 시각적 풍부함, 동적 세부 사항, 재질, 조명, 몰입적인 외관을 추가합니다.
이 세 계층이 함께 작동함으로써 프로젝트 에덴은 세계가 무엇인지와 세계가 어떻게 보이는지를 분리할 수 있습니다.

세 가지 핵심 기능

상태 진화와 렌더링을 분리함으로써 프로젝트 에덴은 기존 접근법이 동시에 제공하기 어려운 세 가지 주요 기능을 제공합니다.
  1. 장기적인 환경 지속성

프로젝트 에덴의 세계 상태는 카메라 뷰와 독립적으로 존재합니다. 카메라가 이동하거나 사용자가 떠나거나 객체가 프레임 밖으로 이동할 때 지워지지 않습니다.
이를 통해 시스템은 일관된 환경 내에서 장기적인 탐색을 지원할 수 있습니다. 객체는 제자리에 남을 수 있습니다. 행동은 지속적인 효과를 가질 수 있습니다. 세계는 현재 뷰를 넘어 계속 존재할 수 있습니다.
예를 들어, 사용자가 불을 끄면 그 행동은 단순히 지나가는 시각적 효과가 아닙니다. 불은 세계 상태에서 꺼진 상태가 됩니다. 세계는 무슨 일이 일어났는지 기억합니다.

  1. 재사용 및 편집 가능한 장면

프로젝트 에덴은 기본 세계 상태를 읽고, 쓰고, 동적으로 수정할 수 있도록 합니다.
이는 사용자 행동이 장면 내에 보존될 수 있음을 의미합니다. 사용자가 객체를 손상시키거나 환경의 일부를 변경하거나 흔적을 남기면 나중에 사용자가 같은 변경 사항을 볼 수 있습니다. 장면은 매번 처음부터 재생성될 필요가 없습니다. 재사용, 업데이트, 확장될 수 있습니다.
이는 미래의 상호작용 콘텐츠 창작에 중요합니다. 일회용 클립이나 고립된 장면을 생성하는 대신, 창작자는 계속 진화하는 환경을 구축할 수 있습니다.

  1. 동시적 멀티플레이어 및 에이전트 상호작용

프로젝트 에덴은 또한 같은 기본 세계 안에서 여러 인간 사용자와 AI 에이전트를 지원하도록 설계되었습니다.
상태 진화와 렌더링이 분리되어 있기 때문에 다른 사용자는 다른 카메라에서 세계를 관찰하면서도 동일한 공유 상태와 상호작용할 수 있습니다. 각 사용자 행동은 같은 세계를 업데이트합니다.
이를 통해 AI 네이티브 멀티플레이어 환경, 공유 창의적 공간, 구현된 AI 훈련 환경, 다중 에이전트 시뮬레이션 시스템을 상상할 수 있습니다.
예를 들어, 두 대의 자동차가 같은 트랙에서 다른 관점에서 경주할 수 있습니다.


다른 플레이어들이 같은 사격장 안에서 행동할 수 있으며, 세계는 공유된 규칙에 기반하여 다른 결과를 생성할 수 있습니다.


AI 3D 자산에서 AI 세계로

프로젝트 에덴은 또한 VAST의 더 광범위한 AI 3D 생태계, 즉 AI 3D 창작 제품인 Tripo3D와 연결됩니다.
지난 몇 년 동안 VAST AI Research는 AI 3D 생성을 더 높은 품질, 더 빠른 생산, 더 사용 가능한 자산으로 계속 발전시켜 왔습니다. Tripo3D의 3D 생성 기능은 창의적 생산을 시각적 아이디어에서 공간적 자산으로 이동하는 데 도움을 줍니다. 이미지에서 3D 모델로와 같은 도구를 통해 창작자는 2D 참조를 보고, 편집하고, 다운스트림 워크플로에서 사용할 수 있는 3D 모델로 변환할 수 있습니다.
이는 세계 창작이 이미지 이상의 것을 필요로 하기 때문에 중요합니다. 상호작용 가능한 더 큰 공간의 일부가 될 수 있는 객체, 환경, 구조, 자산이 필요합니다.
VAST의 장기적인 방향은 상호작용 세계 창작의 장벽을 낮추는 것입니다. AI 3D 모델은 빌딩 블록을 제공합니다. 프로젝트 에덴은 다음 단계를 탐구합니다: 상태를 유지하고, 시간이 지남에 따라 진화하며, 상호작용을 지원할 수 있는 세계.

프로젝트 에덴이 가능하게 할 것

프로젝트 에덴은 차세대 상호작용 콘텐츠 창작을 위한 기반으로 위치지어져 있습니다. 일상적인 창작자들에게는 사용자가 자연어와 간단한 행동을 통해 공유 상호작용 세계를 창작할 수 있는 AI 네이티브 샌드박스 플랫폼을 가리킵니다.
게임, 영화, VR/AR, 디지털 트윈, 가상 공간을 위해 프로젝트 에덴은 AI 생성 환경이 시각적으로 풍부할 뿐만 아니라 지속적이고 반응적인 미래를 제안합니다.
연구를 위해, 물리적 규칙, 장기적 일관성, 편집 가능한 상태를 가진 시뮬레이션 환경을 제공할 수 있습니다. 이는 구현된 AI 훈련 및 다중 에이전트 평가와 특히 관련이 있습니다. 여기서 에이전트는 반응하고, 기억하고, 규칙 기반 결과를 생성할 수 있는 환경이 필요합니다.
기억과 규칙을 가진 세계는 단순한 콘텐츠 형식 이상입니다. 그것은 시뮬레이션 기반이 됩니다.

이번 발표가 중요한 이유

프로젝트 에덴은 세계 모델에 대한 다른 연구 경로를 나타내기 때문에 중요합니다.
이는 세계 모델링을 비디오 생성으로 축소하지 않습니다. 또한 정적 3D 장면 생성에서 멈추지 않습니다. 대신, 세계를 렌더링, 수정, 공유할 수 있는 진화하는 구조화된 상태로 취급합니다.
이 상태 우선 접근은 장기적 일관성, 재사용 가능한 환경, 멀티플레이어 상호작용을 위한 더 강력한 기반을 만듭니다.
생성형 AI가 계속 진화함에 따라 다음 개척지는 더 선명한 이미지, 더 긴 비디오, 더 빠른 3D 생성만이 아닐 수 있습니다. 기억하고, 반응하며, 시간이 지나도 일관성을 유지하는 세계일 수 있습니다.
A1 Art 사용자들에게 핵심 요점은 이 기능이 오늘 A1 Art 내에서 출시된다는 것이 아닙니다. 오히려, 프로젝트 에덴은 A1 Art의 생태계 파트너 중 하나가 AI 네이티브 세계 창작의 미래를 어떻게 탐구하고 있는지 보여줍니다—앞으로 몇 년 동안 창작자들이 이미지, 3D 자산, 상호작용 환경에 대해 어떻게 생각할지 형성할 수 있는 방향입니다.

전망

프로젝트 에덴은 여전히 연구 프리뷰이며, 일반적인 목적의 세계 모델을 향한 길은 초기 단계입니다. 향후 작업은 복잡한 장면 추론을 강화하고, 물리적 역학을 풍부하게 하며, 자유 관점 탐색을 확장하고, 세밀한 객체 상호작용을 개선하며, 더 강력한 상태 전환 모델을 구축하고, 실시간 렌더링 효율성을 최적화해야 할 것입니다.
하지만 방향은 분명합니다.
AI 생성은 콘텐츠 창작에서 세계 창작으로 나아가고 있습니다. 이미지, 비디오, 3D 자산은 여전히 중요하지만, 기억, 규칙, 공유 경험을 가진 지속적 상호작용 환경을 위한 빌딩 블록이 될 수 있습니다.
프로젝트 에덴은 그 미래를 향한 초기 단계입니다.
정원에는 벽이 없습니다. 에덴에 오신 것을 환영합니다.