구글 딥마인드, 대화형 가상 세계를 만드는 AI ‘제니 3’ 공개

구글 딥마인드, 대화형 가상 세계를 만드는 AI ‘제니 3’ 공개

Google DeepMind의 Genie 3 소개

오늘, Google DeepMind는 이전 모델인 Genie 2에서 구축한 기반을 기반으로 하는 혁신적인 범용 세계 모델인 Genie 3를 공식 발표 했습니다.이 고급 모델을 사용하면 사용자는 텍스트 프롬프트를 통해 간단히 대화형 환경을 만들 수 있으며, 디지털 스토리텔링과 게임에 혁명을 일으킬 기능을 제공합니다.

Genie 3의 주요 기능

Genie 3는 사용자가 자연 현상을 재현하는 매우 사실적인 환경을 생성할 수 있도록 하는 스릴 넘치는 기능을 다양하게 제공합니다.예를 들면 다음과 같습니다.

  • 사실적인 물의 흐름과 조명 효과
  • 생태계 내의 복잡한 상호 작용
  • 자세한 동물 행동과 복잡한 식물 성장

이 모델은 사실적인 환경 표현 외에도, 창의적인 세계관 구축을 가능하게 하여 표현력이 풍부한 애니메이션 캐릭터를 통합할 수 있도록 합니다.사용자는 상상의 세계와 역사적 배경을 모두 아우르는 몰입형 경험을 제작할 수 있으며, 모두 높은 충실도로 렌더링됩니다.

Genie 3의 기술 혁신

Google에 따르면, Genie 3는 눈부신 기술 발전을 통해 놀라운 수준의 제어 가능성과 실시간 상호작용성을 제공합니다.이 모델은 이전 프레임 정보를 활용하여 환경 전반의 응집력을 유지합니다.이러한 혁신 덕분에 생성된 풍경은 몇 분 동안 일관성을 유지하며, 시각적 기억은 최대 1분까지 유지됩니다.

한계와 과제

Genie 3는 인상적인 기능에도 불구하고 한계가 있습니다. Google DeepMind 개발팀은 모델 내에 여전히 존재하는 몇 가지 과제를 발견했습니다.

  • **제한된 행동 공간:** 사용자는 다양한 환경 변화를 유도할 수 있지만, 이 모델은 환경 내에서 에이전트가 수행할 수 있는 직접적인 행동을 제한합니다.
  • **에이전트 상호작용 과제:** 현재 공유 공간에서 여러 독립 에이전트 간의 상호작용을 정확하게 모델링하기 위한 연구가 진행 중입니다.
  • **지리적 정확도:** 실제 위치를 정확한 지리적 충실도로 시뮬레이션하는 능력은 여전히 과제입니다.
  • **텍스트 렌더링 문제:** 명확한 텍스트 출력은 주로 세계에 대한 입력 설명에 포함될 때 생성됩니다.
  • **상호 작용 시간 제한:** 현재 Genie 3는 상호 작용에 대한 제한된 시간 프레임을 지원하며, 몇 시간이 아닌 몇 분으로만 확장됩니다.

앞으로의 길

현재 Genie 3는 일부 창작자와 학자들에게만 공개되어 있으며, 가까운 시일 내에 더 광범위한 테스트를 진행할 계획입니다.이는 인터랙티브 환경을 제작하고 경험하는 방식에 있어 흥미로운 변화를 가져올 수 있습니다.

Genie 3에 대해 자세히 알아보려면 여기에서 프로젝트 세부 정보를 확인하세요.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다