Genie 2 공개: Google DeepMind의 혁신적인 3D World Generator
AlphaGo를 개척한 것으로 알려진 Google DeepMind는 최근 단 하나의 이미지 프롬프트에서 대화형 3D 환경을 만들 수 있는 혁신적인 도구인 Genie 2를 공개했습니다. 이 고급 모델은 키보드와 마우스 컨트롤을 통해 이러한 몰입형 설정과 상호 작용을 가능하게 하여 AI 에이전트의 훈련과 평가를 용이하게 하는 것을 목표로 합니다. 아래에서 DeepMind 가 강조한 뛰어난 기능을 살펴보겠습니다 .
Genie 2의 주요 기능
- 액션 제어 가능: Genie 2는 사용자 명령에 직관적으로 반응하도록 설계되어 인간 사용자와 AI가 자연스럽게 환경과 상호 작용할 수 있습니다. 예를 들어, 사용자가 화살표 키로 탐색할 때 캐릭터는 나무나 구름과 같은 주변 물체에 영향을 미치지 않고 원활하게 움직입니다.
- Long Horizon Memory: 이 시스템은 시야에서 벗어난 환경 요소를 기억해내는 능력을 자랑합니다. 이 기능은 이러한 요소가 사용자의 시야에 다시 들어올 때 원활하게 다시 렌더링하여 사실감을 향상시킵니다.
- 동적 콘텐츠 생성: Genie 2는 전반적인 세계의 일관성을 유지하면서 지속적으로 새로운 요소를 생성하여 시간이 지남에 따라 환경이 더욱 진실되게 진화할 수 있도록 합니다.
- 새로운 기능: 이 모델은 물리, 중력, 조명 효과와 같은 복잡한 상호작용을 시뮬레이션할 수 있습니다. 또한 캐릭터를 애니메이션화하고 NPC(비플레이어블 캐릭터) 행동을 시뮬레이션하여 물 효과에서 연기 역학에 이르기까지 모든 것을 처리할 수 있습니다.
- 반사실적 시뮬레이션: Genie 2는 동일한 시작점에서 여러 시나리오를 생성할 수 있도록 합니다. 이 기능은 연구자에게 매우 귀중하여 광범위한 테스트 및 교육 애플리케이션에 대한 다양한 결과를 탐색할 수 있습니다.
- 실제 세계 이미지 프롬프트: Genie 2는 가상 이미지를 생성하는 것 외에도 실제 사진을 시작점으로 활용하여 풀이 흔들리거나 물이 흐르는 것과 같은 사실적인 자연 현상을 효과적으로 시뮬레이션할 수 있습니다.
- 신속한 프로토타입 제작 기능: 연구자는 Genie 2를 사용하여 효율적으로 대화형 경험을 개발하고, 빠른 속도의 테스트를 위해 스케치와 콘셉트 아트를 완전히 구현된 3D 세계로 신속하게 전환할 수 있습니다.
생성 AI의 과제와 논란
획기적인 기능에도 불구하고 Genie 2와 같은 생성 AI 기술은 논란이 없는 것은 아닙니다. 저작권과 지적 재산권을 둘러싼 중요한 문제는 여전히 남아 있으며, 특히 이러한 모델을 훈련하는 데이터 세트와 관련하여 허가 없이 저작권이 있는 자료가 포함되는 경우가 많습니다.
아티스트, 게임 개발자, 기술 회사는 AI 시스템을 훈련하는 데 있어 저작권이 있는 작품이 오용될 가능성에 대해 우려를 표명했습니다. 생성 AI 부문에서도 유사한 법적 분쟁이 발생했으며, OpenAI와 Stability AI와 같은 회사가 허가 없이 창작물을 사용했다는 혐의로 이미 소송을 제기했습니다. 이러한 AI 생성 환경의 품질이 전통적인 인간 디자인과 점점 더 구별하기 어려워짐에 따라 이러한 법적 문제가 확대될 가능성이 큽니다.
게다가 Meta와 X와 같은 기업에 대한 조사가 이루어지면서 윤리적 데이터 관행에 대한 논의가 심화되고 있습니다. 이러한 기업은 종종 사용자의 명시적 동의를 받지 않고 사용자가 생성한 데이터를 사용하여 모델을 훈련한다는 이유로 반발에 직면했습니다.
Genie 2에 대한 추가적인 통찰력과 개발 사항을 알아보려면 여기에서 DeepMind의 전체 발표를 참조하세요 .
답글 남기기