Google DeepMind 推出 Genie 3,用于创建交互式虚拟世界的 AI

Google DeepMind 推出 Genie 3,用于创建交互式虚拟世界的 AI

Google DeepMind Genie 3 简介

今天,谷歌 DeepMind 正式发布了Genie 3,这是一个创新的通用世界模型,建立在其前身 Genie 2 建立的基础之上。这种先进的模型允许用户通过文本提示简单地创建交互式环境,其功能有望彻底改变数字故事讲述和游戏。

Genie 3 的主要功能

Genie 3 带来了一系列令人兴奋的功能,让用户可以生成高度逼真的环境来复制自然现象,例如:

  • 逼真的水流和灯光效果
  • 生态系统内的复杂相互作用
  • 细致的动物行为和复杂的植物生长

除了环境写实之外,该模型还能构建富有创意的世界,并融入富有表现力的动画角色。用户可以在虚拟世界和历史背景中打造沉浸式体验,所有场景均以高保真度呈现。

Genie 3背后的技术创新

据谷歌称,得益于显著的技术进步,Genie 3 提供了卓越的可控性和实时交互性。该模型利用先前的帧信息来保持整个环境的一致性。这项创新使生成的景观能够在数分钟内保持一致,视觉记忆保留时间长达一分钟。

局限性和挑战

尽管 Genie 3 功能强大,但也存在局限性。Google DeepMind 开发团队发现该模型仍然存在一些挑战:

  • **有限的行动空间**:虽然用户可以促使各种环境变化,但模型限制了环境内代理可用的直接行动。
  • **代理交互挑战**:当前正在进行的研究旨在增强共享空间中多个独立代理之间交互的准确建模。
  • **地理准确性**:以精确的地理保真度模拟真实世界位置的能力仍然是一个挑战。
  • **文本渲染问题:**当文本输出包含在世界的输入描述中时,主要生成清晰的文本输出。
  • **交互时长限制:**目前,Genie 3 支持有限的交互时间范围,仅延长至几分钟而不是几小时。

未来之路

目前,Genie 3 已向部分创作者和学者开放,并计划在不久的将来进行更广泛的测试。这可能预示着我们创造和体验交互式环境的方式将迎来激动人心的变革。

要了解有关 Genie 3 的更多信息,请在此处查看项目详情。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注