Google DeepMind がインタラクティブな 3D 環境を作成するための革新的な AI モデル Genie 2 を発表

Google DeepMind がインタラクティブな 3D 環境を作成するための革新的な AI モデル Genie 2 を発表

Genie 2 の公開: Google DeepMind の革新的な 3D 世界ジェネレーター

AlphaGo の先駆的な取り組みで知られる Google DeepMind は最近、たった 1 つの画像プロンプトからインタラクティブな 3D 環境を作成できる革新的なツール Genie 2 を発表しました。この高度なモデルは、キーボードとマウスのコントロールを通じてこれらの没入型設定とのインタラクションを可能にすることで、AI エージェントのトレーニングと評価を容易にすることを目的としています。以下では、DeepMindが強調するその傑出した機能について説明します。

Genie 2の主な特徴

  • アクション制御可能: Genie 2 は、ユーザー コマンドに直感的に応答するように設計されており、人間のユーザーと AI の両方が自然に環境と対話できます。たとえば、ユーザーが矢印キーで移動すると、キャラクターは木や雲などの周囲のオブジェクトに影響を与えることなくシームレスに移動します。
  • ロング ホライズン メモリ:このシステムは、視界から外れた環境要素を思い出す能力を誇ります。この機能により、これらの要素がユーザーの視界に再び入ったときにシームレスに再レンダリングされ、リアリズムが向上します。
  • 動的コンテンツ作成: Genie 2 は、世界全体の一貫性を維持しながら継続的に新しい要素を生成し、時間の経過とともに環境が本物らしく進化できるようにします。
  • 新たな機能:このモデルは、物理、重力、照明効果などの複雑な相互作用をシミュレートできます。さらに、キャラクターをアニメートしたり、非プレイキャラクター (NPC) の動作をシミュレートしたり、水の効果から煙のダイナミクスまですべてを処理できます。
  • 反事実シミュレーション: Genie 2 では、同一の開始点から複数のシナリオを生成できます。この機能は研究者にとって非常に貴重であり、広範なテストおよびトレーニング アプリケーションでさまざまな結果を探索できます。
  • 現実世界の画像プロンプト:仮想画像を生成するだけでなく、Genie 2 は実際の写真を開始点として使用して、ざわめく草や流れる水などのリアルな自然現象を効果的にシミュレートできます。
  • 迅速なプロトタイピング機能:研究者は Genie 2 を使用してインタラクティブなエクスペリエンスを効率的に開発し、スケッチやコンセプト アートを完全に実現した 3D ワールドに素早く変換して、ペースの速いテストを行うことができます。

生成AIにおける課題と論争

画期的な機能にもかかわらず、Genie 2 のような生成 AI テクノロジーには論争がないわけではありません。著作権と知的財産をめぐる重大な問題が依然として残っており、特にこれらのモデルをトレーニングするデータセットには著作権で保護された素材が無許可で含まれていることが多いためです。

アーティスト、ゲーム開発者、テクノロジー企業からは、AI システムのトレーニングに著作権で保護された作品が悪用される可能性について懸念の声が上がっている。生成 AI 分野でも同様の法的紛争が発生しており、OpenAI や Stability AI などの企業が許可なく創作物を使用したとして訴訟が起こされている。AI が生成した環境と従来の人間のデザインがますます区別がつかなくなってきていることを考えると、こうした法的紛争は今後ますます激化するだろう。

さらに、Meta や X などの企業に厳しい監視が向けられるにつれて、倫理的なデータ処理に関する議論が激化しています。これらの企業は、多くの場合ユーザーから明示的な同意を得ずに、ユーザーが生成したデータをモデルのトレーニングに利用したことで、反発に直面しています。

Genie 2 に関するさらなる洞察と開発については、DeepMind からの完全な発表をこちらで参照してください。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です