
Googleが最先端のGemini 2.5 Flashイメージモデルを発表
Googleは画期的な進歩として、Gemini 2.5 Flash Imageを発表しました。これは、社内で「ナノバナナ」と呼ばれている、画像生成・編集のための革新的なモデルです。この高度なツールは、文字の一貫性を保ちながら画像を作成・編集し、様々な画像をシームレスに統合して、一貫した最終結果を生み出すように設計されています。
画像編集の基準を高める
LMArenaの報道によると、Gemini 2.5 Flash Imageは、OpenAIのGPT Image 1やFlux.1 Kontextといった競合を凌駕し、画像編集モデルの頂点に急速に上り詰めました。歴史的に、画像生成モデルの初期のイテレーションは視覚的な美しさでは優れていたものの、現実世界の意味を正確に解釈する点では不十分な場合が多かったのです。Gemini 2.5モデルは、広範な世界知識を活用することで、画像出力のリアリティと精度の両方を向上させています。
クリエイターと開発者のためのアクセシビリティ
この最新モデルは、消費者と開発者の両方にとって容易に利用可能です。開発者にとって、Gemini 2.5 Flash Imageは、Gemini API、Google AI Studio、そしてエンタープライズレベルのニーズに対応するVertex AIなど、様々なプラットフォームを通じて利用できます。価格は出力トークン100万個あたり30ドルに設定されており、生成される画像1枚あたり平均約0.039ドルとなります。
消費者は、Geminiのウェブアプリとモバイルアプリを通じて、この革新的なモデルの機能を体験できます。Googleは、ユーザーがGeminiアプリを通じて探索できる、革新的なユースケースを幅広く紹介しています。
- コスチュームとロケーションの強化: ユーザーは自分自身やペットの写真をアップロードし、元の外観を維持しながら、新しいダイナミックな設定に簡単に配置できます。
- 写真の合成:このモデルでは、複数の画像を合成して新しいシーンを作成できます。例えば、自分のポートレートと愛犬の写真を合成すれば、バスケットボールコートでの素敵な瞬間を共有したような写真が完成します。
- 反復編集: ユーザーは、空の部屋から始めて、壁の色、本棚、家具などの要素を徐々に追加し、思い描いた空間を作成する、複数回の編集を行うことができます。
- デザインの融合: ユーザーは、1 つの画像 (花柄など) の美学を別の画像 (レインブーツなど) のオブジェクトに創造的に適用し、さまざまなデザインのインスピレーションを簡単に融合できます。
ユーザーのプライバシーと画像の完全性への取り組み
ユーザーのプライバシー保護の観点から、Googleは、プラットフォームにアップロードされた画像は、フィードバックとして提供されない限り、生成型機械学習システムの学習には利用されないことを保証しています。さらに、Geminiアプリで生成または変更されたすべての画像には、真正性と著作権の完全性を維持するために、目に見える透かしと目に見えないSynthIDデジタル透かしが付与されます。
Gemini 2.5 フラッシュ イメージの詳しい情報については、Neowinの完全な発表をご覧ください。
コメントを残す