Whisk の紹介: Google の新しい画像生成ツール
検索技術の革新で知られる Google が、生成 AI 製品にさらにもう 1 つの素晴らしい機能を追加した。Whiskだ。現在は実験段階だが、この画期的なツールにより、ユーザーは詳細なテキスト プロンプトを必要とせず、既存のビジュアルを入力することで画像を作成できる。
泡立て器の仕組み
Whisk を使用すると、ユーザーは複数の画像をアップロードして、目的の出力の主題、スタイル、全体的なシーンを定義するなど、さまざまな目的に使用できます。バックグラウンドでは、このツールは Google の Gemini を使用してテキストの説明を生成し、それを高度な画像生成モデルであるImagen 3で処理します。
Imagen 3 を詳しく見る
今年初めに発表された Imagen 3 は、Google がこれまでで最も洗練された画像モデルであると宣伝しています。Google によると、このモデルは優れたディテール、強化された照明、そして邪魔なアーティファクトを最小限に抑えた画像を生成するため、以前のバージョンよりも大幅に改善されています。
正確な複製ではなく本質を捉える
Google は最近公開したブログ記事で、Whisk が必ずしも正確な再現を提供することなく、入力画像の「本質」を捉える仕組みについて詳しく説明しました。つまり、結果として得られる画像は、肌の色、身長、髪型など、いくつかの点で異なる可能性があります。
生成されたイメージをカスタマイズする
生成された画像に生じる可能性のある矛盾に対処するため、Whisk には、ユーザーが基になるテキスト プロンプトを調整できるオプションが含まれています。Google は、特定の機能が特定のプロジェクトにとって非常に重要になる可能性があることを認識しており、ユーザーがクリエイティブ プロセスのどの段階でもこれらのプロンプトを編集できる柔軟性を確保しています。
単なる画像エディタ以上のもの
Whisk には従来の画像編集ツールを彷彿とさせる機能が組み込まれていますが、Google はこれが基本的に「クリエイティブ ツール」であることを強調しています。これは、従来のエディターとして機能するだけでなく、実験的な探求とダイナミックな創造性を促進することを目的としています。さらに、ユーザーは、個人または業務用に、生成した画像をダウンロードすることもできます。
泡立て器の可用性
現在、Whisk は、さまざまな実験的な生成 AI 機能へのアクセスを提供する Google Labs プログラムに登録している米国のユーザーが利用できます。Whisk を試してみたい場合は、このリンクからアクセスできます。
コメントを残す