今週初め、Google の Gemini (旧 Bard) チャットボットの画像生成機能が不適切なアートワークを作成しているとの報告が始まりました。より具体的には、このシステムは、歴史上または架空の役柄にふさわしくない、肌の色の濃い人々を描写していました。
このアートが報告された後、GoogleはGeminiの画像ジェネレーターを使って人物のアートワークを作成する機能を一時的に停止すると発表した。金曜日遅く、同社はブログ投稿でジェミニで何が起こったのかについて説明を提供した。
また、チャットボットが実際の人々の画像を作成することも望んでいませんでした。
同時に Google は、フットボール チームの人々を映すなど、より一般的な画像をチャットボットに要求した場合に、Gemini がさまざまな民族を描写できるようにしたいとも考えていました。白人の医師や黒人の教師など、特定のタイプの人物を描いてほしい場合、ジェミニはそのアートワークも作成できるはずです。
その後、ラガバン氏は、ジェミニのテキストプロンプトのガードレールにある 2 つの特定の事柄により、今週の不適切な画像の作成が可能になったと書きました。
まず、ジェミニがさまざまな人々を示すように調整したことにより、明らかに範囲を示すべきではないケースを説明できませんでした。そして第二に、時間の経過とともに、モデルは私たちが意図していたよりもはるかに慎重になり、特定のプロンプトに完全に答えることを拒否し、非常に異常なプロンプトを敏感なものとして誤って解釈しました。
これら 2 つのことにより、モデルはある場合には過剰に補正し、別の場合には過度に保守的になり、恥ずかしい画像や間違った画像が生成されてしまいました。
Google がガードレールを修正し、Gemini 画像ジェネレーターを使って人々とアート作品を制作できるようになるまでにどれくらいの時間がかかるかについては何も語られていない。ラガバン氏は、ジェミニが攻撃的なアートワークを決して作成しないとは約束できないが、グーグルは「問題が特定されるたびに行動を起こし続ける」と述べた。
コメントを残す