Googleは、初の完全ハイブリッド推論モデルとしてGemini 2.5 Flashプレビューを発表した。

Googleは、初の完全ハイブリッド推論モデルとしてGemini 2.5 Flashプレビューを発表した。

Google、強化された機能を備えたGemini 2.5 Flashモデルを発表

先週、多くの期待を集めたCloud Nextイベントにおいて、GoogleはGemini 2.5 Flashモデルの近々リリースするというエキサイティングな発表を行いました。この新しいバージョンは大幅な進化を約束しており、 Google AI StudioとVertex AI環境の両方でGemini APIを通じてプレビューできます。Geminiユーザーは、Canvasとシームレスに統合されたモデルピッカーを使用してこのモデルに簡単にアクセスできます。これにより、ドキュメントとコードの改良プロセスが強化されます。

前モデルからの改良点

前身のGemini 2.0 Flashの基盤を基に、バージョン2.5では推論機能が大幅に強化され、価格も抑えながらレイテンシも最小限に抑えられています。Googleによると、この新モデルは優れたコストパフォーマンスを実現するように設計されています。価格の詳細は以下のとおりです。

  • 100万入力トークンごとに0.15ドル
  • 理由なしの出力トークン100万個につき0.60ドル
  • 理由付き出力トークン100万個ごとに3.50ドル

これはFlash 2.5の初期バージョンですが、既にFlash 2.0と比べて大幅な改善が見られます。 必要に応じて思考を完全にオフにし、このモデルをFlash 2.0の代替として使用できます。Gemini API、AI Studio、Vertex、そしてGeminiアプリでご利用いただけます。

— ローガン・キルパトリック(@OfficialLoganK)2025年4月17日

ハイブリッド推論機能の導入

Gemini 2.5 Flashモデルは、Google初の完全ハイブリッド推論モデルとして重要なマイルストーンを画し、開発者が推論機能のオン/オフを切り替えることを可能にします。この柔軟性により、開発者はアプリケーションを最適化し、プロジェクトのニーズに応じて品質、コスト、応答遅延のトレードオフを調整できるようになります。

ジェミニ2.5フラッシュ

比較パフォーマンスの洞察

添付のベンチマーク表に示されているように、Gemini 2.5 Flashモデルは、低コストにもかかわらず、AnthropicやGrokの主要モデルと効果的に競合します。OpenAIが最近リリースしたo4-miniは、Gemini 2.5 Flashプレビューと比較して優れたパフォーマンスを示していますが、価格がかなり高く、現在の市場環境におけるGoogleの製品の競争力を浮き彫りにしています。

この画期的なモデルに関するより詳しい情報と考察については、元のソースを参照してください。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です