Gemini 1.5 Flash モデルは、その優れた速度とコスト効率により、発売以来開発者の間で急速に人気を博しています。8 月に Google は、80 億のパラメータのみを使用してコストをさらに削減するように設計された実験的な AI モデル、Gemini 1.5 Flash 8B を発表しました。
Google は、開発者との数週間にわたるテストを経て、本日、Gemini 1.5 Flash 8B が本番環境に対応可能になったことを発表しました。このモデルは、大容量のマルチモーダル アプリケーション、長いコンテキストの要約タスクなどに優れています。オリジナルの 1.5 Flash と比較すると、新しい 1.5 Flash 8B モデルは 50% 安価で、2 倍のレート制限をサポートし、小さなプロンプトのレイテンシが短縮されています。
パフォーマンスに関しては、1.5 Flash 8B は 5 月に発売された 1.5 Flash モデルとほぼ同等です。チャット インターフェイス、文字起こし、長いコンテキストの言語翻訳などのタスクの処理に特に適しています。この新しいモデルのベンチマーク結果の比較は以下をご覧ください。
8B モデルの際立った特徴はその手頃な価格であり、Gemini 1.5 Flash 8B はこれまで Google が提供した AI モデルの中で最も予算に優しいモデルとなっています。価格の詳細な内訳は次のとおりです。
- プロンプトで100万トークンあたり0.0375ドル
- プロンプトで100万トークンあたり0.15ドル
- キャッシュされたプロンプトでは 100 万トークンあたり 0.01 ドル
大量の AI アプリケーションに対応するために、Google はこのモデルのレート制限も引き上げています。Gemini 1.5 Flash 8B は現在、1 分あたり 4,000 リクエスト (RPM) に対応しており、これは以前の制限の 2 倍です。
新しい gemini-1.5-flash-8b モデルを試してみたい開発者は、Google AI Studio と Gemini API を通じて無料アクセスにサインアップできます。有料レベルの開発者の場合、この革新的なモデルの課金は 10 月 14 日月曜日から開始されます。
Google の Gemini 1.5 Flash 8B モデルは、パフォーマンス、手頃な価格、アクセシビリティの優れた組み合わせにより、さまざまな分野の開発者に好まれる AI ソリューションとなるでしょう。
出典: Google
コメントを残す