Google Gemma 3n: メモリ使用量を抑えながらローカルパフォーマンスを強化

Google Gemma 3n: メモリ使用量を抑えながらローカルパフォーマンスを強化

Google I/O 2025で発表された主要なイノベーション

大きな期待を集めたGoogle I/O 2025イベントにおいて、Googleは画期的な人工知能ツールの数々を披露しました。中でも注目すべきは、すべてのユーザーが利用できるようになったGemini Flash 2.5のリリースです。さらに、ローカルデバイス操作向けに特別に設計された小規模言語モデル(LLM)であるGemma 3nも発表しました。

Gemma 3nを支える革新的なテクノロジー

Gemma 3nの際立った特徴は、Google DeepMindによる革新的な開発である層別埋め込み(PLE)の実装です。この技術はメモリ使用量を削減するだけでなく、パフォーマンスを大幅に向上させます。Gemma 3nは、生のパラメータ数が50億と80億ですが、20億と40億のパラメータを持つモデルと同等のメモリオーバーヘッドを実現しています。Googleによると、どちらの構成でも必要なメモリはそれぞれわずか2GBと3GBです

強化された速度と品質機能

Gemma 3nは、コンパクトなメモリフットプリントに加え、KVC共有アクティベーション量子化といった高度な手法を採用することで、モバイルデバイスにおける応答速度を前世代機であるGemma 3 4Bと比較して1.5倍に向上させています。さらに、独自のミックス&マッチ機能により、ユーザーのニーズに合わせて応答をカスタマイズする動的なサブモデルを構築できます。

プライバシーと機能性を向上するローカル実行

Gemma 3nの大きな利点は、ローカル実行によって動作し、すべての処理がユーザーのデバイス上で行われることです。この機能により、データがサーバーに送信されないことが保証され、プライバシーが強化されるとともに、インターネット接続なしでも操作が可能になります。これは、オフライン環境での信頼性が求められるユーザーにとって非常に貴重な資産です。

マルチモーダル能力と言語能力

Gemma 3nは、マルチモーダル入力に優れた性能を発揮するように設計されており、音声、テキスト、画像を巧みに処理します。強化されたビデオ理解機能により、様々なモダリティ間での文字起こしや翻訳といった複雑なタスクも処理可能となり、多様なコンテンツタイプとのシームレスなインタラクション体験をユーザーに提供します。

さらに、このモデルは英語以外の言語の処理においても顕著な改善を示しており、特に日本語、ドイツ語、韓国語、スペイン語、フランス語において優れたパフォーマンスを発揮しています。パフォーマンス指標は多言語ベンチマークにおいて高いパフォーマンスを示しており、WMT24++では50.1%という驚異的なスコアを達成しています。

Gemma 3n を使い始める

Gemma 3nは、 Google AI Studioからブラウザから直接ご利用いただけます。インストールは不要です。ローカル統合に関心のある開発者向けに、GoogleはGoogle AI Edgeを通じてリソースを提供しています。このプラットフォームは、テキスト処理と画像処理の両方の機能をユーザーに提供する必須ツールとライブラリを提供しており、今後さらなる機能強化が期待されています。

出典と画像

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です