GoogleがGemini 3をリリース、主要AIベンチマークでOpenAIのGPT-5.1を上回る

GoogleがGemini 3をリリース、主要AIベンチマークでOpenAIのGPT-5.1を上回る

Gemini 3のご紹介: Googleの最新のAIブレークスルー

Google DeepMindの待望のGemini 3モデルが、数週間にわたる憶測とティーザー発表を経て正式にリリースされました。この最先端モデルは、AI業界において際立った高度な推論機能とマルチモーダル機能を備えています。

ベンチマークの成功と成果

Googleは、Gemini 3が1501という素晴らしいEloスコアでLMArenaリーダーボードをリードしていることを発表しました。この目覚ましい成果に加え、このモデルはHumanity’s Last Examで37.5%、GPQA Diamondで91.9%という驚異的なスコアを獲得しました。さらに、MathArena Apexでは画期的な23.4%のスコアを達成し、マルチモーダル推論ベンチマークでも優れたパフォーマンスを発揮しました。特にGemini 3 Proバージョンは、MMMU-Proで81%、Video-MMMUで87.6%という高いスコアを獲得しました。特筆すべきは、事実の正確性を測定するSimpleQA Verifiedテストで、このモデルが最高スコアである72.1%を獲得したことです。

以下の画像で、Gemini 3 Pro と GPT 5.1 および Claude Sonnet 4.5 の比較ベンチマークを確認してください。

ジェミニ3ベンチマーク

ジェミニ3 Deep Think:強化されたパフォーマンス

Googleは標準モデルに加え、様々なAIベンチマークでさらに優れたパフォーマンスを発揮するGemini 3 Deep Thinkモードも導入しました。Googleの最新データによると、この高度なモードはHumanity’s Last Examで41%、GPQA Diamondで93.8%、ARC-AGI-2(ARC Prizeで確認されたコード実行検証)で45.1%のスコアを達成しました。注目すべきは、Gemini 3の全モデルが100万トークンのブロードコンテキストウィンドウを維持している点です。

アクセシビリティとイノベーションの新時代

市場投入が遅かった以前のバージョンとは異なり、Googleは現在、積極的な展開戦略を採用しています。Google検索のAIモードでは、すでにGemini 3を活用し、新しい生成型ユーザーインターフェース(GUI)エクスペリエンスを提供しています。これには、動的なビジュアルレイアウトや、ユーザーのクエリにリアルタイムで応答できるインタラクティブなツールが含まれます。

開発と消費者の入手可能性

SWE-bench Verifiedベンチマークによると、Gemini 3 Proはコーディング能力において76.2%のスコアを達成しました。これは、OpenAIのGPT 5.1やAnthropicのSonnet 4.5にわずかに及ばない結果です。このモデルを利用したい開発者は、Google AI Studio、Vertex AI、Gemini CLI、Cursor、GitHub、JetBrains、Manus、Replit、そして新たに導入されたGoogle Antigravityエージェント開発プラットフォームなど、様々なプラットフォームで利用できるようになります。

Gemini 3モデルは、一般ユーザー向けにGeminiアプリからご利用いただけます。また、Google AI ProおよびUltraの加入者は、検索のAIモードからアクセスでき、企業はVertex AIおよびGemini Enterpriseを通じてその機能を利用できます。Gemini 3のDeep Thinkモードは、今後数週間以内にGoogle AI Ultraの加入者向けにリリースされる予定です。

出典と画像

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です