Google Gemini 2.5 のディープシンクモデルが OpenAI O3 と Gork 4 を上回る

Google Gemini 2.5 のディープシンクモデルが OpenAI O3 と Gork 4 を上回る
ジェミニ 2.5 ディープシンク

Google、Gemini 2.5 Deep Thinkを発表:AI機能の飛躍的進歩

Googleは本日、重要な発表を行い、GeminiアプリにGemini 2.5 Deep Thinkモデルを導入したことを発表しました。このモデルはGoogle AI Ultraサブスクリプションメンバー限定で利用可能です。この最先端モデルは、OpenAIのo3やxAIのGork 4といった著名な競合モデルを、複数の主要ベンチマークにおいて凌駕する性能を示しました。

Gemini 2.5 Proからの進化

Gemini 2.5の旅は、5月に開催されたGoogle I/O 2025イベントで発表されたGemini 2.5 Pro Deep Thinkモデルから始まりました。この革新的なモデルは、高度な研究手法を用いて様々な仮説を分析し、その上で回答を提示します。本日のアップデートでは、初期テスターからの貴重なフィードバックと近年の研究成果に基づき、機能が強化されています。Googleは、これらのアップデートはI/Oで発表された初期バージョンと比較して、大きな飛躍を遂げたと断言しています。

銅メダルのパフォーマンス

さらにGoogleは、最新のDeep Thinkモデルは、2025年国際数学オリンピック(IMO)で最近金メダルを獲得したバージョンの派生版であることを明らかにしました。しかし、より幅広い適用性を確保するため、このモデルはより高速な応答を実現するように最適化されており、2025年のIMOベンチマークでブロンズレベルの評価を獲得しています。

優れたベンチマーク結果

付属のベンチマークで強調されているように、Gemini 2.5 Deep Think は、LiveCodeBench V6、Humanity’s Last Exam、IMO 2025、AIME 2025 などの評価で優れた成績を収め、その堅牢な機能を実証しました。

GeminiアプリでDeep Thinkにアクセスする

Google AI Ultraの加入者は、Geminiアプリを通じてDeep Thinkを利用できるようになりました。ただし、1日のプロンプト回数には制限があります。Gemini 2.5 Proモデルをご利用の場合、プロンプトバーで「Deep Think」機能を選択できます。さらに、GoogleはDeep Thinkがコード実行やGoogle検索などのツールとシームレスに統合されることを示唆しています。今後数週間以内に、Gemini APIを介して、信頼できる厳選された開発者グループに、ツール付きとツールなしのDeep Thinkバージョンを提供する予定です。

競争環境

現在、焦点は OpenAI の GPT-5 モデルの予想されるリリースに移っており、重要な疑問が浮かび上がっています。今後のベンチマーク評価で、このモデルは Gemini 2.5 Deep Think を上回るでしょうか?

出典と画像

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です