
오늘 구글은 향상된 제미니 2.5 모델을 공개하며 여러 주요 AI 벤치마크에서 눈에 띄는 성능 향상을 보여주었습니다.구글은 특히 새로운 제미니 2.5 프리뷰 06-05 “생각” 모델이 코딩, 수학, 과학, 논리적 추론 등 핵심 영역에서 탁월한 성능을 발휘한다고 강조했습니다.
최신 Gemini 2.5 Pro 업데이트가 프리뷰 버전으로 출시되었습니다.코딩, 추론, 과학 및 수학 능력이 향상되었고, 주요 벤치마크(AIDER Polyglot, GPQA, HLE 등)에서 향상된 성능을 보였으며, 이전 버전보다 Elo 점수가 24점 상승하여 @lmarena_ai를 앞지르고 있습니다.또한… pic.twitter.com/SVjdQ2k1tJ
— 순다르 피차이(@sundarpichai) 2025년 6월 5일
이번 발표는 지난달 Google I/O에서 공개된 Gemini 2.5 Pro 모델의 초기 업그레이드 버전을 기반으로 합니다.이 최신 버전은 벤치마크 점수를 향상시킬 뿐만 아니라 사용자 피드백을 반영하여 응답의 스타일 및 구조적 요소를 개선하고, 사용자에게 더욱 창의적이고 체계적인 결과물을 제공합니다.
아래에서는 다른 주요 AI 모델과 벤치마크를 비교 분석한 내용을 볼 수 있습니다.

첨부된 표는 Gemini 2.5 Pro 프리뷰 모델이 AIDER Polyglot과 같은 코딩 벤치마크에서 최첨단(SOTA) 모델로 자리매김했음을 보여줍니다.또한 수학, 과학, 일반 상식, 추론 능력을 평가하는 GPQA 및 Humanity’s Last Exam(HLE) 벤치마크에서도 SOTA 등급을 획득했습니다.놀랍게도, 실제 평가에서 이 최신 2.5 Pro 모델은 LMArena에서 24점, WebDevArena에서 35점 급등하여 1, 443점을 기록했습니다.
이 고급 Gemini 2.5 Pro 프리뷰 모델을 활용하고자 하는 개발자는 Google AI Studio와 Vertex AI에서 제공하는 Gemini API를 통해 접근할 수 있습니다.일반 사용자도 Gemini 앱을 통해 이 모델에 접근할 수 있습니다. Google은 Gemini 2.5 Pro 모델이 몇 주 안에 정식 출시될 예정이라고 밝혔으며, 이를 통해 프로덕션 환경에서 엔터프라이즈급 애플리케이션에 통합될 수 있는 기반을 마련할 수 있을 것으로 기대합니다.
답글 남기기