추론 중심 AI의 새로운 발전: Google과 OpenAI가 새로운 모델을 공개
9월에 OpenAI는 혁신적인 o1 시리즈의 대규모 언어 모델(LLM)을 도입하여 기준을 높였습니다. 이러한 고급 모델은 응답을 제공하기 전에 철저한 추론을 우선시하므로 과학, 코딩, 수학과 같은 분야의 복잡한 작업에 매우 효과적입니다.
오늘날로 넘어가면, Google은 Gemini 2.0 Flash Thinking 이라는 자체 추론 중심 LLM을 출시했습니다 . 로 식별된 이 실험적 모델은 gemini-2.0-flash-thinking-exp-1219
이제 Google AI Studio를 통해 개발자가 액세스할 수 있습니다. Google은 이 모델이 다중 모드 이해, 논리적 추론 및 코딩 애플리케이션에서 뛰어나다고 주장합니다.
Google의 발표에 따르면 추론 중 계산 시간을 늘리면 격려적인 결과가 나왔습니다. 그러나 이러한 주장을 입증할 구체적인 성능 벤치마크는 공개되지 않았습니다. 그럼에도 불구하고 Chatbot Arena 의 예비 피드백 에 따르면 Gemini-2.0-Flash-Thinking은 놀라운 순위를 달성했으며 현재 모든 평가 범주에서 1위를 차지하고 있습니다.
Chatbot Arena의 속보 ⚡🤔 @GoogleDeepMind 의 Gemini-2.0-Flash-Thinking이 모든 카테고리에서 1위로 데뷔했습니다! Gemini-2.0-Flash에서의 도약: – 전체: #3 → #1 – 전체(스타일 제어): #4 → #1 – 수학: #2 → #1 – 창의적 글쓰기: #2 → #1 – 하드 프롬프트: #1 → #1… https://t.co/lO1DiTiOOj pic.twitter.com/cq2MRMbWZ1
— lmarena.ai (이전 lmsys.org) (@lmarena_ai) 2024년 12월 19일
Gemini 2.0 플래시 사고의 주요 사용 사례
Google은 Gemini 2.0 Flash Thinking 모델을 실험하는 데 관심이 있는 개발자를 위해 몇 가지 매력적인 사용 사례를 설명했습니다.
- 가장 복잡한 문제를 고급 추론으로 해결
- 모델의 사고 과정을 투명하게 보여주기
- 까다로운 코딩 및 수학적 쿼리 해결
이 최첨단 모델은 128,000개 이상의 토큰에 달하는 컨텍스트 길이를 자랑하며 2024년 8월까지 확장되는 지식 차단을 특징으로 합니다. 개발자는 Google AI Studio 와 Vertex AI에서 Gemini API에 액세스하여 Gemini 추론 모델을 활용할 수 있습니다.
Gemini 2.0 Flash Thinking이 실제로 작동하는 모습을 보고 싶으신가요? 이 데모를 확인해 보세요. 이 모델이 물리 문제를 풀고 그 이유를 설명합니다. pic.twitter.com/Nl0hYj7ZFS
— Jeff Dean (@JeffDean) 2024년 12월 19일
경쟁 우위: OpenAI의 o1 모델 업데이트
이번 주 초에 OpenAI는 o1 추론 모델의 상당한 출시를 발표했으며, 이제 API 프레임워크 내에서 사용 계층 5의 개발자에게 제공됩니다. o1 모델의 이 최신 반복은 여러 널리 인정받는 AI 벤치마크에서 최첨단 성능을 보고합니다. 개발자는 이 모델을 활용하여 개선된 고객 서비스 메커니즘, 최적화된 공급망 물류, 보다 정확한 재무 예측을 포함한 다양한 애플리케이션을 개선할 수 있습니다.
Google과 OpenAI가 추론 중심 LLM을 출시하면서, 여러 산업 분야에서 혁신적인 AI 애플리케이션을 개발하기 위한 환경이 점점 더 역동적으로 바뀌고 있습니다.
답글 남기기