Gemini 1.5 Flash 모델은 출시 이후 개발자들 사이에서 빠르게 인기를 얻었는데, 주로 인상적인 속도와 비용 효율성 때문입니다. 8월에 Google은 Gemini 1.5 Flash 8B를 출시했는데, 이는 80억 개의 매개변수만 사용하여 비용을 더욱 절감하도록 설계된 실험적 AI 모델입니다.
개발자들과 몇 주간의 테스트를 거친 후, Google은 오늘 Gemini 1.5 Flash 8B가 이제 프로덕션에 적합하다고 발표했습니다. 이 모델은 대량 멀티모달 애플리케이션, 긴 컨텍스트 요약 작업 등에서 탁월합니다. 원래 1.5 Flash와 비교했을 때, 새로운 1.5 Flash 8B 모델은 50% 더 저렴하고, 2배 더 높은 속도 제한을 지원하며, 더 작은 프롬프트에 대한 지연 시간을 줄였습니다.
성능 측면에서 1.5 Flash 8B는 5월에 출시된 1.5 Flash 모델과 매우 유사합니다. 특히 채팅 인터페이스, 필사, 장문 언어 번역과 같은 작업을 처리하는 데 능숙합니다. 이 새로운 모델에 대한 벤치마크 결과 비교는 아래에서 확인할 수 있습니다.
8B 모델의 두드러진 특징은 저렴함인데, Gemini 1.5 Flash 8B는 지금까지 Google에서 출시한 AI 모델 중 가장 저렴한 모델입니다. 자세한 가격 분석은 다음과 같습니다.
- 프롬프트에 100만 개의 토큰이 있을 때마다 $0.0375
- 프롬프트에 100만 개의 토큰이 있을 때마다 $0.15
- 캐시된 프롬프트에서 100만 개의 토큰당 $0.01
대량 AI 애플리케이션을 처리하기 위해 Google은 이 모델의 속도 제한도 높이고 있습니다. Gemini 1.5 Flash 8B는 이제 분당 4,000개의 요청(RPM)을 수용하며, 이는 이전 제한의 두 배입니다.
새로운 gemini-1.5-flash-8b 모델을 탐색하는 데 관심이 있는 개발자는 Google AI Studio와 Gemini API를 통해 무료 액세스에 가입할 수 있습니다. 유료 계층 개발자의 경우 이 혁신적인 모델에 대한 청구는 10월 14일 월요일부터 시작됩니다.
성능, 합리적인 가격, 접근성이 뛰어나게 조화를 이룬 Google의 Gemini 1.5 Flash 8B 모델은 다양한 분야의 개발자들에게 선호되는 AI 솔루션이 될 것으로 기대됩니다.
출처: 구글
답글 남기기