
구글, 최첨단 제미니 2.5 플래시 이미지 모델 공개
Google은 획기적인 발전을 이루며, 이미지 생성 및 편집을 위한 혁신적인 모델인 Gemini 2.5 Flash Image를 출시했습니다.이 모델은 내부적으로 ‘나노 바나나’라는 별칭을 가지고 있습니다.이 고급 도구는 문자의 일관성을 유지하면서 이미지를 생성하고 수정하며, 다양한 이미지를 하나의 일관된 최종 결과물로 완벽하게 병합하도록 설계되었습니다.
이미지 편집의 표준 향상
LMArena의 보도에 따르면, Gemini 2.5 Flash Image는 OpenAI의 GPT Image 1과 Flux.1 Kontext와 같은 경쟁 모델을 제치고 이미지 편집 모델의 정점에 빠르게 올랐습니다.역사적으로 초기 이미지 생성 모델은 시각적 미적 측면에서는 탁월했지만, 실제 세계의 의미를 정확하게 해석하는 데는 종종 부족했습니다. Gemini 2.5 모델은 광범위한 세계 지식을 활용하여 이미지 출력의 사실성과 정확성을 모두 향상시킵니다.
크리에이티브 및 개발자를 위한 접근성
이 최신 모델은 소비자와 개발자 모두 쉽게 이용할 수 있습니다.개발자의 경우, Gemini 2.5 Flash Image는 Gemini API, Google AI Studio, Vertex AI 등 다양한 플랫폼을 통해 활용 가능하여 기업 수준의 니즈를 충족할 수 있습니다.가격은 출력 토큰 100만 개당 30달러로, 생성된 이미지당 평균 약 0.039달러입니다.
소비자는 Gemini 웹과 모바일 애플리케이션을 통해 이 혁신적인 모델의 기능을 체험할 수 있습니다. Google은 사용자가 Gemini 앱을 통해 살펴볼 수 있는 다양한 혁신적인 사용 사례를 소개했습니다.
- 의상 및 장소 향상 : 사용자는 자신이나 애완동물의 사진을 업로드하고 원래 모습을 그대로 유지하면서 새로운 동적 설정에 손쉽게 배치할 수 있습니다.
- 사진 블렌딩 : 이 모델을 사용하면 여러 이미지를 병합하여 새로운 장면을 만들 수 있습니다.예를 들어, 자신의 사진과 반려견의 사진을 결합하여 농구 코트에서 함께한 매력적인 순간을 만들 수 있습니다.
- 반복 편집 : 사용자는 빈 방에서 시작하여 벽 색상, 책장, 가구 등의 요소를 점진적으로 추가하여 여러 차례 편집을 진행하여 상상하는 공간을 만들 수 있습니다.
- 디자인 퓨전 : 사용자는 하나의 이미지(예: 꽃무늬)의 미학을 다른 이미지(예: 레인부츠)의 객체에 창의적으로 적용하여 다양한 디자인 영감을 손쉽게 병합할 수 있습니다.
사용자 개인 정보 보호 및 이미지 무결성에 대한 약속
사용자 개인정보 보호 측면에서, Google은 플랫폼에 업로드된 이미지가 피드백으로 제공되는 경우를 제외하고는 생성 머신러닝 시스템의 학습 목적으로 사용되지 않는다고 보장했습니다.또한, Gemini 앱을 통해 생성되거나 수정된 모든 이미지에는 진위성과 저작권 무결성을 유지하기 위해 눈에 보이는 워터마크와 눈에 보이지 않는 SynthID 디지털 워터마크가 함께 적용됩니다.
Gemini 2.5 Flash Image에 대한 자세한 내용을 알아보려면 Neowin 에서 전체 발표 내용을 확인하세요.
답글 남기기