Google, Gemini 사용자를 위한 고품질 텍스트-이미지 모델 Imagen 3 출시

올해 초, Google은 지금까지 가장 진보된 텍스트-이미지 생성 모델인 Imagen 3를 공개했습니다. 이 업데이트된 버전은 이미지 품질과 정확도에 많은 개선 사항을 제공합니다. Google에 따르면 Imagen 3는 이전 모델인 Imagen 2에 비해 산만함을 유발하는 아티팩트가 최소화된 사실적인 이미지를 제작하여 뛰어난 수준의 세부 정보를 제공합니다.

최근 Google은 Imagen 3 모델을 전 세계의 모든 Gemini 사용자에게 공개했습니다. 이번 출시로 표준 Gemini 및 Gemini Advanced 사용자 모두 생성하려는 비주얼을 설명할 수 있으며 Gemini는 AI를 통해 해당 이미지를 생성합니다. 그러나 Gemini Advanced 액세스 권한이 있는 사용자만 인물을 묘사하는 이미지를 생성할 수 있습니다.

생성된 이미지가 기대에 부응하지 못하는 경우, 요청 시 추가 세부 정보를 제공하여 이미지를 다듬을 수 있습니다. 이미지 사양을 더 정확하게 지정할수록 Gemini가 제공하는 결과도 더 정확해집니다. 향상된 Imagen 3 모델은 자연어와 프롬프트의 기본 의도에 대한 더 큰 이해를 보여주며, 확장된 설명에서 미묘한 세부 정보까지 포착합니다.

Imagen 3가 뛰어난 또 다른 분야는 텍스트 렌더링으로, 많은 현대 이미지 생성 모델에 과제를 안겨준 측면입니다. 이 기능을 사용하면 사용자가 맞춤 생일 인사, 표지판으로 표시된 위치 및 기타 다양한 개인화된 요청을 생성할 수 있습니다.