Google lança modelo de texto para imagem de alta qualidade Imagen 3 para usuários Gemini

No início deste ano, o Google revelou o Imagen 3, seu modelo de geração de texto para imagem mais avançado até o momento. Esta versão atualizada traz inúmeras melhorias na qualidade e precisão da imagem. De acordo com o Google, o Imagen 3 atinge um nível excepcional de detalhes, criando imagens fotorrealistas que exibem artefatos de distração mínimos em comparação com seu antecessor, o Imagen 2.

Recentemente, o Google tornou o modelo Imagen 3 acessível a todos os usuários Gemini ao redor do mundo. Com este lançamento, tanto os usuários Gemini padrão quanto os Gemini Advanced podem descrever os visuais que desejam gerar, e o Gemini produzirá a imagem correspondente via IA. No entanto, observe que apenas aqueles com acesso Gemini Advanced podem gerar imagens que retratam figuras humanas.

Se a imagem gerada não atender às suas expectativas, você pode refiná-la fornecendo detalhes adicionais em sua solicitação. Quanto mais preciso você for com suas especificações de imagem, mais precisos serão os resultados que o Gemini entrega. O modelo Imagen 3 aprimorado exibe uma maior compreensão da linguagem natural e da intenção subjacente por trás dos prompts, capturando até mesmo detalhes diferenciados de descrições estendidas.

Outra área em que o Imagen 3 se destaca é na renderização de texto, um aspecto que tem apresentado desafios para muitos modelos contemporâneos de geração de imagens. Esse recurso permite que os usuários produzam saudações de aniversário personalizadas, locais marcados com sinalização e vários outros pedidos personalizados.