Apresentando Whisk: a nova ferramenta de geração de imagens do Google
O Google, renomado por suas inovações em tecnologia de busca, lançou mais uma adição impressionante às suas ofertas de IA generativa: Whisk . Atualmente em fase experimental, essa ferramenta inovadora permite que os usuários criem imagens inserindo visuais existentes em vez de exigir prompts textuais detalhados.
Como funciona o Whisk
O Whisk permite que os usuários carreguem várias imagens que podem servir a vários propósitos, incluindo definir o assunto, o estilo e a cena geral da saída desejada. Em segundo plano, a ferramenta utiliza o Gemini do Google para gerar uma descrição de texto, que é então processada pelo modelo avançado de geração de imagens, Imagen 3 .
Um olhar mais atento à Imagen 3
Lançado no início deste ano, o Imagen 3 é elogiado pelo Google como o modelo de imagem mais refinado da empresa até o momento. De acordo com o Google, ele produz imagens com detalhes superiores, iluminação aprimorada e minimiza artefatos que distraem, o que o torna uma melhoria significativa em relação às iterações anteriores.
Capturando Essência Não Réplicas Exatas
Em uma postagem de blog publicada recentemente , o Google elaborou sobre como o Whisk captura a “essência” das imagens de entrada sem necessariamente fornecer uma reprodução exata. Isso significa que a imagem resultante pode diferir em vários aspectos, como tom de pele, altura ou penteado.
Personalizando sua imagem gerada
Para lidar com potenciais discrepâncias nas imagens geradas, o Whisk inclui uma opção para os usuários ajustarem os prompts de texto subjacentes. O Google reconhece que certos recursos podem ser vitais para projetos específicos, então eles garantiram que os usuários tenham a flexibilidade de editar esses prompts em qualquer estágio do processo criativo.
Mais do que apenas um editor de imagens
Enquanto o Whisk incorpora recursos que lembram ferramentas tradicionais de edição de imagem, o Google enfatiza que ele é fundamentalmente uma “ferramenta criativa”. Ele visa facilitar a exploração experimental e a criatividade dinâmica em vez de simplesmente funcionar como um editor convencional. Além disso, os usuários têm a opção de baixar suas imagens geradas para uso pessoal ou profissional.
Disponibilidade do Whisk
Atualmente, o Whisk está disponível para usuários nos Estados Unidos que se inscreveram no programa Google Labs, que fornece acesso a uma variedade de recursos experimentais de IA generativa. Se você estiver interessado em experimentar o Whisk, pode acessá-lo por meio deste link .
Deixe um comentário