
Google revela o modelo de imagem Flash Gemini 2.5 de última geração
Em um avanço significativo, o Google lançou o Gemini 2.5 Flash Image, um modelo revolucionário para geração e edição de imagens que foi apelidado internamente de “nano-banana”.Esta ferramenta avançada foi projetada para produzir e alterar imagens, garantindo a consistência dos caracteres e mesclando perfeitamente várias imagens em um resultado final coerente.
Elevando os padrões em edição de imagens
Conforme relatado pela LMArena, o Gemini 2.5 Flash Image ascendeu rapidamente ao auge dos modelos de edição de imagens, superando concorrentes como o GPT Image 1 da OpenAI e o Flux.1 Kontext. Historicamente, as iterações anteriores de modelos de geração de imagens se destacaram em estética visual, mas frequentemente falharam em interpretar com precisão a semântica do mundo real. O modelo Gemini 2.5 utiliza amplo conhecimento do mundo para aprimorar o realismo e a precisão em suas saídas de imagem.
Acessibilidade para Criativos e Desenvolvedores
Este modelo mais recente é facilmente acessível tanto para consumidores quanto para desenvolvedores. Para desenvolvedores, o Gemini 2.5 Flash Image pode ser utilizado em diversas plataformas, incluindo a API Gemini, o Google AI Studio e o Vertex AI, atendendo às necessidades de nível empresarial. O preço é de US$ 30, 00 para cada milhão de tokens de saída, com média de aproximadamente US$ 0, 039 por imagem produzida.
Os consumidores podem experimentar os recursos deste modelo inovador por meio dos aplicativos web e mobile Gemini. O Google destacou uma série de casos de uso transformadores que os usuários podem explorar por meio do aplicativo Gemini:
- Melhorias no traje e no local : os usuários podem enviar suas fotos, sejam elas suas ou de seus animais de estimação, e colocá-las facilmente em novos cenários dinâmicos, mantendo sua aparência original.
- Mesclagem de Fotos : O modelo permite a mesclagem de várias imagens para criar novas cenas. Por exemplo, é possível combinar o retrato com o do cachorro, resultando em um momento encantador compartilhado na quadra de basquete.
- Edição iterativa : os usuários podem realizar edições em várias etapas, começando com uma sala vazia e adicionando progressivamente elementos como cores de parede, estantes ou móveis para criar os espaços imaginados.
- Fusão de design : os usuários podem aplicar criativamente a estética de uma imagem (como padrões florais) a objetos de outra (como um par de botas de chuva), mesclando várias inspirações de design sem esforço.
Compromisso com a privacidade do usuário e integridade da imagem
Em termos de privacidade do usuário, o Google garantiu que as imagens carregadas na plataforma não serão utilizadas para fins de treinamento em seus sistemas generativos de aprendizado de máquina, a menos que sejam fornecidas como feedback. Além disso, todas as imagens geradas ou modificadas pelo aplicativo Gemini receberão uma marca d’água visível, juntamente com uma marca d’água digital SynthID invisível, para manter a autenticidade e a integridade dos direitos autorais.
Para mais informações sobre o Gemini 2.5 Flash Image, visite o anúncio completo no Neowin.
Deixe um comentário