Google lanza Gemini 2.5 Flash Image: un modelo avanzado de generación de imágenes

Google lanza Gemini 2.5 Flash Image: un modelo avanzado de generación de imágenes

Google presenta el innovador modelo de imagen Flash Gemini 2.5

En un avance significativo, Google ha presentado Gemini 2.5 Flash Image, un modelo revolucionario para la generación y edición de imágenes, conocido internamente como «nano-banana».Esta herramienta avanzada está diseñada para producir y modificar imágenes, garantizando la consistencia de los caracteres y fusionando diversas imágenes a la perfección para obtener un resultado final coherente.

Elevando los estándares en la edición de imágenes

Según LMArena, Gemini 2.5 Flash Image se ha consolidado rápidamente como el modelo de edición de imágenes más avanzado, superando a competidores como GPT Image 1 de OpenAI y Flux.1 Kontext. Históricamente, las versiones anteriores de los modelos de generación de imágenes destacaban por su estética visual, pero a menudo no lograban interpretar con precisión la semántica del mundo real. El modelo Gemini 2.5 aprovecha un amplio conocimiento del mundo para mejorar el realismo y la precisión de sus imágenes.

Accesibilidad para creativos y desarrolladores

Este último modelo es fácilmente accesible tanto para consumidores como para desarrolladores. Los desarrolladores pueden utilizar Gemini 2.5 Flash Image a través de diversas plataformas, como la API de Gemini, Google AI Studio y Vertex AI, que satisface las necesidades empresariales. El precio es de $30.00 por cada millón de tokens de salida, con un promedio de aproximadamente $0.039 por imagen producida.

Los consumidores pueden experimentar las capacidades de este innovador modelo a través de las aplicaciones web y móviles de Gemini. Google ha destacado una serie de casos prácticos transformadores que los usuarios pueden explorar a través de la aplicación de Gemini:

  • Mejoras de vestuario y ubicación : los usuarios pueden cargar sus fotos, ya sean de ellos mismos o de sus mascotas, y colocarlas sin esfuerzo en nuevos entornos dinámicos manteniendo su apariencia original.
  • Fusión de fotos : El modelo permite fusionar varias imágenes para crear nuevas escenas. Por ejemplo, se puede combinar un retrato propio con el de un perro, creando un encantador momento compartido en la cancha de baloncesto.
  • Edición iterativa : los usuarios pueden participar en la edición de varios turnos, comenzando con una habitación vacía y agregando progresivamente elementos como colores de pared, estanterías o muebles para crear los espacios imaginados.
  • Fusión de diseño : los usuarios pueden aplicar de forma creativa la estética de una imagen (como patrones florales) a objetos de otra (como un par de botas de lluvia), fusionando varias inspiraciones de diseño sin esfuerzo.

Compromiso con la privacidad del usuario y la integridad de la imagen

En cuanto a la privacidad del usuario, Google ha garantizado que las imágenes subidas a la plataforma no se utilizarán para fines de entrenamiento en sus sistemas de aprendizaje automático generativo, a menos que se proporcionen como retroalimentación. Además, todas las imágenes generadas o modificadas a través de la aplicación Gemini recibirán una marca de agua visible, junto con una marca de agua digital invisible de SynthID, para mantener la autenticidad y la integridad de los derechos de autor.

Para obtener más información sobre la imagen Flash de Gemini 2.5, visita el anuncio completo en Neowin.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *