Google lance Gemini 2.5 Flash Image – Modèle avancé de génération d’images

Google lance Gemini 2.5 Flash Image – Modèle avancé de génération d’images

Google dévoile le modèle d’image Flash Gemini 2.5 de pointe

Google a lancé Gemini 2.5 Flash Image, un modèle révolutionnaire de génération et de retouche d’images baptisé en interne « nano-banane ».Cet outil avancé est conçu pour produire et modifier des images tout en garantissant la cohérence des caractères et en fusionnant harmonieusement plusieurs images pour obtenir un résultat final cohérent.

Élever les normes en matière de retouche d’images

Comme le rapporte LMArena, Gemini 2.5 Flash Image s’est rapidement hissé au sommet des modèles d’édition d’images, surpassant des concurrents tels que GPT Image 1 d’OpenAI et Flux.1 Kontext. Historiquement, les versions précédentes des modèles de génération d’images excellaient en esthétique visuelle, mais manquaient souvent d’interprétation précise de la sémantique du monde réel. Le modèle Gemini 2.5 s’appuie sur une connaissance approfondie du monde pour améliorer le réalisme et la précision de ses images.

Accessibilité pour les créatifs et les développeurs

Ce nouveau modèle est facilement accessible aux consommateurs comme aux développeurs. Pour les développeurs, Gemini 2.5 Flash Image est utilisable sur différentes plateformes, notamment l’API Gemini, Google AI Studio et Vertex AI, pour répondre aux besoins des entreprises. Le prix est fixé à 30 $ pour chaque million de jetons générés, soit environ 0, 039 $ par image produite.

Les consommateurs peuvent découvrir les fonctionnalités de ce modèle innovant via les applications web et mobiles Gemini. Google a mis en avant une série de cas d’usage transformateurs que les utilisateurs peuvent explorer via l’application Gemini :

  • Améliorations des costumes et des lieux : les utilisateurs peuvent télécharger leurs photos, qu’elles soient d’eux-mêmes ou de leurs animaux de compagnie, et les placer sans effort dans de nouveaux paramètres dynamiques tout en conservant leur apparence d’origine.
  • Fusion de photos : Le modèle permet de fusionner plusieurs images pour créer de nouvelles scènes. Par exemple, on peut combiner son portrait avec celui de son chien, créant ainsi un charmant moment partagé sur un terrain de basket.
  • Édition itérative : les utilisateurs peuvent s’engager dans une édition multi-tours, en commençant par une pièce vide et en ajoutant progressivement des éléments tels que des couleurs de murs, des étagères ou des meubles pour créer les espaces qu’ils imaginent.
  • Fusion de design : les utilisateurs peuvent appliquer de manière créative l’esthétique d’une image (comme des motifs floraux) à des objets d’une autre (comme une paire de bottes de pluie), fusionnant ainsi sans effort diverses inspirations de design.

Engagement envers la confidentialité des utilisateurs et l’intégrité de l’image

Concernant la confidentialité des utilisateurs, Google garantit que les images téléchargées sur la plateforme ne seront pas utilisées à des fins d’apprentissage par ses systèmes d’apprentissage automatique génératif, sauf en cas de retour d’information. De plus, toutes les images générées ou modifiées via l’application Gemini recevront un filigrane visible et un filigrane numérique invisible SynthID afin de préserver leur authenticité et l’intégrité de leurs droits d’auteur.

Pour plus d’informations sur l’image Flash Gemini 2.5, visitez l’annonce complète sur Neowin.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *