Google lance le modèle de conversion de texte en image de haute qualité Imagen 3 pour les utilisateurs de Gemini

Plus tôt cette année, Google a dévoilé Imagen 3, son modèle de génération de texte en image le plus avancé à ce jour. Cette version mise à jour apporte de nombreuses améliorations en termes de qualité et de précision de l’image. Selon Google, Imagen 3 atteint un niveau de détail exceptionnel, créant des images photoréalistes qui présentent un minimum d’artefacts gênants par rapport à son prédécesseur, Imagen 2.

Récemment, Google a rendu le modèle Imagen 3 accessible à tous les utilisateurs de Gemini dans le monde entier. Avec ce lancement, les utilisateurs de Gemini standard et de Gemini Advanced peuvent décrire les visuels qu’ils souhaitent générer, et Gemini produira l’image correspondante via l’IA. Cependant, veuillez noter que seuls ceux qui ont accès à Gemini Advanced peuvent générer des images représentant des figures humaines.

Si l’image générée ne répond pas à vos attentes, vous pouvez l’affiner en fournissant des détails supplémentaires dans votre demande. Plus vous serez précis dans vos spécifications d’image, plus les résultats fournis par Gemini seront précis. Le modèle Imagen 3 amélioré présente une meilleure compréhension du langage naturel et de l’intention sous-jacente des invites, capturant même des détails nuancés à partir de descriptions détaillées.

Un autre domaine dans lequel Imagen 3 excelle est le rendu de texte, un aspect qui a posé des défis à de nombreux modèles de génération d’images contemporains. Cette fonctionnalité permet aux utilisateurs de produire des vœux d’anniversaire personnalisés, des emplacements signalés par une signalisation et diverses autres demandes personnalisées.