Le paysage concurrentiel de l’IA générative s’intensifie à mesure que les entreprises s’efforcent d’affirmer leur domination et d’explorer des capacités innovantes. OpenAI continue d’élargir son horizon en déployant des mises à niveau de sa technologie, mais son modèle d’intelligence très attendu pour la production vidéo, connu sous le nom de Sora, n’est toujours pas disponible pour les utilisateurs. Pendant ce temps, Google fait des progrès significatifs dans la création de contenu avec le dévoilement public de son modèle d’IA générative, Veo, actuellement en avant-première privée.
Google prend les devants avec Veo en version préliminaire privée
OpenAI a été le pionnier de l’introduction d’un modèle vidéo génératif d’IA avec Sora en février dernier, démontrant sa capacité à générer des vidéos de 60 secondes à partir d’entrées textuelles. C’est désormais Google qui est sous les feux des projecteurs. Le géant de la technologie a officiellement lancé Veo en avant-première privée via sa plateforme Vertex AI, marquant une avancée cruciale dans la technologie de la vidéo générative.
Cette sortie intervient quelques mois seulement après la démonstration de Sora par OpenAI, qui a eu lieu lors de leur conférence des développeurs I/O. Google a vanté les nombreuses fonctionnalités de Veo, affirmant qu’il peut produire des vidéos de haute qualité d’une durée supérieure à une minute. Les utilisateurs ont le choix entre une variété de styles visuels et cinématographiques, bien que les détails concernant la durée spécifique des vidéos générées soient encore rares. Les premiers échantillons révèlent que le contenu nouvellement produit est étonnamment réaliste, souvent impossible à distinguer d’une séquence authentique à moins d’être examiné de près.
En plus de Veo, Google s’apprête à déployer Imagen 3, un générateur avancé de texte en image, pour les clients Google Cloud dans le cadre de ses prochaines fonctionnalités. Ce déploiement, prévu pour la semaine prochaine, sera initialement disponible pour certains utilisateurs de la liste d’autorisation, offrant une variété d’options de personnalisation, notamment l’édition de photos à l’aide d’invites et la possibilité de modifier les logos et d’autres éléments dans les images générées.
Google souligne que Veo et Imagen 3 sont tous deux équipés de solides mesures de protection intégrées pour limiter les violations de contenu et éliminer les sorties inappropriées. Néanmoins, les tests préliminaires suggèrent que ces mesures de protection ne sont pas totalement infaillibles. Le contenu généré contient un filigrane numérique invisible créé avec la technologie SynthID de DeepMind, facilitant l’identification des matériaux générés par l’IA.
Après le lancement de Veo, OpenAI fait face à une pression croissante pour publier Sora, que les utilisateurs attendent avec impatience depuis son annonce et dont la livraison est prévue vers la fin de 2024.
Laisser un commentaire