
Google dévoile le modèle Gemini 2.5 Flash avec des fonctionnalités améliorées
La semaine dernière, lors du très attendu événement Cloud Next, Google a fait une annonce importante concernant le déploiement prochain du modèle Flash Gemini 2.5. Cette nouvelle itération promet des avancées substantielles et est désormais disponible en avant-première via l’ API Gemini dans les environnements Google AI Studio et Vertex AI. Les utilisateurs de Gemini peuvent accéder facilement à ce modèle grâce au sélecteur de modèles, qui s’intègre parfaitement à Canvas, améliorant ainsi le processus d’affinage des documents et du code.
Améliorations par rapport à son prédécesseur
S’appuyant sur les bases de son prédécesseur, Gemini 2.0 Flash, la version 2.5 apporte des améliorations notables aux capacités de raisonnement, tout en restant abordable et en minimisant la latence. Selon Google, ce nouveau modèle est conçu pour offrir un rapport performances/prix exceptionnel. Voici les tarifs :
- 0, 15 $ pour chaque million de jetons d’entrée
- 0, 60 $ pour chaque million de jetons de sortie sans raisonnement
- 3, 50 $ pour chaque million de jetons de sortie avec raisonnement
Il s’agit d’une première version de Flash 2.5, mais elle présente déjà des avantages considérables par rapport à Flash 2.0. Vous pouvez désactiver complètement la réflexion si nécessaire et utiliser ce modèle comme remplacement direct de Flash 2.0. Il est disponible sur l’API Gemini, AI Studio, Vertex et l’application Gemini !
— Logan Kilpatrick (@OfficialLoganK) 17 avril 2025
Présentation des capacités de raisonnement hybride
Le modèle Flash Gemini 2.5 marque une étape importante : il s’agit du premier modèle de raisonnement entièrement hybride de Google, permettant aux développeurs d’activer ou de désactiver les fonctionnalités de raisonnement. Cette flexibilité permet aux développeurs d’optimiser leurs applications en adaptant les compromis entre qualité, coût et latence de réponse aux besoins spécifiques du projet.

Aperçu des performances comparatives
Comme l’illustre le tableau comparatif ci-joint, le modèle Gemini 2.5 Flash rivalise efficacement avec les modèles phares d’Anthropic et de Grok, malgré son coût plus faible. Bien que l’o4-mini récemment lancé par OpenAI affiche des performances supérieures à celles de la préversion Gemini 2.5 Flash, son prix est nettement plus élevé, ce qui souligne la compétitivité de l’offre de Google dans le paysage actuel.
Pour des informations et des aperçus plus détaillés sur ce modèle révolutionnaire, vous pouvez vous référer à la source originale.
Laisser un commentaire