
Principales innovations présentées à Google I/O 2025
Lors de l’événement très attendu Google I/O 2025, Google a présenté une gamme d’outils d’intelligence artificielle révolutionnaires, notamment la sortie de Gemini Flash 2.5, désormais accessible à tous. Google a également présenté Gemma 3n, un modèle de langage compact (LLM) spécialement conçu pour le fonctionnement local des appareils.
La technologie révolutionnaire derrière Gemma 3n
La caractéristique principale de Gemma 3n est son implémentation de Per-Layer Embeddings (PLE), une innovation de Google DeepMind. Cette technologie réduit non seulement l’utilisation de la mémoire, mais améliore également considérablement les performances. Avec un nombre de paramètres bruts de 5 et 8 milliards, Gemma 3n atteint des surcharges mémoire comparables à celles de modèles ne comportant que 2 et 4 milliards de paramètres. Selon Google, ces deux configurations ne nécessitent respectivement que 2 et 3 Go de mémoire.
Fonctionnalités de vitesse et de qualité améliorées
Outre son faible encombrement mémoire, Gemma 3n utilise des méthodologies avancées, notamment le partage KVC et la quantification d’activation, ce qui se traduit par des performances 1, 5 fois supérieures sur les appareils mobiles par rapport à son prédécesseur, Gemma 3 4B. De plus, sa capacité unique de mixage et d’association lui permet de créer des sous-modèles dynamiques qui adaptent les réponses aux besoins spécifiques des utilisateurs.
Exécution locale pour une confidentialité et des fonctionnalités améliorées
L’un des principaux avantages de Gemma 3n réside dans sa capacité à fonctionner en local, garantissant que tous les traitements s’effectuent sur l’appareil de l’utilisateur. Cette fonctionnalité garantit que les données ne sont pas transmises aux serveurs, améliorant ainsi la confidentialité et permettant un fonctionnement sans connexion Internet : un atout précieux pour les utilisateurs exigeant une fiabilité hors ligne.
Capacité multimodale et maîtrise de la langue
Gemma 3n est conçu pour exceller avec les entrées multimodales, traitant avec brio l’audio, le texte et les images. Ses capacités de compréhension vidéo améliorées lui permettent de gérer des tâches complexes telles que la transcription et la traduction sur différentes modalités, offrant aux utilisateurs une expérience fluide d’interaction avec divers types de contenus.
De plus, le modèle a démontré une nette amélioration dans la gestion des langues autres que l’anglais, avec notamment de meilleures performances en japonais, allemand, coréen, espagnol et français. Les indicateurs de performance indiquent une excellente performance dans les tests multilingues, avec un impressionnant 50, 1 % sur WMT24++.
Premiers pas avec Gemma 3n
Vous pouvez commencer à utiliser Gemma 3n directement depuis votre navigateur sur Google AI Studio, sans aucune installation requise. Pour les développeurs intéressés par l’intégration locale, Google met à disposition des ressources via Google AI Edge. Cette plateforme propose des outils et bibliothèques essentiels qui offrent dès maintenant des capacités de traitement de texte et d’images, et d’autres améliorations sont attendues à l’avenir.
Laisser un commentaire