
Innovaciones clave presentadas en Google I/O 2025
Durante el esperado evento Google I/O 2025, Google presentó una gama de innovadoras herramientas de inteligencia artificial, destacando el lanzamiento de Gemini Flash 2.5, ahora disponible para todos los usuarios. Además, presentaron Gemma 3n, un modelo de lenguaje pequeño (LLM) diseñado específicamente para la operación local de dispositivos.
Tecnología revolucionaria detrás de Gemma 3n
La característica destacada de Gemma 3n es la implementación de incrustaciones por capa (PLE), un desarrollo innovador de Google DeepMind. Esta tecnología no solo reduce el uso de memoria, sino que también mejora significativamente el rendimiento. Con un recuento de parámetros brutos de 5000 y 8000 millones, Gemma 3n alcanza una sobrecarga de memoria similar a la de modelos con tan solo 2000 y 4000 millones de parámetros. Según Google, ambas configuraciones requieren tan solo 2 GB y 3 GB de memoria, respectivamente.
Funciones de velocidad y calidad mejoradas
Además de su memoria compacta, Gemma 3n emplea metodologías avanzadas, como la compartición de KVC y la cuantificación de activación, lo que se traduce en una mejora del rendimiento de hasta 1, 5 veces la velocidad de respuesta en dispositivos móviles en comparación con su predecesor, Gemma 3 4B. Además, su exclusiva capacidad de combinación le permite crear submodelos dinámicos que adaptan las respuestas a las necesidades específicas del usuario.
Ejecución local para mayor privacidad y funcionalidad
Una ventaja significativa de Gemma 3n es su capacidad de operar mediante ejecución local, lo que garantiza que todo el procesamiento se realice en el dispositivo del usuario. Esta función garantiza que los datos no se transmitan a los servidores, lo que mejora la privacidad y permite operar sin conexión a internet, una ventaja invaluable para los usuarios que requieren confiabilidad en entornos sin conexión.
Capacidad multimodal y competencia lingüística
Gemma 3n está diseñado para destacar con entradas multimodales, procesando con destreza audio, texto e imágenes. Sus capacidades mejoradas de comprensión de video le permiten gestionar tareas complejas como transcripciones y traducciones en diversas modalidades, ofreciendo a los usuarios una experiencia fluida al interactuar con diversos tipos de contenido.
Además, el modelo ha demostrado una notable mejora en el manejo de idiomas distintos del inglés, en particular con un rendimiento mejorado en japonés, alemán, coreano, español y francés. Las métricas de rendimiento indican un sólido desempeño en las pruebas multilingües, alcanzando un impresionante 50, 1 % en WMT24++.
Introducción a Gemma 3n
Puedes empezar a usar Gemma 3n directamente desde tu navegador en Google AI Studio, sin necesidad de instalación. Para los desarrolladores interesados en la integración local, Google proporciona recursos a través de Google AI Edge. Esta plataforma ofrece herramientas y bibliotecas esenciales que ofrecen a los usuarios capacidades de procesamiento de texto e imágenes, y se prevén mejoras futuras.
Deja una respuesta