
Innovazioni chiave presentate al Google I/O 2025
Durante l’attesissimo evento Google I/O 2025, Google ha presentato una serie di innovativi strumenti di intelligenza artificiale, tra cui il rilascio di Gemini Flash 2.5, ora accessibile a tutti gli utenti. Inoltre, ha presentato Gemma 3n, un modello di linguaggio di piccole dimensioni (LLM) specificamente progettato per il funzionamento su dispositivi locali.
Tecnologia rivoluzionaria dietro Gemma 3n
La caratteristica distintiva di Gemma 3n è l’implementazione di Per-Layer Embeddings (PLE), un’innovativa tecnologia sviluppata da Google DeepMind. Questa tecnologia non solo riduce l’utilizzo di memoria, ma migliora anche significativamente le prestazioni. Con un numero di parametri grezzi di 5 miliardi e 8 miliardi, Gemma 3n raggiunge un overhead di memoria simile a quello dei modelli con solo 2 miliardi e 4 miliardi di parametri. Secondo Google, entrambe le configurazioni richiedono rispettivamente solo 2 GB e 3 GB di memoria.
Funzionalità migliorate di velocità e qualità
Oltre al suo ingombro di memoria ridotto, Gemma 3n impiega metodologie avanzate, tra cui la condivisione KVC e la quantizzazione dell’attivazione, che consentono un aumento delle prestazioni con tempi di risposta sui dispositivi mobili 1, 5 volte superiori rispetto al suo predecessore, Gemma 3 4B. Inoltre, la sua esclusiva capacità di mix’n’match consente di creare sottomodelli dinamici che adattano le risposte alle specifiche esigenze dell’utente.
Esecuzione locale per maggiore privacy e funzionalità
Un vantaggio significativo di Gemma 3n è la sua capacità di operare tramite esecuzione locale, garantendo che tutta l’elaborazione avvenga sul dispositivo dell’utente. Questa funzionalità garantisce che i dati non vengano trasmessi ai server, migliorando la privacy e consentendo l’operatività senza una connessione Internet: una risorsa preziosa per gli utenti che richiedono affidabilità in scenari offline.
Capacità multimodale e competenza linguistica
Gemma 3n è progettato per eccellere con input multimodali, elaborando abilmente audio, testo e immagini. Le sue capacità di comprensione video migliorate gli consentono di gestire attività complesse come trascrizioni e traduzioni in diverse modalità, offrendo agli utenti un’esperienza fluida nell’interazione con diverse tipologie di contenuti.
Inoltre, il modello ha dimostrato un netto miglioramento nella gestione delle lingue diverse dall’inglese, in particolare con prestazioni migliori in giapponese, tedesco, coreano, spagnolo e francese. I parametri di performance indicano un ottimo risultato nei benchmark multilingue, raggiungendo un impressionante 50, 1% su WMT24++.
Introduzione a Gemma 3n
Puoi iniziare a utilizzare Gemma 3n direttamente dal tuo browser su Google AI Studio, senza bisogno di installazione. Per gli sviluppatori interessati all’integrazione locale, Google fornisce risorse tramite Google AI Edge. Questa piattaforma offre strumenti e librerie essenziali che offrono agli utenti funzionalità di elaborazione di testo e immagini, con ulteriori miglioramenti previsti in futuro.
Lascia un commento