
Google DeepMind si avventura nella robotica con Gemini 2.0
Google DeepMind continua a fare passi da gigante nell’intelligenza artificiale (IA), mostrando progressi in modelli come Gemini, Imagen, Veo, Gemma e AlphaFold. In un recente annuncio, il team è entrato ufficialmente nel settore della robotica con l’introduzione di due modelli innovativi basati su Gemini 2.0: Gemini Robotics e Gemini Robotics-ER.
Presentazione di Gemini Robotics
Gemini Robotics rappresenta un modello di visione-linguaggio-azione (VLA) all’avanguardia che integra azioni fisiche come modalità di output, specificamente progettato per il controllo robotico. Questo modello rivoluzionario, basato sull’architettura Gemini 2.0, dimostra una straordinaria capacità di comprendere situazioni che non ha incontrato durante il suo addestramento.
Secondo Google, Gemini Robotics eccelle in termini di prestazioni, ottenendo il doppio del tasso di successo rispetto ad altri modelli VLA leader su ampi benchmark di generalizzazione. Questa capacità è potenziata dalla sua solida comprensione del linguaggio naturale in varie lingue, che gli consente di interpretare i comandi umani in modo più efficace.
Destrezza senza pari
Una delle caratteristiche più notevoli di Gemini Robotics è la sua destrezza. Google afferma che questo modello può affrontare compiti complessi e articolati in più fasi che richiedono una gestione precisa. Esempi degni di nota includono la piegatura di origami e il confezionamento di snack in sacchetti Ziploc.
Capacità di Gemini Robotics-ER
D’altro canto, Gemini Robotics-ER funge da modello avanzato di linguaggio visivo su misura per il ragionamento spaziale. Questo modello fornisce ai robotici una soluzione pronta all’uso per il controllo dei robot, che comprende funzioni essenziali come percezione, stima dello stato, consapevolezza spaziale, pianificazione e generazione di codice.
Sforzi collaborativi nello sviluppo della robotica
Per ampliare il potenziale di questi nuovi modelli robotici, Google ha stretto una partnership con Apptronik per sviluppare robot umanoidi che sfruttano le capacità di Gemini 2.0. Inoltre, Google sta collaborando con leader del settore selezionati e affidabili, tra cui Agile Robots, Agility Robotics, Boston Dynamics ed Enchanted Tools, mentre esplorano le possibilità future di Gemini Robotics-ER.
Pioniere del futuro della robotica
Dotando i robot della capacità di comprendere ed eseguire compiti complessi con maggiore precisione e flessibilità, Google DeepMind sta aprendo la strada a un futuro in cui i robot potranno integrarsi perfettamente in vari aspetti della vita quotidiana, migliorando sia l’ambiente personale che quello professionale.
Lascia un commento ▼