
Google DeepMind se aventura en la robótica con Gemini 2.0
Google DeepMind continúa realizando avances significativos en inteligencia artificial (IA), mostrando avances en modelos como Gemini, Imagen, Veo, Gemma y AlphaFold. En un anuncio reciente, el equipo ha entrado oficialmente en el sector de la robótica con la introducción de dos modelos innovadores basados en Gemini 2.0: Gemini Robotics y Gemini Robotics-ER.
Presentamos Gemini Robotics
Gemini Robotics representa un modelo de visión-lenguaje-acción (VLA) de vanguardia que integra acciones físicas como modalidad de salida, diseñado específicamente para el control robótico. Este innovador modelo, basado en la arquitectura Gemini 2.0, demuestra una extraordinaria capacidad para comprender situaciones que no se habían presentado durante su entrenamiento.
Según Google, Gemini Robotics destaca por su rendimiento, logrando el doble de éxito que otros modelos VLA líderes en pruebas de generalización exhaustivas. Esta capacidad se ve reforzada por su sólida comprensión del lenguaje natural en varios idiomas, lo que le permite interpretar comandos humanos con mayor eficacia.
Destreza inigualable
Una de las características más destacadas de Gemini Robotics es su destreza. Google afirma que este modelo puede realizar tareas complejas de varios pasos que requieren un manejo preciso. Ejemplos notables incluyen doblar origami y empaquetar refrigerios en bolsas Ziploc.
Capacidades de Gemini Robotics-ER
Por otro lado, Gemini Robotics-ER funciona como un modelo avanzado de visión y lenguaje, diseñado para el razonamiento espacial. Este modelo proporciona a los especialistas en robótica una solución lista para usar para controlar robots, que abarca funciones esenciales como la percepción, la estimación de estados, la percepción espacial, la planificación y la generación de código.
Esfuerzos colaborativos en el desarrollo de la robótica
Para ampliar el potencial de estos nuevos modelos robóticos, Google se ha asociado con Apptronik para desarrollar robots humanoides que aprovechan las capacidades de Gemini 2.0. Además, Google colabora con líderes de confianza del sector, como Agile Robots, Agility Robotics, Boston Dynamics y Enchanted Tools, para explorar las posibilidades futuras de Gemini Robotics-ER.
Pioneros en el futuro de la robótica
Al equipar a los robots con la capacidad de comprender y realizar tareas complejas con mayor precisión y flexibilidad, Google DeepMind está allanando el camino para un futuro en el que los robots puedan integrarse perfectamente en diversas facetas de la vida diaria, mejorando los entornos personales y profesionales.
Deja una respuesta ▼