En una colaboración excepcional, Google y NVIDIA unen fuerzas para ofrecer a los usuarios acceso a hasta un millón de GPU NVIDIA. Esta iniciativa forma parte del lanzamiento de las nuevas instancias A5X, diseñadas para reducir los costos de inferencia y mejorar el rendimiento de los tokens. El sistema A5X integra los aceleradores de red avanzados de NVIDIA, sentando las bases para infraestructuras de computación robustas, tanto de clúster único como multiclúster, diseñadas específicamente para cargas de trabajo de IA.
Presentamos la instancia A5X: diseñada a medida para la IA agenica.
La instancia A5X representa el desarrollo más reciente de Google, diseñada específicamente para cargas de trabajo de inteligencia artificial con agentes. Forma parte del creciente portafolio de hipercomputadoras de IA que sustenta la plataforma Gemini de Google, la cual admite diversas aplicaciones de IA para consumidores y empresas. Esta nueva oferta viene acompañada de importantes mejoras en Hypercomputer, que incluyen máquinas virtuales especialmente diseñadas con CPU personalizadas basadas en Arm, procesadores tensoriales de octava generación, compatibilidad nativa con PyTorch TPU y, por supuesto, las innovadoras instancias A5X.
Diseñadas para gestionar escenarios de IA con agentes, las instancias A5X aprovechan un conjunto de agentes de IA e implementan una metodología por partes para resolver problemas complejos. Cabe destacar que estas instancias son las primeras de Google compatibles con las GPU de IA Vera Rubin de última generación de NVIDIA.

Google Virgo y ConnectX-9: Ampliando la infraestructura de IA
Las instancias A5X aprovecharán las capacidades de las tarjetas de interfaz de red (NIC) ConnectX-9 de NVIDIA, diseñadas para optimizar las cargas de trabajo de IA en entornos de nube que utilizan Ethernet. Esta sinergia tecnológica, combinada con la plataforma Virgo de Google, permite a los usuarios implementar hasta 80 000 GPU Rubin en un único clúster y la asombrosa cifra de 960 000 GPU en clústeres multisitio.
| Componente | Clúster de centro de datos único máximo | Clúster multisitio máximo |
| GPU NVIDIA Vera Rubin | 80.000 | 960.000 |
| TPU personalizadas de Google | 134.000 | Más de 1.000.000 |
| Red troncal | Tarjetas de red NVIDIA ConnectX-9 | Plataforma Virgo de Google |
Lograr el retorno de la inversión: Costos de inferencia drásticamente reducidos y mayor rendimiento.
La plataforma Google Virgo facilita una conectividad sin precedentes entre numerosos chips de IA dentro de un único centro de datos. Esta sólida infraestructura no solo funciona junto con las GPU Vera Rubin de NVIDIA, sino que también se integra a la perfección con las unidades de procesamiento tensorial (TPU) de Google. Virgo puede conectar hasta 134 000 TPU en un centro de datos y más de un millón de chips en múltiples ubicaciones. Cabe destacar que NVIDIA afirma que las instancias A5X pueden reducir diez veces los costos de inferencia por token, al tiempo que aumentan el rendimiento diez veces por megavatio, en comparación con los modelos anteriores.
Además, NVIDIA destaca su colaboración con líderes del sector como Cadence y Siemens, mostrando cómo sus productos se basan en esta infraestructura y son accesibles a través de Google Cloud. Asimismo, la plataforma Gemini de Google está preparada para implementar modelos y flujos de trabajo basados en agentes en diversos sectores, incluida la ciberseguridad.
Deja una respuesta