La plataforma Rubin de NVIDIA se integra con la máquina virtual de Google, ampliando los clústeres multisitio a casi 1 millón de GPU.

En una colaboración excepcional, Google y NVIDIA unen fuerzas para ofrecer a los usuarios acceso a hasta un millón de GPU NVIDIA. Esta iniciativa forma parte del lanzamiento de las nuevas instancias A5X, diseñadas para reducir los costos de inferencia y mejorar el rendimiento de los tokens. El sistema A5X integra los aceleradores de red avanzados de NVIDIA, sentando las bases para infraestructuras de computación robustas, tanto de clúster único como multiclúster, diseñadas específicamente para cargas de trabajo de IA.

Presentamos la instancia A5X: diseñada a medida para la IA agenica.

La instancia A5X representa el desarrollo más reciente de Google, diseñada específicamente para cargas de trabajo de inteligencia artificial con agentes. Forma parte del creciente portafolio de hipercomputadoras de IA que sustenta la plataforma Gemini de Google, la cual admite diversas aplicaciones de IA para consumidores y empresas. Esta nueva oferta viene acompañada de importantes mejoras en Hypercomputer, que incluyen máquinas virtuales especialmente diseñadas con CPU personalizadas basadas en Arm, procesadores tensoriales de octava generación, compatibilidad nativa con PyTorch TPU y, por supuesto, las innovadoras instancias A5X.

Diseñadas para gestionar escenarios de IA con agentes, las instancias A5X aprovechan un conjunto de agentes de IA e implementan una metodología por partes para resolver problemas complejos. Cabe destacar que estas instancias son las primeras de Google compatibles con las GPU de IA Vera Rubin de última generación de NVIDIA.

Una diapositiva de presentación que muestra la GPU Rubin y la LPU Groq 3 con sus especificaciones, junto con una persona en el escenario bajo el título "Uniendo procesadores de rendimiento extremo".

Google Virgo y ConnectX-9: Ampliando la infraestructura de IA

Las instancias A5X aprovecharán las capacidades de las tarjetas de interfaz de red (NIC) ConnectX-9 de NVIDIA, diseñadas para optimizar las cargas de trabajo de IA en entornos de nube que utilizan Ethernet. Esta sinergia tecnológica, combinada con la plataforma Virgo de Google, permite a los usuarios implementar hasta 80 000 GPU Rubin en un único clúster y la asombrosa cifra de 960 000 GPU en clústeres multisitio.

Componente	Clúster de centro de datos único máximo	Clúster multisitio máximo
GPU NVIDIA Vera Rubin	80.000	960.000
TPU personalizadas de Google	134.000	Más de 1.000.000
Red troncal	Tarjetas de red NVIDIA ConnectX-9	Plataforma Virgo de Google

Lograr el retorno de la inversión: Costos de inferencia drásticamente reducidos y mayor rendimiento.

La plataforma Google Virgo facilita una conectividad sin precedentes entre numerosos chips de IA dentro de un único centro de datos. Esta sólida infraestructura no solo funciona junto con las GPU Vera Rubin de NVIDIA, sino que también se integra a la perfección con las unidades de procesamiento tensorial (TPU) de Google. Virgo puede conectar hasta 134 000 TPU en un centro de datos y más de un millón de chips en múltiples ubicaciones. Cabe destacar que NVIDIA afirma que las instancias A5X pueden reducir diez veces los costos de inferencia por token, al tiempo que aumentan el rendimiento diez veces por megavatio, en comparación con los modelos anteriores.

Además, NVIDIA destaca su colaboración con líderes del sector como Cadence y Siemens, mostrando cómo sus productos se basan en esta infraestructura y son accesibles a través de Google Cloud. Asimismo, la plataforma Gemini de Google está preparada para implementar modelos y flujos de trabajo basados en agentes en diversos sectores, incluida la ciberseguridad.

Fuente e imágenes

La plataforma Rubin de NVIDIA se integra con la máquina virtual de Google, ampliando los clústeres multisitio a casi 1 millón de GPU.

Presentamos la instancia A5X: diseñada a medida para la IA agenica.

Google Virgo y ConnectX-9: Ampliando la infraestructura de IA

Lograr el retorno de la inversión: Costos de inferencia drásticamente reducidos y mayor rendimiento.

Artículos relacionados:

Nuevas características de DX12 en Microsoft Shader Model 6.10 y la versión preliminar de AgilitySDK 720 para renderizado neuronal.

Valve confirma la filtración del Steam Controller: información sobre la fecha de lanzamiento y el precio; Valve no ofrece novedades sobre la Steam Machine, pero sí perspectivas positivas.

Deja una respuesta Cancelar la respuesta