Explorando NVIDIA Vera Rubin: uno de los sistemas de IA más complejos del mundo con un millón de componentes integrados

Explorando NVIDIA Vera Rubin: uno de los sistemas de IA más complejos del mundo con un millón de componentes integrados

NVIDIA ha iniciado la producción a gran escala de su arquitectura Vera Rubin de próxima generación y ha proporcionado un análisis en profundidad del diseño de su complejo sistema de rack y sus componentes clave.

Explorando Vera Rubin de NVIDIA: chips mejorados, refrigeración líquida avanzada y NVLink 6 de alta gama

La introducción de Vera Rubin marca un avance significativo en la tecnología de rack para NVIDIA. Un vídeo reciente de la CNBC muestra un análisis detallado de su arquitectura, incluyendo componentes como el nodo de cómputo principal y los sistemas críticos de red y refrigeración. Cabe destacar que el director sénior de Infraestructura de NVIDIA, Dion Harris, ha descrito el sistema Vera Rubin como uno de los «sistemas de IA más complejos del mundo», destacando la complejidad de su implementación.

Dado que se prevén próximamente compromisos de los clientes para el sistema Vera Rubin, comprender la estructura del rack NVL72 es crucial. Un pilar de esta arquitectura es el Vera Rubin SuperChip. Anteriormente, analizamos sus especificaciones técnicas, destacando los avances sustanciales logrados mediante la integración de HBM4 con la GPU, complementada con módulos SOCAMM especializados. Esta innovación se traduce en un impresionante ancho de banda de memoria de 1, 2 TB/s.

Un primer plano de un chip NVIDIA marcado con 'B_KR 2546-P' y 'E6A382. OA2 e1' en una placa de circuito.

Vera Rubin también introduce mejoras significativas en la tecnología de refrigeración, con diseños modulares de refrigeración líquida que se adaptan a los componentes SuperChip, como la GPU Rubin y la CPU Vera, mediante placas frías dedicadas. La dirección de NVIDIA afirma que este innovador enfoque de refrigeración animará a los operadores de hiperescala a adoptar sistemas de refrigeración líquida más avanzados. Además, los diseños actuales promueven un menor consumo de agua, lo que acentúa otro beneficio medioambiental.

Un primer plano de un rack de servidores con múltiples componentes visibles sobre una mesa negra, con un chasis metálico y refrigeración.Una persona sostiene los componentes internos de un dispositivo electrónico sin marca, mostrando numerosas conexiones.

La tecnología NVLink es otro componente fundamental de la configuración Vera Rubin NVL72. Con su interconexión de sexta generación, comúnmente conocida como «NVLink Spine», NVIDIA busca ofrecer un ancho de banda total excepcional de 260 TB/s por rack. Harris destaca que esta última versión de NVLink mejora el diseño modular, facilitando un mantenimiento sin tiempo de inactividad y una mayor confiabilidad mediante servicios RAS a nivel de rack.

Una placa de circuito que muestra múltiples chips NVIDIA con disipadores de calor verdes y componentes circundantes.

Si bien las primeras proyecciones indican que el sistema Vera Rubin podría tener un precio más elevado, NVIDIA asegura que esta arquitectura permite reducir en 10 veces los costos de tokens de inferencia y en 4 veces la cantidad de GPU necesarias para entrenar modelos de Mezcla de Expertos (MoE), en comparación con el Blackwell GB200. Esto coincide con la filosofía del CEO de NVIDIA: una mayor inversión genera mayores ahorros.

Fuente e imágenes

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *