NVIDIA ConnectX-8: SuperNIC para sistemas Blackwell con PCIe G6 y velocidad de 800 GbE

NVIDIA ConnectX-8: SuperNIC para sistemas Blackwell con PCIe G6 y velocidad de 800 GbE

NVIDIA ha presentado su revolucionaria tarjeta de interfaz de red (NIC) ConnectX-8, diseñada específicamente para los sistemas Blackwell. Esta tecnología avanzada es tan vanguardista que NVIDIA la ha denominado SuperNIC.

Presentación de la SuperNIC ConnectX-8 de NVIDIA para Blackwell Systems

En su último lanzamiento, NVIDIA enfatiza las necesidades específicas de las cargas de trabajo de entrenamiento e inferencia de IA. Mientras que las tareas de inferencia se caracterizan por su naturaleza desagregada y su sensibilidad a la latencia, lo que requiere una amplia interacción con sistemas externos, las cargas de trabajo de entrenamiento son sincronizadas, largas y sensibles a la latencia de cola, pero requieren menos comunicación externa.

Se ilustra la eficiencia de la inferencia y el entrenamiento de IA con políticas de red fungibles.

La NIC ConnectX-8, significativamente mejorada en términos de rendimiento, es compatible con las tecnologías Spectrum-X Ethernet y Quantum-X Infiniband, lo que consolida aún más su capacidad como SuperNIC.

ConnectX-8 800G SuperNIC: Redes avanzadas para IA, RDMA, confiabilidad, seguridad e integración.

Características principales del ConnectX-8 SuperNIC

Las características notables del ConnectX-8 incluyen:

  • Tecnología RDMA robusta aprovechada en millones de GPU
  • Capacidades para canales de hardware RDMA de hasta 800 G adaptados a cargas de trabajo de IA
  • Protocolos integrados de equilibrio de carga, gestión de congestión y confiabilidad
  • Programabilidad avanzada de rutas de datos para versatilidad en aplicaciones de IA
  • Integración perfecta con la arquitectura del sistema
  • Mejoras de seguridad de nivel empresarial
Descripción general de ConnectX-8 SuperNIC que destaca sus características.

Descripción general de las especificaciones

La SuperNIC ConnectX-8 es compatible con estándares de la industria como Verbs, NCCL, NIXL y las API DOCA. Ofrece una solución Infiniband XDR de 800 Gb/s o una interfaz Ethernet dual de 400 Gb, equipada con hasta ocho puertos. La integración de una interfaz PCIe Gen6 de 48 carriles se facilita mediante un conmutador PCIe integrado.

Gráfico del rendimiento de escalamiento de ConnectX-8 RDMA a 800G.

NVIDIA afirma que las capacidades RDMA del ConnectX-8 ofrecen una escalabilidad ilimitada a la revolucionaria velocidad de 800 G en diversos tamaños de mensaje, desde 64 KB hasta 1 MB. Esto permite que el SuperNIC funcione como un ASIC que interconecta las GPU con otros clústeres sin problemas.

Diagrama de componentes de un centro de datos tradicional.

Inicialmente, la tarjeta de red ConnectX-8 se implementará en los avanzados sistemas Blackwell GB300 NVL72 de NVIDIA, que incorporan la nueva GPU Blackwell Ultra. El conmutador PCIe CX8 introducido permite optimizar el uso del ancho de banda en toda la arquitectura NVLINK.

Diagrama del conmutador PCIe ConnectX-8.

Cada conmutador PCIe CX8 incorpora líneas Gen5 x16 para la CPU Grace y líneas Gen6 x16 configuradas para la GPU Blackwell Ultra, complementadas con una línea PCIe Gen5 x4 para SSD.

Diagrama del centro de datos ConnectX.

Escalabilidad en distintas configuraciones de GPU

NVIDIA ha ilustrado cómo ConnectX-8 logra capacidades de escalamiento notables en configuraciones de hasta 64 GPU.

Diagrama de integración de escala de GPU ConnectX-8 por NVIDIA.

En una era donde la escalabilidad de la IA es fundamental, el conmutador Ethernet integrado Spectrum-X ConnectX-8 de NVIDIA se perfila como una solución potente que amplía la funcionalidad de la infraestructura Ethernet Spectrum-X existente. Este sistema ofrece funciones avanzadas de equilibrio de carga y control de congestión, esenciales para las cargas de trabajo de IA, mientras que el procesador de paquetes ConnectX-8 refuerza las capacidades de seguridad y enrutamiento para entornos de IA.

Conmutador ConnectX-8 para IA escalable.
ConnectX-8 RDMA muestra soluciones de redes de IA.
Diagrama del procesador de paquetes ConnectX-8.
Diagrama del acelerador de ruta de datos ConnectX-8.
Funciones de Ethernet de Spectrum-X para cargas de trabajo de IA.
Control de congestión en hardware ConnectX-8.

El ConnectX-8 incorpora un acelerador de ruta de datos, un procesador de eventos RISC-V de 16 bits, diseñado para garantizar el máximo rendimiento de la red. NVIDIA presume de que la tecnología Ethernet Spectrum-X puede lograr una reducción del 60 % en el tiempo de entrenamiento, junto con una drástica reducción de la latencia de cola en comparación con las tarjetas de red y conmutadores RDMA tradicionales.

Gráfico que compara el tiempo de los pasos de entrenamiento de Ethernet de Spectrum-X.
Gráfico que representa el rendimiento de latencia de cola de Spectrum-X Ethernet.

Métricas de rendimiento

Los datos recientes de NVIDIA sobre el rendimiento de Spectrum-X incluyen métricas impresionantes:

  • Ancho de banda efectivo aumentado 1, 6 veces gracias al equilibrio de carga
  • Ancho de banda colectivo mejorado 1, 3x que impacta la latencia de cola
  • Aumento de 2, 2x en el ancho de banda total para aislamiento de ruido
  • Aumento de 1, 3x en el ancho de banda general, lo que garantiza la resiliencia
  • Aceleración de 1000x en la recopilación de telemetría para necesidades de alta frecuencia
Visualización de métricas de rendimiento de Spectrum-X.

Con un rendimiento revolucionario de 800G y compatibilidad con PCIe Gen6, las SuperNIC Spectrum-X y ConnectX-8 de NVIDIA están listas para revolucionar el panorama de las redes en los sistemas Blackwell. Se esperan más detalles y novedades en los próximos meses.

Fuente e imágenes

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *