NVIDIA ConnectX-8: SuperNIC para sistemas Blackwell com PCIe G6 e velocidade de 800GbE

NVIDIA ConnectX-8: SuperNIC para sistemas Blackwell com PCIe G6 e velocidade de 800GbE

A NVIDIA revelou sua revolucionária Placa de Interface de Rede (NIC) ConnectX-8, projetada especificamente para os sistemas Blackwell. Essa tecnologia avançada é tão avançada que a NVIDIA a apelidou de SuperNIC.

Apresentando o ConnectX-8 SuperNIC da NVIDIA para Blackwell Systems

Em sua versão mais recente, a NVIDIA enfatiza as necessidades distintas das cargas de trabalho de treinamento e inferência de IA. Enquanto as tarefas de inferência são caracterizadas por sua natureza desagregada e sensibilidade à latência, exigindo ampla interação com sistemas externos, as cargas de trabalho de treinamento são sincronizadas, longas e sensíveis à latência de cauda, ​​mas envolvem menos comunicação externa.

Treinamento de IA e eficiência de inferência com políticas de rede fungíveis ilustradas.

A placa de rede ConnectX-8, significativamente aprimorada para desempenho, é compatível com as tecnologias Spectrum-X Ethernet e Quantum-X Infiniband, consolidando ainda mais sua capacidade como uma SuperNIC.

ConnectX-8 800G SuperNIC: rede avançada para IA, RDMA, confiabilidade, segurança e integração.

Principais recursos do ConnectX-8 SuperNIC

Os recursos notáveis ​​do ConnectX-8 incluem:

  • Tecnologia RDMA robusta aproveitada por milhões de GPUs
  • Capacidades para pipelines de hardware RDMA de até 800G adaptados para cargas de trabalho de IA
  • Balanceamento de carga integrado, gerenciamento de congestionamento e protocolos de confiabilidade
  • Programabilidade avançada de caminho de dados para versatilidade em aplicações de IA
  • Integração perfeita com a arquitetura do sistema
  • Melhorias de segurança de nível empresarial
Visão geral do ConnectX-8 SuperNIC destacando os recursos.

Visão geral das especificações

O ConnectX-8 SuperNIC é compatível com padrões da indústria, como Verbs, NCCL, NIXL e APIs DOCA. Ele oferece uma solução Infiniband XDR de 800 Gb/s ou uma interface Ethernet dupla de 400 Gb/s, equipada com até oito portas. A integração de uma interface PCIe Gen6 com 48 pistas é facilitada por um switch PCIe integrado.

Gráfico do desempenho de dimensionamento do ConnectX-8 RDMA em 800G.

A NVIDIA afirma que os recursos RDMA do ConnectX-8 oferecem escalabilidade ilimitada na velocidade inovadora de 800G em vários tamanhos de mensagens, variando de 64 KB a 1 MB. Isso permite que o SuperNIC funcione como um ASIC que interconecta GPUs a outros clusters perfeitamente.

Diagrama de componentes tradicionais do data center.

Inicialmente, a placa de rede ConnectX-8 será implantada nos sistemas avançados Blackwell GB300 NVL72 da NVIDIA, que contam com a nova GPU Blackwell Ultra. O switch CX8 PCIe introduzido permite a utilização otimizada da largura de banda em toda a arquitetura NVLINK.

Diagrama do switch PCIe ConnectX-8.

Cada switch CX8 PCIe incorpora pistas Gen5 x16 para a CPU Grace e pistas Gen6 x16 configuradas para a GPU Blackwell Ultra, complementadas por uma pista PCIe Gen5 x4 para SSDs.

Diagrama do data center ConnectX.

Escalabilidade entre configurações de GPU

A NVIDIA ilustrou como o ConnectX-8 alcança recursos de dimensionamento notáveis ​​em configurações de até 64 GPUs.

Diagrama de integração de escala de GPU ConnectX-8 pela NVIDIA.

Em uma era em que a escalabilidade da IA ​​é fundamental, o Switch Ethernet Integrado Spectrum-X ConnectX-8 da NVIDIA surge como uma solução poderosa, ampliando a funcionalidade da estrutura Ethernet Spectrum-X existente. Este sistema oferece funções avançadas de balanceamento de carga e controle de congestionamento, essenciais para cargas de trabalho de IA, enquanto o Processador de Pacotes ConnectX-8 reforça os recursos de segurança e roteamento para ambientes de IA.

Switch ConnectX-8 para IA escalável.
ConnectX-8 RDMA apresentando soluções de rede de IA.
Diagrama do processador de pacotes ConnectX-8.
Diagrama do acelerador de caminho de dados ConnectX-8.
Recursos Ethernet do Spectrum-X para cargas de trabalho de IA.
Controle de congestionamento ConnectX-8 em hardware.

O ConnectX-8 incorpora um Acelerador de Caminho de Dados, um processador de eventos RISC-V de 16T, projetado para garantir que a rede opere com eficiência máxima. A NVIDIA afirma que a tecnologia Ethernet Spectrum-X pode alcançar uma redução de 60% no tempo de treinamento, além de uma redução drástica na latência de cauda em comparação com NICs e switches RDMA tradicionais.

Gráfico comparando o tempo do passo de treinamento do Spectrum-X Ethernet.
Gráfico representando o desempenho da latência de cauda do Spectrum-X Ethernet.

Métricas de desempenho

Dados recentes da NVIDIA sobre o desempenho do Spectrum-X incluem métricas impressionantes:

  • 1, 6x aumento na largura de banda efetiva devido ao balanceamento de carga
  • Largura de banda coletiva aprimorada de 1, 3x impactando a latência da cauda
  • Aumento de 2, 2x na largura de banda totalmente reduzida para isolamento de ruído
  • Elevação de 1, 3x na largura de banda total, garantindo resiliência
  • Aceleração de 1000x na coleta de telemetria para necessidades de alta frequência
Visualização de métricas de desempenho do Spectrum-X.

Com um desempenho inovador de 800G e suporte para PCIe Gen6, as SuperNICs Spectrum-X e ConnectX-8 da NVIDIA estão prontas para revolucionar o cenário de rede nos sistemas Blackwell. Mais detalhes e novidades são esperados nos próximos meses.

Fonte e Imagens

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *