A plataforma Rubin da NVIDIA integra-se à Máquina Virtual do Google, expandindo clusters multi-site para quase 1 milhão de GPUs.

Em uma colaboração notável, o Google e a NVIDIA unem forças para oferecer aos usuários acesso a até um milhão de GPUs NVIDIA. Essa iniciativa faz parte do lançamento das novas instâncias A5X, que visam reduzir os custos de inferência e aumentar a taxa de transferência de tokens. O sistema A5X integra os aceleradores de rede avançados da NVIDIA, preparando o terreno para infraestruturas de computação robustas, tanto de cluster único quanto de múltiplos clusters, projetadas especificamente para cargas de trabalho de IA.

Apresentando a instância A5X: feita sob medida para IA Agentica.

A instância A5X representa o mais recente desenvolvimento do Google, criada especificamente para cargas de trabalho de inteligência artificial com agentes. Ela pertence ao crescente portfólio de hipercomputadores de IA que sustenta a plataforma Gemini do Google, a qual oferece suporte a diversas aplicações de IA para consumidores e empresas. Essa nova oferta vem acompanhada de atualizações significativas para o Hypercomputer, apresentando máquinas virtuais especialmente projetadas, equipadas com CPUs personalizadas baseadas em Arm, processadores tensores de oitava geração, suporte nativo a PyTorch TPU e, claro, as inovadoras instâncias A5X.

Projetadas para lidar com cenários de IA com agentes, as instâncias A5X utilizam um conjunto de agentes de IA, implementando uma metodologia segmentada para resolver problemas complexos. Notavelmente, essas instâncias são as primeiras do Google a serem compatíveis com as GPUs de IA Vera Rubin de última geração da NVIDIA.

Um slide de apresentação mostrando a GPU Rubin e a LPU Groq 3 com suas especificações, ao lado de uma pessoa no palco sob o título "Unindo Processadores de Desempenho Extremo".

Google Virgo e ConnectX-9: Escalando a infraestrutura de IA

As instâncias A5X aproveitarão os recursos das placas de interface de rede (NICs) ConnectX-9 da NVIDIA, projetadas para aprimorar cargas de trabalho de IA em ambientes de nuvem que utilizam Ethernet. Essa sinergia tecnológica, combinada com a plataforma Virgo do Google, permite que os usuários implementem até 80.000 GPUs Rubin em um único cluster e impressionantes 960.000 GPUs em clusters com vários locais.

Componente	Cluster de data center único máximo	Cluster Max Multi-Site
GPUs NVIDIA Vera Rubin	80.000	960.000
TPUs personalizados do Google	134.000	Mais de 1.000.000
Infraestrutura de Rede	Placas de rede NVIDIA ConnectX-9	Plataforma Google Virgo

Obtenção de ROI: Redução drástica dos custos de inferência e aumento da produtividade

A plataforma Google Virgo facilita uma conectividade sem precedentes entre inúmeros chips de IA em um único data center. Essa infraestrutura robusta não só funciona em conjunto com as GPUs Vera Rubin da NVIDIA, como também se integra perfeitamente às unidades de processamento de tensores (TPUs) do Google. O Virgo pode conectar até 134.000 TPUs em um único data center e mais de um milhão de chips em várias localidades. Notavelmente, a NVIDIA afirma que as instâncias A5X podem oferecer uma redução de dez vezes nos custos de inferência por token, ao mesmo tempo que aumentam a taxa de transferência em dez vezes por megawatt, em comparação com os modelos anteriores.

Além disso, a NVIDIA destaca sua colaboração com líderes do setor como Cadence e Siemens, demonstrando como seus produtos são impulsionados por essa infraestrutura e acessíveis via Google Cloud. Ademais, a plataforma Gemini do Google está pronta para implantar modelos e fluxos de trabalho de agentes em diversos setores, incluindo o de cibersegurança.

Fonte e imagens

A plataforma Rubin da NVIDIA integra-se à Máquina Virtual do Google, expandindo clusters multi-site para quase 1 milhão de GPUs.

Apresentando a instância A5X: feita sob medida para IA Agentica.

Google Virgo e ConnectX-9: Escalando a infraestrutura de IA

Obtenção de ROI: Redução drástica dos custos de inferência e aumento da produtividade

Artigos relacionados:

Novos recursos do DX12 no Microsoft Shader Model 6.10 e na prévia do AgilitySDK 720 para renderização neural.

Vazamento de informações sobre o Steam Controller confirmado pela Valve: informações sobre data de lançamento e preço; sem novidades sobre o Steam Machine, mas perspectivas positivas da Valve.

Deixe um comentário Cancelar resposta