Em uma colaboração notável, o Google e a NVIDIA unem forças para oferecer aos usuários acesso a até um milhão de GPUs NVIDIA. Essa iniciativa faz parte do lançamento das novas instâncias A5X, que visam reduzir os custos de inferência e aumentar a taxa de transferência de tokens. O sistema A5X integra os aceleradores de rede avançados da NVIDIA, preparando o terreno para infraestruturas de computação robustas, tanto de cluster único quanto de múltiplos clusters, projetadas especificamente para cargas de trabalho de IA.
Apresentando a instância A5X: feita sob medida para IA Agentica.
A instância A5X representa o mais recente desenvolvimento do Google, criada especificamente para cargas de trabalho de inteligência artificial com agentes. Ela pertence ao crescente portfólio de hipercomputadores de IA que sustenta a plataforma Gemini do Google, a qual oferece suporte a diversas aplicações de IA para consumidores e empresas. Essa nova oferta vem acompanhada de atualizações significativas para o Hypercomputer, apresentando máquinas virtuais especialmente projetadas, equipadas com CPUs personalizadas baseadas em Arm, processadores tensores de oitava geração, suporte nativo a PyTorch TPU e, claro, as inovadoras instâncias A5X.
Projetadas para lidar com cenários de IA com agentes, as instâncias A5X utilizam um conjunto de agentes de IA, implementando uma metodologia segmentada para resolver problemas complexos. Notavelmente, essas instâncias são as primeiras do Google a serem compatíveis com as GPUs de IA Vera Rubin de última geração da NVIDIA.

Google Virgo e ConnectX-9: Escalando a infraestrutura de IA
As instâncias A5X aproveitarão os recursos das placas de interface de rede (NICs) ConnectX-9 da NVIDIA, projetadas para aprimorar cargas de trabalho de IA em ambientes de nuvem que utilizam Ethernet. Essa sinergia tecnológica, combinada com a plataforma Virgo do Google, permite que os usuários implementem até 80.000 GPUs Rubin em um único cluster e impressionantes 960.000 GPUs em clusters com vários locais.
| Componente | Cluster de data center único máximo | Cluster Max Multi-Site |
| GPUs NVIDIA Vera Rubin | 80.000 | 960.000 |
| TPUs personalizados do Google | 134.000 | Mais de 1.000.000 |
| Infraestrutura de Rede | Placas de rede NVIDIA ConnectX-9 | Plataforma Google Virgo |
Obtenção de ROI: Redução drástica dos custos de inferência e aumento da produtividade
A plataforma Google Virgo facilita uma conectividade sem precedentes entre inúmeros chips de IA em um único data center. Essa infraestrutura robusta não só funciona em conjunto com as GPUs Vera Rubin da NVIDIA, como também se integra perfeitamente às unidades de processamento de tensores (TPUs) do Google. O Virgo pode conectar até 134.000 TPUs em um único data center e mais de um milhão de chips em várias localidades. Notavelmente, a NVIDIA afirma que as instâncias A5X podem oferecer uma redução de dez vezes nos custos de inferência por token, ao mesmo tempo que aumentam a taxa de transferência em dez vezes por megawatt, em comparação com os modelos anteriores.
Além disso, a NVIDIA destaca sua colaboração com líderes do setor como Cadence e Siemens, demonstrando como seus produtos são impulsionados por essa infraestrutura e acessíveis via Google Cloud. Ademais, a plataforma Gemini do Google está pronta para implantar modelos e fluxos de trabalho de agentes em diversos setores, incluindo o de cibersegurança.
Deixe um comentário