Microsoft anuncia novo centro de dados de IA do Azure em Atlanta
Neste dia, a Microsoft revelou oficialmente os planos para um novo centro de dados de IA do Azure em Atlanta, Geórgia. Esta instalação de última geração será interligada ao centro existente em Fairwater, Wisconsin, juntamente com vários supercomputadores de IA do Azure. O objetivo é desenvolver um centro de dados de IA abrangente e em escala planetária, capaz de gerenciar com eficiência uma ampla gama de tarefas de IA.
Design inovador revoluciona data centers de IA
Aproveitando os conhecimentos adquiridos com a construção de data centers personalizados para as necessidades de treinamento da OpenAI e outras aplicações de IA, a Microsoft afirma ter transformado a arquitetura dos data centers de IA. O novo design de data center de IA apresenta uma estrutura de rede plana que aproveita o poder computacional de inúmeras GPUs NVIDIA GB200 e GB300, possibilitando um desempenho sem precedentes.
Principais características do novo centro de dados
O futuro centro de dados de Atlanta apresentará diversas funcionalidades inovadoras que o diferenciam de seus antecessores:
- Alta densidade de GPUs: Racks projetados sob medida e dispostos de forma otimizada para o máximo aproveitamento das GPUs, o que minimiza a latência e melhora a intercomunicação entre elas.
- Refrigeração líquida em circuito fechado: um ecossistema de refrigeração selado e inovador que conserva água, utilizando o mesmo suprimento por mais de seis anos com evaporação mínima, promovendo a sustentabilidade e, ao mesmo tempo, suportando computação de alta densidade.
- Fornecimento de energia robusto: Com impressionantes ~140 kW por rack e ~1, 36 MW por linha, esta configuração foi projetada para acomodar aceleradores de última geração sem encontrar as restrições de energia convencionais.
- Rede plana de alta largura de banda: Incorporando uma estrutura Ethernet de duas camadas que oferece conectividade de GPU de 800 Gbps juntamente com rede baseada em SONiC, este projeto busca minimizar custos, complexidade e dependência de fornecedores específicos.
- Otimização de rede com reconhecimento de aplicações: Recursos como gerenciamento de pacotes em tempo real e balanceamento de carga sofisticado garantem que grandes clusters de GPUs permaneçam altamente utilizados.
- Rede WAN de IA em escala planetária: A conexão de múltiplos locais, incluindo Atlanta e Wisconsin, por meio de uma infraestrutura óptica dedicada de baixa latência, cria um “supercomputador” coeso que abrange diversas regiões.
- Modelo de Energia Resiliente: Esta abordagem utiliza redes elétricas locais robustas para maior confiabilidade, incorporando soluções de armazenamento de energia para se adaptar às variações nos requisitos de energia da carga de trabalho.
- Suporte versátil para cargas de trabalho de IA: A infraestrutura foi projetada para executar com eficiência uma variedade de tarefas de IA — desde pré-treinamento e ajuste fino até aprendizado por reforço, inferência e geração de dados sintéticos — em uma plataforma unificada.
Posicionamento para a demanda futura em cargas de trabalho de IA
Ao estabelecer um supercomputador unificado em várias regiões, a Microsoft está se posicionando estrategicamente para atender às crescentes demandas associadas aos fluxos de trabalho de IA em larga escala previstos para os próximos anos.
Deixe um comentário