Google dévoile des détails détaillés sur le superpod TPU « Ironwood » de nouvelle génération : doté de 9 216 puces, de 192 Go de mémoire HBM et de 4 614 TFLOP de puissance de calcul par puce.

Google dévoile des détails détaillés sur le superpod TPU « Ironwood » de nouvelle génération : doté de 9 216 puces, de 192 Go de mémoire HBM et de 4 614 TFLOP de puissance de calcul par puce.

Lors du salon Hot Chips 2025, Google a présenté sa plateforme TPU révolutionnaire de nouvelle génération, connue sous le nom d’Ironwood, soulignant sa grande évolutivité au niveau du rack.

À la découverte d’Ironwood de Google : un bond en avant dans la technologie TPU

La plateforme Ironwood, qui représente la 7e génération de TPU, a été initialement dévoilée en avril 2023. Google a annoncé que cette architecture promettait une multiplication par 24 des performances par rapport aux supercalculateurs actuels. Lors de sa présentation Hot Chips 2025, Google a présenté l’évolution et les avancées de ses TPU au fil des ans.

Comparaison des systèmes TPU : aperçu des performances et des capacités des TPU v4, v5p et Ironwood pour 2022-2025.

En 2022, Google a lancé le TPU v4, qui intégrait 4 096 puces dans un seul pod, accompagnées de 32 Go de mémoire à haut débit (HBM) à 1, 2 To/s et offrant 275 TFLOPs de puissance de calcul par puce. L’année suivante, le TPU v5p a été lancé, avec 8 960 puces, 95 Go de mémoire HBM à 2, 8 To/s et un impressionnant 459 TFLOPs par puce. Cette année, l’Ironwood TPU Superpod devrait encore améliorer ces spécifications, offrant 9 216 puces par pod, équipées de 192 Go de mémoire HBM à 7, 4 To/s et un impressionnant 4 614 TFLOPs de performances de pointe par puce, soit une amélioration de 16 fois par rapport au TPU v4.

Diagramme de l'architecture du réseau Ironwood Superpod et Max-scale Cluster.

Google a approfondi l’architecture du Superpod Ironwood et du cluster Max-scale. Au cœur de cette architecture se trouve le système sur puce (SoC) Ironwood, avec quatre puces intégrées à chaque carte mère Ironwood PCBA, qui s’intègrent ensemble dans un rack Ironwood TPU. Chaque rack contient 16 PCBA Ironwood, soit une configuration impressionnante de 64 puces.

Schéma des sous-systèmes de rack de centre de données avec des composants étiquetés tels que le plateau, les câbles et les unités d'alimentation.

La solution réseau d’interconnectivité utilise la technologie InterChip Interconnect (ICI) de Google, conçue pour les réseaux évolutifs. Cette configuration permet de relier jusqu’à 43 clusters (chacun comprenant 64 puces) via des Superpods, grâce à une capacité réseau importante de 1, 8 pétaoctet. L’échange de données interne utilise différentes cartes réseau (NIC).

Le superpod de Google est composé de plusieurs racks, notamment le superpod Ironwood qui en compte 144. De plus, l’architecture comprend un châssis de commutateur optique pour améliorer la connectivité évolutive entre les blocs, complété par un rack d’unité de distribution de liquide de refroidissement (CBU).

Schéma de la suite de racks Superpod avec Ironwood SoC, TPU, OCS et CDU pour le réseau et le refroidissement.

La conception des racks repose sur une disposition en tore 3D, constante sur les trois dernières générations de TPU. Chaque composant structurel comprend un réseau 3D 4x4x4, totalisant 64 puces ou nœuds regroupés dans un seul rack.

Rack Google TPU avec schéma fonctionnel ICI 4x4x4, câbles et connexions détaillés.

La stratégie d’interconnectivité de Google utilise un modèle hybride qui combine des feuilles de circuits imprimés (PCB), des liaisons passives en cuivre et des connexions à fibre optique pour garantir la flexibilité de la configuration du système.

Rack avec faisceaux de fibres ICI et schéma de disposition du système de fibres pré-déployé
Schéma d'infrastructure et de disposition du refroidissement du centre de données pour une efficacité optimale
Diagramme illustrant la gestion de l'alimentation du SoC TPU et le plafonnement des racks dans les centres de données.
Graphique montrant les modes d'alimentation du rack : TDP de base, TDP élevé et détails d'activation de la période de limitation de 120 s.
Défis et opportunités en matière de mise à l'échelle et d'infrastructure des racks ML.

2 sur 9

La partie supérieure de chaque rack est équipée d’un bac de récupération permettant de détecter d’éventuelles fuites de liquide au niveau du collecteur. En dessous se trouve le système d’alimentation, composé de deux domaines de puissance capables de convertir 416 V CA en CC par redressement. La conception d’Ironwood intègre un système de refroidissement liquide, permettant à un seul rack de supporter plus de 100 kW de puissance à pleine charge. Ceci conclut les informations partagées concernant le TPU Ironwood.

Source et images

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *