
Während Hot Chips 2025 präsentierte Google seine revolutionäre TPU-Plattform der nächsten Generation namens Ironwood und betonte dabei ihre umfassende Skalierbarkeit auf Rack-Ebene.
Googles Ironwood: Ein Sprung nach vorn in der TPU-Technologie
Die Ironwood-Plattform, die die 7. TPU-Generation repräsentiert, wurde erstmals im April 2023 vorgestellt. Google gab bekannt, dass diese Architektur eine außergewöhnliche 24-fache Leistungssteigerung im Vergleich zu den derzeit führenden Supercomputern verspricht. In seiner Präsentation „Hot Chips 2025“ gab Google einen Überblick über die Entwicklung und Weiterentwicklung seiner TPUs im Laufe der Jahre.

Im Jahr 2022 brachte Google die TPU v4 auf den Markt, die 4096 Chips in einem einzigen Pod vereinte, dazu 32 GB High-Bandwidth Memory (HBM) mit 1, 2 TB/s und 275 TFLOPs Rechenleistung pro Chip. Im darauffolgenden Jahr wurde die TPU v5p eingeführt, die 8960 Chips, 95 GB HBM-Speicher mit 2, 8 TB/s und beeindruckende 459 TFLOPs pro Chip umfasste. In diesem Jahr soll der Ironwood TPU Superpod diese Spezifikationen noch weiter verbessern und 9216 Chips pro Pod bieten, ausgestattet mit 192 GB HBM-Speicher mit 7, 4 TB/s und unglaublichen 4614 TFLOPs Spitzenleistung pro Chip – eine 16-fache Verbesserung gegenüber der TPU v4.

Google hat sich eingehender mit der Architektur des Ironwood Superpod und des Max-Scale-Clusters befasst. Kernstück dieser Architektur ist das Ironwood System-on-Chip (SoC), bei dem vier Chips in jedes Ironwood PCBA-Motherboard integriert sind, die gemeinsam in ein Ironwood TPU-Rack passen. Jedes Rack enthält 16 Ironwood PCBAs, was einer beeindruckenden Konfiguration mit 64 Chips entspricht.

Die Netzwerklösung für die Interkonnektivität nutzt Googles InterChip Interconnect (ICI)-Technologie, die für die Skalierung von Netzwerken entwickelt wurde. Dieses Setup kann bis zu 43 Cluster (mit jeweils einem Block aus 64 Chips) über Superpods hinweg verbinden, was durch eine beträchtliche Netzwerkkapazität von 1, 8 Petabyte ermöglicht wird. Der interne Datenaustausch erfolgt über verschiedene Netzwerkschnittstellenkarten (NICs).
Der Superpod von Google besteht aus mehreren Racks, insbesondere dem Ironwood Superpod mit 144 Racks. Zusätzlich umfasst die Architektur ein optisches Switch-Chassis zur Verbesserung der Konnektivität zwischen den Blöcken, ergänzt durch ein Rack mit Kühlmittelverteilungseinheit (CBU).

Das Design der Racks basiert auf einem 3D-Torus-Layout, das in den letzten drei TPU-Generationen konsequent beibehalten wurde. Jede Strukturkomponente besteht aus einem 4x4x4 3D-Netzwerk mit insgesamt 64 Chips oder Knoten, die in einem einzigen Rack untergebracht sind.

Die Interkonnektivitätsstrategie von Google verwendet ein Hybridmodell, das Leiterplatten (PCB-Platten), passive Kupferverbindungen und Glasfaserverbindungen kombiniert, um eine flexible Systemkonfiguration zu gewährleisten.





2 von 9
Der obere Bereich jedes Racks ist mit einer Auffangwanne ausgestattet, um mögliche Flüssigkeitslecks aus dem Verteiler zu überwachen. Darunter befindet sich das Stromversorgungssystem mit zwei Leistungsbereichen, die 416 Volt Wechselspannung durch Gleichrichtung in Gleichspannung umwandeln können. Das Design von Ironwood verfügt über ein Flüssigkeitskühlsystem, sodass ein einzelnes Rack unter Volllast über 100 kW Leistung liefern kann. Dies schließt die Erkenntnisse zum Ironwood TPU ab.
Schreibe einen Kommentar