Google ujawnia szczegółowe informacje na temat nowej generacji „Ironwood” TPU Superpod: z 9216 chipami, 192 GB pamięci HBM i mocą obliczeniową 4614 teraflopów na chip

Google ujawnia szczegółowe informacje na temat nowej generacji „Ironwood” TPU Superpod: z 9216 chipami, 192 GB pamięci HBM i mocą obliczeniową 4614 teraflopów na chip

Podczas konferencji Hot Chips 2025 firma Google zaprezentowała rewolucyjną platformę TPU nowej generacji, znaną jako Ironwood, podkreślając jej ogromną skalowalność na poziomie szafy serwerowej.

Odkrywanie Ironwood firmy Google: krok naprzód w technologii TPU

Platforma Ironwood, reprezentująca siódmą generację procesorów TPU, została po raz pierwszy zaprezentowana w kwietniu 2023 roku. Google ogłosiło, że architektura ta obiecuje niezwykły, 24-krotny wzrost wydajności w porównaniu z obecnymi wiodącymi superkomputerami. W swojej prezentacji Hot Chips 2025 Google przedstawiło przegląd ewolucji i udoskonaleń technologii TPU na przestrzeni lat.

Porównanie systemów TPU: przegląd wydajności i pojemności TPU v4, v5p i Ironwood na lata 2022–2025.

W 2022 roku Google wprowadził na rynek TPU v4, który zintegrował 4096 chipów w jednym podzespole, wraz z 32 GB pamięci HBM o wysokiej przepustowości 1, 2 TB/s i oferując 275 teraflopów mocy obliczeniowej na chip. Rok później wprowadzono TPU v5p, wyposażony w 8960 chipów, 95 GB pamięci HBM o przepustowości 2, 8 TB/s i imponującą moc obliczeniową 459 teraflopów na chip. W tym roku Ironwood TPU Superpod ma jeszcze bardziej udoskonalić te specyfikacje, oferując 9216 chipów na podzespół, 192 GB pamięci HBM o przepustowości 7, 4 TB/s i imponującą wydajność szczytową na poziomie 4614 teraflopów na chip, co oznacza 16-krotny wzrost w porównaniu z TPU v4.

Schemat architektury sieci Ironwood Superpod i Max-scale Cluster.

Google przyjrzał się bliżej architekturze Ironwood Superpod i klastra Max-scale. Sercem tej architektury jest układ SoC (System-on-Chip) Ironwood, z czterema układami zintegrowanymi w każdej płycie głównej Ironwood PCBA, które razem mieszczą się w stelażu Ironwood TPU. Każdy stelaż mieści 16 układów PCB Ironwood, co daje imponującą konfigurację 64-chipową.

Schemat podsystemów szafy centrum danych z opisanymi komponentami, takimi jak tacka, kable i jednostki zasilające.

Rozwiązanie sieciowe do zapewnienia łączności wykorzystuje technologię InterChip Interconnect (ICI) firmy Google, zaprojektowaną z myślą o skalowalności sieci. Ta konfiguracja umożliwia połączenie do 43 klastrów (z jednym blokiem zawierającym 64 chipy każdy) w ramach Superpodów, co jest możliwe dzięki imponującej przepustowości sieci wynoszącej 1, 8 petabajta. Wewnętrzna wymiana danych odbywa się za pomocą różnych kart sieciowych (NIC).

Superpod Google składa się z wielu szaf rackowych, a konkretnie Ironwood Superpod, który składa się ze 144 szaf rackowych. Dodatkowo, architektura obejmuje obudowę przełącznika optycznego, która usprawnia skalowalność łączności między blokami, a także szafę rackową z jednostką dystrybucji chłodziwa (CBU).

Schemat szafy Superpod z SoC Ironwood, TPU, OCS i CDU do obsługi sieci i chłodzenia.

Konstrukcja szaf wykorzystuje układ torusa 3D, spójny z trzema ostatnimi generacjami TPU. Każdy element konstrukcyjny składa się z sieci 4x4x4 3D, co daje łącznie 64 układy scalone lub węzły umieszczone w jednej szafie.

Stojak Google TPU ze schematem blokowym ICI 4x4x4, szczegółowymi kablami i połączeniami.

Strategia łączności Google opiera się na modelu hybrydowym, który łączy płytki drukowane (PCB), pasywne łącza miedziane i połączenia światłowodowe, zapewniając elastyczność konfiguracji systemu.

Stojak z wiązkami światłowodów ICI i schematem rozmieszczenia wstępnie wdrożonego systemu światłowodowego
Infrastruktura chłodzenia centrum danych i schemat układu zapewniający optymalną wydajność
Diagram ilustrujący zarządzanie energią TPU SoC i zaślepianie szaf w centrach danych.
Wykres przedstawiający tryby zasilania stojaka: podstawowe TDP, wysokie TDP i szczegóły aktywacji okresu dławienia 120 s.
Wyzwania i szanse w zakresie skalowania i infrastruktury ML.

2 z 9

Górna część każdej szafy rack jest wyposażona w tacę ociekową, która monitoruje potencjalne wycieki cieczy z kolektora. Poniżej znajduje się system zasilania, który obejmuje dwie sekcje zasilania, zdolne do konwersji napięcia przemiennego 416 V na prąd stały poprzez prostowanie. Konstrukcja Ironwood wykorzystuje system chłodzenia cieczą, dzięki czemu pojedyncza szafa rack może obsłużyć ponad 100 kW mocy przy pełnym obciążeniu. To kończy przedstawione spostrzeżenia dotyczące TPU Ironwood.

Źródło i obrazy

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *