Googleが次世代「Ironwood」TPUスーパーポッドの詳細を発表:9216個のチップ、192GBのHBMメモリ、チップあたり4614TFLOPSの演算能力を搭載

Googleが次世代「Ironwood」TPUスーパーポッドの詳細を発表:9216個のチップ、192GBのHBMメモリ、チップあたり4614TFLOPSの演算能力を搭載

Hot Chips 2025 で、Google は Ironwood と呼ばれる革新的な次世代 TPU プラットフォームを展示し、ラック レベルでの広範なスケーラビリティを強調しました。

GoogleのIronwoodを探る:TPUテクノロジーの飛躍的進歩

第7世代TPUを代表するIronwoodプラットフォームは、2023年4月に初めて発表されました。Googleは、このアーキテクチャが現在の主要スーパーコンピューターと比較して24倍という驚異的なパフォーマンス向上を実現すると発表しました。Hot Chips 2025プレゼンテーションでは、Googleは長年にわたるTPUの進化と進歩の概要を説明しました。

TPU システムの比較: 2022 ~ 2025 年の TPU v4、v5p、Ironwood のパフォーマンスと容量の概要。

2022年、GoogleはTPU v4を発表しました。これは4096個のチップを1つのポッドに統合し、32GBの1.2TB/s高帯域幅メモリ(HBM)を搭載し、チップあたり275TFLOPSの演算能力を提供しました。翌年には、8960個のチップ、95GBの2.8TB/s HBMメモリを搭載し、チップあたり459TFLOPSという驚異的な性能を誇るTPU v5pを発表しました。今年発表されたIronwood TPU Superpodは、これらの仕様をさらに向上させ、ポッドあたり9216個のチップを搭載し、192GBの7.4TB/s HBMメモリを搭載し、チップあたり4614TFLOPSという驚異的なピーク性能を実現し、TPU v4の16倍の性能向上を実現します。

Ironwood Superpod と Max-scale Cluster ネットワーク アーキテクチャの図。

Googleは、Ironwood SuperpodとMaxスケールクラスタのアーキテクチャを詳細に調査しました。このアーキテクチャの中核を成すのはIronwoodシステムオンチップ(SoC)で、各Ironwood PCBAマザーボードには4つのチップが統合されており、これらがまとめてIronwood TPUラックに収まります。各ラックには16個のIronwood PCBAが収容され、合計64チップという驚異的な構成となっています。

トレイ、ケーブル、電源ユニットなどのラベル付きコンポーネントを含むデータ センター ラック サブシステム図。

相互接続のためのネットワークソリューションには、スケールアップ型ネットワーク向けに設計されたGoogleのInterChip Interconnect(ICI)テクノロジーが採用されています。この構成では、1.8ペタバイトという大容量のネットワーク容量を活用し、スーパーポッド全体で最大43個のクラスタ(1ブロックあたり64個のチップ)を接続できます。内部データ交換には、各種ネットワークインターフェースカード(NIC)が使用されています。

Googleのスーパーポッドは複数のラックで構成されており、具体的には144個のラックを備えたIronwood Superpodが挙げられます。さらに、このアーキテクチャには、ブロック間のスケールアップ接続を強化する光スイッチシャーシと、冷却剤分配ユニット(CBU)ラックが組み込まれています。

ネットワークと冷却用の Ironwood SoC、TPU、OCS、CDU を備えた Superpod ラック スイートの図。

ラックの設計には、過去3世代のTPUで一貫して採用されている3Dトーラスレイアウトが採用されています。各構造コンポーネントは4x4x4の3Dネットワークを構成し、合計64個のチップまたはノードが1つのラックにパッケージ化されています。

4x4x4 ICI ブロック図、ケーブル、接続の詳細を備えた Google TPU ラック。

Google の相互接続戦略では、プリント回路基板 (PCB) シート、銅パッシブ リンク、光ファイバー接続を組み合わせたハイブリッド モデルを採用し、システム構成の柔軟性を確保しています。

ICI ファイバー バンドルを備えたラックと、事前展開されたファイバー システム レイアウトの図
最適な効率を実現するデータセンターの冷却インフラストラクチャとレイアウト図
データセンターにおける TPU SoC 電源管理とラック キャッピングを示す図。
ラック電源モードを示すグラフ: ベースライン TDP、高 TDP、および 120 秒のスロットル期間のアクティブ化の詳細。
ML ラックのスケーリングとインフラストラクチャにおける課題と機会。

9枚中2枚

各ラックの上部には、マニホールドからの液漏れを監視するためのドリップパンが装備されています。その下には電力供給システムがあり、416ボルトの交流を整流によって直流に変換できる2つの電源ドメインを備えています。Ironwoodの設計には液冷システムが実装されており、1つのラックでフル負荷時に100kWを超える電力をサポートできます。これで、Ironwood TPUに関する知見は終了です。

出典と画像

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です