
Hot Chips 2025 で、Google は Ironwood と呼ばれる革新的な次世代 TPU プラットフォームを展示し、ラック レベルでの広範なスケーラビリティを強調しました。
GoogleのIronwoodを探る:TPUテクノロジーの飛躍的進歩
第7世代TPUを代表するIronwoodプラットフォームは、2023年4月に初めて発表されました。Googleは、このアーキテクチャが現在の主要スーパーコンピューターと比較して24倍という驚異的なパフォーマンス向上を実現すると発表しました。Hot Chips 2025プレゼンテーションでは、Googleは長年にわたるTPUの進化と進歩の概要を説明しました。

2022年、GoogleはTPU v4を発表しました。これは4096個のチップを1つのポッドに統合し、32GBの1.2TB/s高帯域幅メモリ(HBM)を搭載し、チップあたり275TFLOPSの演算能力を提供しました。翌年には、8960個のチップ、95GBの2.8TB/s HBMメモリを搭載し、チップあたり459TFLOPSという驚異的な性能を誇るTPU v5pを発表しました。今年発表されたIronwood TPU Superpodは、これらの仕様をさらに向上させ、ポッドあたり9216個のチップを搭載し、192GBの7.4TB/s HBMメモリを搭載し、チップあたり4614TFLOPSという驚異的なピーク性能を実現し、TPU v4の16倍の性能向上を実現します。

Googleは、Ironwood SuperpodとMaxスケールクラスタのアーキテクチャを詳細に調査しました。このアーキテクチャの中核を成すのはIronwoodシステムオンチップ(SoC)で、各Ironwood PCBAマザーボードには4つのチップが統合されており、これらがまとめてIronwood TPUラックに収まります。各ラックには16個のIronwood PCBAが収容され、合計64チップという驚異的な構成となっています。

相互接続のためのネットワークソリューションには、スケールアップ型ネットワーク向けに設計されたGoogleのInterChip Interconnect(ICI)テクノロジーが採用されています。この構成では、1.8ペタバイトという大容量のネットワーク容量を活用し、スーパーポッド全体で最大43個のクラスタ(1ブロックあたり64個のチップ)を接続できます。内部データ交換には、各種ネットワークインターフェースカード(NIC)が使用されています。
Googleのスーパーポッドは複数のラックで構成されており、具体的には144個のラックを備えたIronwood Superpodが挙げられます。さらに、このアーキテクチャには、ブロック間のスケールアップ接続を強化する光スイッチシャーシと、冷却剤分配ユニット(CBU)ラックが組み込まれています。

ラックの設計には、過去3世代のTPUで一貫して採用されている3Dトーラスレイアウトが採用されています。各構造コンポーネントは4x4x4の3Dネットワークを構成し、合計64個のチップまたはノードが1つのラックにパッケージ化されています。

Google の相互接続戦略では、プリント回路基板 (PCB) シート、銅パッシブ リンク、光ファイバー接続を組み合わせたハイブリッド モデルを採用し、システム構成の柔軟性を確保しています。





9枚中2枚
各ラックの上部には、マニホールドからの液漏れを監視するためのドリップパンが装備されています。その下には電力供給システムがあり、416ボルトの交流を整流によって直流に変換できる2つの電源ドメインを備えています。Ironwoodの設計には液冷システムが実装されており、1つのラックでフル負荷時に100kWを超える電力をサポートできます。これで、Ironwood TPUに関する知見は終了です。
コメントを残す