NVIDIA 公佈 DGX AI PC 的 GB10 超級晶片細節:3nm 製程、20 個 ARM v9.2 CPU 核心、1000 TOPS NVFP4 Blackwell GPU、LPDDR5x-9400 記憶體支援、140W TDPNVFP

NVIDIA 公佈 DGX AI PC 的 GB10 超級晶片細節:3nm 製程、20 個 ARM v9.2 CPU 核心、1000 TOPS NVFP4 Blackwell GPU、LPDDR5x-9400 記憶體支援、140W TDPNVFP

NVIDIA 最近推出了其最先進的 GB10 超級晶片,該晶片採用 Blackwell GPU 架構,為最新的 DGX AI Mini 超級電腦提供動力。

NVIDIA GB10 超級晶片:革命性的 SoC 和 GPU 架構

目前,NVIDIA 的 DGX Spark 備受矚目,這款搭載 GB10 超級晶片的先鋒系統標誌著其進軍「AI PC」市場的重要一步。自發布以來,許多公司已開始利用 GB10 技術建立自己的 AI PC 平台。在 Hot Chips 2025 大會上,NVIDIA 對 GB10 超級晶片進行了深入探討,展示了它如何有效地將 Blackwell 架構擴展到 Mini 開發者工作站。

與資料中心整合的 NVIDIA Blackwell GPU 架構圖。

DGX Spark 被概念化為微型​​人工智慧超級計算機,圍繞著先進的 Blackwell 架構構建。

使用 Blackwell 技術特性和 DGX Spark 建立微型 AI 超級電腦的圖表。

DGX Spark 工作站的主要功能

DGX Spark 工作站具有多項突出的功能:

  • GB10 Grace Blackwell 超級晶片:針對人工智慧、資料科學、運算、渲染和視覺化任務進行了最佳化。
  • 128GB 一致性統一系統記憶體:能夠處理高達 2, 000 億個參數的大型 AI 模型和高達 700 億個參數的微調模型。
  • ConnectX-7 網路:促進兩個 DGX Spark 系統之間的互連,允許在多達 4050 億個參數的模型上進行協作。
  • DGX Base OS 和 NVIDIA AI 軟體堆疊:這可確保 DGX Spark 和 DGX Cloud 或任何加速雲端基礎架構之間工作負載的順利傳輸。
  • 多種部署選項:可設定為 AI 工作站或網路連線的個人 AI 雲端。
  • 增強的使用者體驗:提供多頭顯示器和各種連接選項的支援。
  • 緊湊且節能的設計:可舒適地放置在任何桌子上,並可與標準壁式插座配合使用。
NVIDIA DGX Spark Workstation 具有強大的 AI 功能和緊湊、高效的設計。

深入了解:GB10 超級晶片的規格

進一步研究 GB10 超級晶片,我們發現其係統級晶片 (SoC) 採用兩個小晶片設計:S-Dielet,用於容納 CPU 和記憶體子系統;G-Dielet,專用於 GPU 核心。這兩個小晶片均採用先進的 2.5D 封裝技術,並採用台積電尖端的 3nm 製程製造。

NVIDIA GB10 超級晶片:AI 效能規格包括 20 個 Arm 核心和 128GB 記憶體。

此 CPU 架構基於 ARM v9.2 設計,共包含 20 個核心,配置為兩個叢集。每個核心都擁有一個專用的 L2 緩存,以及兩個叢集共享的 32 MB L3 快取。

NVIDIA GB10 規格表,包含 CPU、GPU 和記憶體詳細資訊。

此晶片的 GPU 部分採用 GB100 Blackwell 架構,由於位於同一晶片封裝內,因此可用作整合式 GPU (iGPU)。它擁有先進的功能,包括支援 DLSS 4 的第五代 Tensor 核心和 RTX 光線追蹤核心,可提供高達 31 TFLOP(FP32)和 1000 TOPS(NVFP4)運算的強大運算能力,專為 AI 應用量身定制。此外,該 GPU 還包含 24 MB 二級緩存,以增強效能。

在記憶體容量方面,NVIDIA GB10 超級晶片支援 256b LPDDR5x(統一記憶體架構),存取速度高達 9400 MT/s,相當於高達 301 GB/s 的驚人原始頻寬。此配置可實現 128 GB 的最大記憶體容量。其高效能一致性結構針對 CHI-E 一致性協定進行了調優,透過 C2X 介面為 GPU 提供高達 600 GB/s 的廣泛聚合系統頻寬。

NVIDIA GB10 規格:帶有晶片圖形的顯示、安全性、TDP 和作業系統詳細資訊。

此外,GB10 配備 16 MB 系統級緩存,設計為 CPU 的 L4 緩存,可促進多個 SoC 引擎之間高效共享資料。高頻寬、低功耗的 C2C 介面利用了 NVIDIA 的 NVLINK 技術。

連接選項豐富,支援 PCIe、USB 和 PCIe 乙太網路。它最多可同時支援四台顯示器(3 個 DisplayPort + 1 個 HDMI),使用 DP Alt 模式時解析度最高可達 4K/120Hz,甚至支援 HDMI 2.1a 的 8K/120Hz 解析度。安全性也同樣重要,支援 Dual Secure Root、SROOT 處理器、OSROOT 處理器,並相容於 fTPM 和獨立 TPM。此晶片的總設計功耗 (TDP) 為 140W。

GB10 可擴充性圖表,透過 NVIDIA ConnectX 實現多 GPU 運算效率。

GB10超級晶片的可擴充性

GB10 超級晶片的另一個值得關注的特性是其可擴展性。多個 GB10 晶片可透過 NVIDIA 的 ConnectX 技術互連,從而提高吞吐量、頻寬和 DRAM 容量,這對於支援更大規模的 AI 型號至關重要。每個 ConnectX 網路介面卡 (NIC) 透過 PCIe Gen5 x8 介面連接到 GB10 SoC,各個單元透過乙太網路框架進行通訊。

NVIDIA 與聯發科的合作圖,融合 CPU 和 GPU 架構以提高效率。

NVIDIA 將 GB10 Superchip SoC 描述為與聯發科成功合作的成果,並利用了聯發科的 CPU IP。該晶片針對 GPU 記憶體與聯發科記憶體基礎架構之間的交互作用進行了詳細的效能建模。

帶有顯示器的 NVIDIA DGX Spark 計算機,為開發人員優化 AI 和 GPU 效能。

GB10超級晶片的未來前景

GB10超級晶片最令人興奮的地方在於它最終有望進入筆記型電腦和迷你PC等消費市場。有報導稱,即將推出的N1X和N1 SoC可能成為首批面向消費者的NVIDIA SoC,而GB10則讓我們得以一窺這些晶片所能提供的功能。

來源和圖片

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *