
NVIDIA 憑藉其在神經渲染和遊戲領域的最新進展,繼續在科技行業掀起波瀾,尤其是透過其 Blackwell RTX GPU 系列,其中包括 RTX 5090 和 RTX PRO 6000。
NVIDIA 在 2025 年 Hot Chips 大會上展示 Blackwell RTX 創新技術
Blackwell RTX 架構於 2023 年 1 月發布,其突破性功能主要聚焦於人工智慧 (AI)。這項創新對 NVIDIA 來說並非新鮮事,其發展歷程始於 2006 年 CUDA 的推出,標誌著加速運算和 AI 領域的重大進步。

NVIDIA 聲稱,運算密度的進步已經超越了摩爾定律的擴展速度,這得益於稀疏性、新的指令集架構 (ISA) 和優化的低精度格式等技術。 2018 年推出的即時光線追蹤以及隔年推出的 DLSS 代表了這一演進的關鍵里程碑。

這些創新是利用包括 RT 核心和 Tensor 核心在內的先進技術實現的,而 Blackwell 現在將這些功能提升到了一個新的水平。

在資料中心領域,NVIDIA 推出了 FP4 精度,為需要密集擴展的工作負載提供了 4 倍的效能提升。 NVIDIA 執行長黃仁勳旨在重申 AI 在圖形領域的關鍵地位,並透過 Blackwell RTX 推動神經渲染時代的到來。 RTX 品牌象徵著模擬、內容創作和遊戲領域的創新,為將資料中心技術擴展到消費級 RTX GPU 鋪平了道路。

那麼,Blackwell 架構究竟有何貢獻呢?它擁有 DLSS 4、MFG、ACE 和增強路徑追蹤等先進技術,旨在提升性能和視覺保真度。 NVIDIA 聲稱,Blackwell RTX 可以實現「效能、佔用空間和設計週期的 10 倍提升」。 DLSS 4 策略性地利用 AI 在初始幀之後渲染 100% 的像素,最終縮短渲染時間並延長行動裝置的電池續航時間。

RTX Blackwell GPU 的主要設計原則包括:
- 針對新的神經工作負載進行最佳化
- 最小化記憶體佔用
- 確保神經和圖形任務的優質服務
- 可擴展的能源效率

從技術層面來看,RTX Blackwell 堪稱工程強者,提供每秒 4000 次 AI 兆次運算 (TOPS) 和基於第五代 Tensor 核心的高速 FP4 支援。它憑藉第四代 RT 核心,提供高達 360 次 RT TFLOP 的百萬級幾何運算能力,而 AI 管理流程 (AMP) 則能夠有效管理 AI 模型和圖形處理。

RTX Blackwell 串流多處理器 (SM) 的架構與其資料中心版本有顯著差異。一項顯著的改進是整合了先前相互獨立的 FP32 和 INT32 單元,從而提升了處理效率。

此外,RTX Blackwell 增強了著色器執行重新排序 (SER),使著色器執行效率提高一倍。

第五代 Tensor Core 引入了 FP4 支持,並在 DLSS 4 中包含 MFG 模式,允許 GPU 使用 AI 同時渲染四幀。

因此,結合 DLSS 4 和幀生成技術,可將核心軌道閘控速度提升十倍,同時實現 DRAM 自刷新率提升百倍,從而顯著縮短單幀渲染時間。行動平台的 GPU 功耗可降低高達兩倍,進而大幅提升電池續航力。

GDDR7 的引入使 RTX Blackwell 能夠實現高達 30 Gbps 的速度,相當於其前身 GDDR6 資料速率的兩倍。這項全新記憶體標準進一步提升了行動平台的效率。
由於 NVIDIA 的 AMP 單元,同時執行 AI 和圖形工作負載成為現實,從而實現更流暢的幀傳輸和更快的模型響應。

從遊戲應用向專業用途轉型,NVIDIA 在 RTX PRO 6000 中引入了 Universal MIG 等全新功能。這使得最多四個 RTX PRO GPU 實例(每個執行個體配備 24 GB VRAM)能夠同時運行,並保持一致的延遲和吞吐量。
令人印象深刻的演示展示了 RTX PRO 6000 的功能,即在最高設定下以 1080p 運行四個 Cyberpunk 2077 實例,對於這款強大的 GPU 來說,這是一項可完成的任務。

以標準時間片實例為基準,與 MIG 2x 和 4x 模式進行比較,可擴展性顯著提升了 60%。 RTX PRO 6000 Blackwell GPU 確實非常適合管理像 Cyberpunk 2077 這樣高要求應用程式的多個實例。

總體而言,NVIDIA 的 Blackwell GPU 架構自發布以來取得了長足進步,並持續針對消費級和專業級應用進行改進。隨著越來越多的遊戲和內容創作工具開始融入 Blackwell 提供的廣泛 AI 和神經增強功能,人們對該領域未來發展的期望顯而易見。
發佈留言