NVIDIA 發表 Blackwell RTX:透過 RTX PRO 6000 展示神經渲染和遊戲,並透過 MIG 運行四個《Cyber​​punk 2077》實例

NVIDIA 發表 Blackwell RTX:透過 RTX PRO 6000 展示神經渲染和遊戲,並透過 MIG 運行四個《Cyber​​punk 2077》實例

NVIDIA 憑藉其在神經渲染和遊戲領域的最新進展,繼續在科技行業掀起波瀾,尤其是透過其 Blackwell RTX GPU 系列,其中包括 RTX 5090 和 RTX PRO 6000。

NVIDIA 在 2025 年 Hot Chips 大會上展示 Blackwell RTX 創新技術

Blackwell RTX 架構於 2023 年 1 月發布,其突破性功能主要聚焦於人工智慧 (AI)。這項創新對 NVIDIA 來說並非新鮮事,其發展歷程始於 2006 年 CUDA 的推出,標誌著加速運算和 AI 領域的重大進步。

2006 年至 2025 年的 AI 發展時間表,重點介紹 NVIDIA 的關鍵創新和成就。

NVIDIA 聲稱,運算密度的進步已經超越了摩爾定律的擴展速度,這得益於稀疏性、新的指令集架構 (ISA) 和優化的低精度格式等技術。 2018 年推出的即時光線追蹤以及隔年推出的 DLSS 代表了這一演進的關鍵里程碑。

NVIDIA Blackwell 架構圖,其中詳細說明了 GPU、CPU 和記憶體規格,以實現效能擴展。

這些創新是利用包括 RT 核心和 Tensor 核心在內的先進技術實現的,而 Blackwell 現在將這些功能提升到了一個新的水平。

RTX 生態系統框架採用 Blackwell 架構工具,用於 AI 和渲染增強。

在資料中心領域,NVIDIA 推出了 FP4 精度,為需要密集擴展的工作負載提供了 4 倍的效能提升。 NVIDIA 執行長黃仁勳旨在重申 AI 在圖形領域的關鍵地位,並透過 Blackwell RTX 推動神經渲染時代的到來。 RTX 品牌象徵著模擬、內容創作和遊戲領域的創新,為將資料中心技術擴展到消費級 RTX GPU 鋪平了道路。

神經渲染有望透過 AI 視覺效果、流暢的反應能力和自適應體驗增強遊戲體驗。

那麼,Blackwell 架構究竟有何貢獻呢?它擁有 DLSS 4、MFG、ACE 和增強路徑追蹤等先進技術,旨在提升性能和視覺保真度。 NVIDIA 聲稱,Blackwell RTX 可以實現「效能、佔用空間和設計週期的 10 倍提升」。 DLSS 4 策略性地利用 AI 在初始幀之後渲染 100% 的像素,最終縮短渲染時間並延長行動裝置的電池續航時間。

RTX Blackwell晶片的設計原則是:優化神經工作負載、減少記憶體、提高效率。

RTX Blackwell GPU 的主要設計原則包括:

  • 針對新的神經工作負載進行最佳化
  • 最小化記憶體佔用
  • 確保神經和圖形任務的優質服務
  • 可擴展的能源效率
NVIDIA RTX Blackwell 晶片配備 AI、Tensor Cores、G7 記憶體和先進的渲染架構。

從技術層面來看,RTX Blackwell 堪稱工程強者,提供每秒 4000 次 AI 兆次運算 (TOPS) 和基於第五代 Tensor 核心的高速 FP4 支援。它憑藉第四代 RT 核心,提供高達 360 次 RT TFLOP 的百萬級幾何運算能力,而 AI 管理流程 (AMP) 則能夠有效管理 AI 模型和圖形處理。

用於神經著色器的 RTX Blackwell SM 架構圖,具有著色器和張量核心。

RTX Blackwell 串流多處理器 (SM) 的架構與其資料中心版本有顯著差異。一項顯著的改進是整合了先前相互獨立的 FP32 和 INT32 單元,從而提升了處理效率。

圖表顯示 RTX Blackwell SM 使用神經著色器和核心將著色器執行重新排序功能增強 2 倍。

此外,RTX Blackwell 增強了著色器執行重新排序 (SER),使著色器執行效率提高一倍。

Blackwell 第五代 Tensor Cores 配備 FP4,展示了比前代產品更高的吞吐量。

第五代 Tensor Core 引入了 FP4 支持,並在 DLSS 4 中包含 MFG 模式,允許 GPU 使用 AI 同時渲染四幀。

DLSS4 + RTX Blackwell 透過更快、更有效率的幀渲染和 GPU 節能來提升遊戲體驗。

因此,結合 DLSS 4 和幀生成技術,可將核心軌道閘控速度提升十倍,同時實現 DRAM 自刷新率提升百倍,從而顯著縮短單幀渲染時間。行動平台的 GPU 功耗可降低高達兩倍,進而大幅提升電池續航力。

GDDR7 與 GDDR6x:新圖形 DRAM 標準中增強的資料速率和效率。

GDDR7 的引入使 RTX Blackwell 能夠實現高達 30 Gbps 的速度,相當於其前身 GDDR6 資料速率的兩倍。這項全新記憶體標準進一步提升了行動平台的效率。

由於 NVIDIA 的 AMP 單元,同時執行 AI 和圖形工作負載成為現實,從而實現更流暢的幀傳輸和更快的模型響應。

RTX PRO 6000 概覽顯示通用 MIG 和 GPU 執行個體最佳化細節。

從遊戲應用向專業用途轉型,NVIDIA 在 RTX PRO 6000 中引入了 Universal MIG 等全新功能。這使得最多四個 RTX PRO GPU 實例(每個執行個體配備 24 GB VRAM)能夠同時運行,並保持一致的延遲和吞吐量。

令人印象深刻的演示展示了 RTX PRO 6000 的功能,即在最高設定下以 1080p 運行四個 Cyber​​punk 2077 實例,對於這款強大的 GPU 來說,這是一項可完成的任務。

RTX PRO 6000 多租戶縮放長條圖,賽博龐克 2077 1080p 效能指標。

以標準時間片實例為基準,與 MIG 2x 和 4x 模式進行比較,可擴展性顯著提升了 60%。 RTX PRO 6000 Blackwell GPU 確實非常適合管理像 Cyber​​punk 2077 這樣高要求應用程式的多個實例。

圖表透過影像樣本比較了 Blackwell FP4 的性能和 VRAM 使用情況。

總體而言,NVIDIA 的 Blackwell GPU 架構自發布以來取得了長足進步,並持續針對消費級和專業級應用進行改進。隨著越來越多的遊戲和內容創作工具開始融入 Blackwell 提供的廣泛 AI 和神經增強功能,人們對該領域未來發展的期望顯而易見。

來源和圖片

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *