NVIDIA Blackwell RTX 50 GPU 架構揭曉:有關進階核心、DLSS 4 和下一代遊戲技術的關鍵細節

NVIDIA Blackwell RTX 50 GPU 架構揭曉:有關進階核心、DLSS 4 和下一代遊戲技術的關鍵細節

在 CES 2025 上,NVIDIA 深入介紹了其下一代 Blackwell GPU 架構,該架構將為即將推出的 RTX 50 遊戲顯示卡提供動力。這種創新設計有望比先前的 Ada 架構取得重大進步,為遊戲玩家和內容創作者增強效能、效率和圖形功能。

探索 NVIDIA GeForce RTX 50「Blackwell」GPU 架構

Blackwell 架構專為高要求的遊戲環境和創意應用程式量身定制,具有可實現卓越性能的突破性組件。 RTX 50 系列預計本月稍後推出,採用由台積電 4 奈米製程節點打造的架構。這種尖端的 GPU 設計包含令人印象深刻的 920 億個晶體管,可提供高達 4000 AI TOPS、380 RT TFLOPs 和 125 TFLOPS 的 FP32 運算能力。此外,它還擁有最快的 GDDR7 記憶體接口,頻寬高達 1.8 TB/s,全部採用重新設計的 Founders Edition 美學。

Blackwell GPU 概述

Blackwell 架構的深入概述

NVIDIA 的 Blackwell 架構旨在透過專注於先進的神經功能和工作負載來提升下一代遊戲的圖形能力。這包括顯著減少記憶體佔用、提高能源效率以及創新的服務品質功能。主要增強功能包括:

  • 推出第五代 Tensor 核心,提供高達 4000 AI TOPS 的高速 FP4 運算。
  • 第四代光線追蹤 (RT) 核心具有驚人的 360 RT TFLOP,專為 Mega Geometry 設計。
  • 新一代人工智慧管理處理器,可無縫同時執行人工智慧模型和圖形工作負載。
  • 新型 Blackwell 流多處理器 (SM) 能夠實現 125 TFLOPS 峰值 FP32 運算。
  • 包含 GDDR7 內存,在 RTX 5080 上提供迄今為止最快的速度,高達 30 Gbps。
布萊克威爾建築領域

RTX Blackwell 架構的其他功能包括 DisplayPort 2.1、PCIe Gen5 相容性以及具有增強色彩深度的 4K NVDEC/NVENC 功能。

性能增強和技術進步

將Blackwell 的串流多處理器(SM) 與Ada 架構的串流多處理器進行比較時,很明顯,NVIDIA 已有效地將INT32 GPU 吞吐量提高了一倍,從而增強了工作圖和著色器執行等工作負載的效能。新架構還允許更有效率地執行多個工作負載,從而將著色器執行重新排序 (SER) 顯著提高兩倍。

圖形效能

此外,GDDR7 在性能上超越了較舊的 GDDR6/X 內存,提供雙倍的頻寬和資料速率,同時更加節能。這種創新的記憶體技術支援 PAM4 訊號傳輸,使 RTX 50 系列成為第一個能夠充分利用 GDDR7 和 PCIe 5.0 的架構。

先進的光線追蹤技術

架構上的進步也延伸到了光線追蹤。第四代 RT 核心的推出採用了三角簇交叉引擎,專門針對巨型幾何處理進行了最佳化。此升級可以更好地處理複雜場景,同時保持較低的記憶體佔用。

此外,創新的巨型幾何引擎採用了三角簇壓縮格式,可有效管理大量光線追蹤任務所需的資料。這會產生 8x 射線三角形相交率,同時最大限度地減少記憶體利用率。

光線追蹤增強功能

Blackwell 第五代 Tensor Core 上引入 FP4 格式可顯著提高吞吐量,與 Pascal GPU 相比,效能優勢提高了 32 倍,與 Ada 世代 GPU 相比,效能優勢提高了 2 倍。此增強功能支援下一代遊戲中使用的先進神經著色技術。

FP4 格式改進

創新的調度和電源管理

Blackwell 架構中一個重要的介紹是稱為 Amp 的可程式協處理器。此元件促進各個 GPU 核心之間的高效互動和工作負載分配,確保最佳效能。

Blackwell 還採用複雜的電源管理模式,讓 GPU 的時脈樹在空閒狀態下停用。此功能可顯著節省功耗,特別有利於行動設計,例如「Max-Q」系列。該架構提高了性能,同時透過輔助電源軌優化功耗,允許核心和記憶體系統進行不同的電壓操作。

此外,Blackwell 將其頻率響應能力提高了 1000 倍,從而能夠根據工作負載類型有效分配頻率。與 Ada GPU 相比,這使得時脈頻率提高了高達 300 MHz。

顯示和視訊功能

Blackwell 架構也增強了顯示器和視訊處理能力。它引入了對 DisplayPort 2.1b 的支持,透過先進的硬體翻轉計量技術增強幀傳輸。架構包括第9代編碼器和第6代解碼器,相容於AV1和HEVC等先進編解碼器,確保頂級視訊品質與效能。

DLSS 的進步:DLSS 4

DLSS 4 是深度學習技術的持續發展,代表著自2018 年推出以來的重大飛躍。提高。

借助 DLSS 4,NVIDIA 過渡到強大的新型神經架構,並配備能夠更有效地處理多個資料集的轉換器引擎。新的多幀生成 (MFG) 模式允許每幀生成多達五個模型,從而顯著提高渲染品質。

這種突破性的方法為 DLSS 4 的推出奠定了基礎,初步支援 75 款遊戲,這是同時推出的最大的 DLSS 增強遊戲庫。已經使用 DLSS 3 或 3.5 的開發人員會發現整合非常簡單,可確保對新的和現有的遊戲系列提供強大的支援。

使用 Reflex 2 減少延遲

NVIDIA 的 Reflex 2 技術旨在增強遊戲玩家的反應能力,特別是在競爭環境中。透過利用 Frame Warp 技術,Reflex 2 將系統延遲降低了 75%,從而增強了整體遊戲體驗。

此增強功能可以在幀渲染之前對滑鼠位置進行即時採樣,從而顯著優化響應能力。 Reflex 2 將在各種高效能遊戲中得到原生支持,確保所有 RTX GPU 用戶都能從這項進步中受益。

利用 RTX AI 徹底改變遊戲

NVIDIA 的 Blackwell 架構強調遊戲中的 AI 整合。透過與 Microsoft 合作存取 DirectX 的神經渲染功能,NVIDIA 將釋放 RTX 50 GPU 無與倫比的效能。創新包括神經著色器和先進的材料處理,有望實現從傳統圖形到人工智慧驅動圖形的變革。

透過神經輻射緩存 (NRC) 和 RTX Mega Geometry 等新技術,NVIDIA 正在重新定義光線與場景中的物件互動的方式,在遊戲環境中提供無與倫比的真實感和互動性。用於角色渲染的人工智慧增強功能的引入進一步強調了為虛擬世界帶來逼真細節的承諾。

Blackwell 的能力提升了遊戲的未來,神經材質和照明優化的先進應用將顯著提高視覺保真度和效率。隨著 NVIDIA 不斷開拓進取,遊戲社群可以期待在圖形效能和 AI 整合方面取得前所未有的進步。

來源和圖片

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *