NVIDIA Blackwell RTX 50 GPU 아키텍처 공개: 고급 코어, DLSS 4 및 차세대 게임 기술에 대한 주요 세부 정보

NVIDIA Blackwell RTX 50 GPU 아키텍처 공개: 고급 코어, DLSS 4 및 차세대 게임 기술에 대한 주요 세부 정보

CES 2025에서 NVIDIA는 다가올 RTX 50 게이밍 그래픽 카드에 전력을 공급할 차세대 Blackwell GPU 아키텍처를 자세히 살펴보았습니다. 이 혁신적인 디자인은 이전 Ada 아키텍처에 비해 상당한 발전을 약속하며, 게이머와 콘텐츠 제작자 모두에게 성능, 효율성 및 그래픽 기능을 향상시킵니다.

NVIDIA GeForce RTX 50 “Blackwell” GPU 아키텍처 살펴보기

Blackwell 아키텍처는 수요가 많은 게임 환경과 창의적인 애플리케이션에 맞춰 설계되었으며, 뛰어난 성능을 제공하는 획기적인 구성 요소를 갖추고 있습니다. RTX 50 시리즈는 이번 달 말에 출시될 예정이며, TSMC의 4nm 공정 노드에서 제작된 아키텍처를 선보일 예정입니다. 이 최첨단 GPU 디자인은 인상적인 920억 개의 트랜지스터를 통합하여 최대 4000개의 AI TOPS, 380개의 RT TFLOP, 125개의 FP32 컴퓨팅 파워를 제공합니다. 또한 가장 빠른 GDDR7 메모리 인터페이스를 자랑하며, 최대 1.8TB/s의 대역폭을 달성하며, 모두 재설계된 Founders Edition 미학에 담겨 있습니다.

블랙웰 GPU 개요

Blackwell 아키텍처의 심층적 개요

NVIDIA의 Blackwell 아키텍처는 고급 신경 기능과 워크로드에 초점을 맞춰 차세대 게임의 그래픽 능력을 높이는 것을 목표로 합니다. 여기에는 메모리 풋프린트의 상당한 감소, 향상된 에너지 효율성, 혁신적인 서비스 품질 기능이 포함됩니다. 주요 개선 사항은 다음과 같습니다.

  • 최대 4000 AI TOPS의 고속 FP4 컴퓨팅을 제공하는 5세대 텐서 코어가 출시되었습니다.
  • Mega Geometry를 위해 특별히 설계된 무려 360 RT TFLOPs의 4세대 레이 트레이싱(RT) 코어.
  • AI 모델과 그래픽 워크로드를 동시에 원활하게 실행할 수 있는 차세대 AI 관리 프로세서입니다.
  • 최대 FP32 컴퓨팅 성능 125 TFLOPS를 구현할 수 있는 새로운 Blackwell 스트리밍 멀티프로세서(SM)
  • GDDR7 메모리가 포함되어 RTX 5080에서 최대 30Gbps의 가장 빠른 속도를 제공합니다.
블랙웰 건축 도메인

RTX Blackwell 아키텍처의 추가 기능으로는 DisplayPort 2.1, PCIe Gen5 호환성, 향상된 색상 심도를 갖춘 4K NVDEC/NVENC 기능이 있습니다.

성능 향상 및 기술 발전

Blackwell의 스트리밍 멀티프로세서(SM)를 Ada 아키텍처의 스트리밍 멀티프로세서(SM)와 비교하면 NVIDIA가 INT32 GPU 처리량을 효과적으로 두 배로 늘려 Work Graphs 및 Shader Execution과 같은 워크로드의 성능을 향상시킨 것이 분명합니다. 또한 새로운 아키텍처는 여러 워크로드의 효율적인 실행을 허용하여 Shader Execution Reordering(SER)을 두 배로 크게 개선합니다.

그래픽 성능

또한 GDDR7은 성능 면에서 기존 GDDR6/X 메모리를 능가하여 대역폭과 데이터 전송 속도를 두 배로 높이고 에너지 효율성도 더 높습니다. 이 혁신적인 메모리 기술은 PAM4 신호를 지원하여 RTX 50 시리즈를 GDDR7과 PCIe 5.0을 모두 완벽하게 활용할 수 있는 최초의 아키텍처로 자리매김합니다.

고급 레이 트레이싱 기술

건축적 발전은 레이 트레이싱에도 확장됩니다. 4세대 RT 코어의 도입은 특히 Mega Geometry 처리에 최적화된 Triangle Cluster Intersection Engine을 특징으로 합니다. 이 업그레이드는 더 낮은 메모리 풋프린트를 유지하면서 복잡한 장면을 더 잘 처리할 수 있게 해줍니다.

또한 혁신적인 Mega Geometry 엔진은 Triangle Cluster Compression 형식을 통합하여 광범위한 레이 트레이싱 작업에 필요한 데이터를 효율적으로 관리합니다. 이를 통해 메모리 사용량을 최소화하면서 8배 레이 삼각형 교차율이 발생합니다.

레이 트레이싱 향상

Blackwell의 5세대 Tensor Cores에 FP4 포맷을 도입하면서 처리량이 극적으로 증가하여 Pascal GPU보다 32배, Ada 세대 GPU보다 2배 더 높은 성능을 제공합니다. 이 향상은 차세대 게임 타이틀에 사용되는 고급 Neural Shading 기술을 지원합니다.

FP4 형식 개선

혁신적인 스케줄링 및 전원 관리

Blackwell 아키텍처 내에서 중요한 도입은 Amp로 알려진 프로그래밍 가능한 Coprocessor입니다. 이 구성 요소는 다양한 GPU 코어에서 효율적인 상호 작용과 작업 부하 분산을 용이하게 하여 최적의 성능을 보장합니다.

Blackwell은 또한 정교한 전력 관리 모드를 채택하여 유휴 상태에서 GPU의 클록 트리를 비활성화할 수 있습니다. 이 기능은 상당한 전력 절감을 가능하게 하며, 특히 “Max-Q” 시리즈와 같은 모바일 설계에 유용합니다. 이 아키텍처는 코어와 메모리 시스템에 대해 서로 다른 전압 작동을 허용하는 보조 레일을 통해 전력 소비를 최적화하는 동시에 성능을 향상시킵니다.

또한 Blackwell은 주파수 응답성을 1000배나 향상시켜 워크로드 유형에 따라 주파수를 효율적으로 할당할 수 있습니다. 이를 통해 Ada GPU에 비해 ​​최대 300MHz의 클록 주파수가 향상됩니다.

디스플레이 및 비디오 기능

Blackwell 아키텍처는 또한 디스플레이 및 비디오 처리 기능을 강화합니다. DisplayPort 2.1b에 대한 지원을 도입하여 고급 하드웨어 플립 미터링 기술을 통해 프레임 전달을 향상시킵니다. 이 아키텍처에는 AV1 및 HEVC와 같은 고급 코덱과 호환되는 9세대 인코더와 6세대 디코더가 포함되어 있어 최고 수준의 비디오 품질과 성능을 보장합니다.

DLSS의 발전: DLSS 4

딥 러닝 기술의 진화를 이어가는 DLSS 4는 2018년 출시 이후 큰 도약을 이루었습니다. 이번 버전에서는 NVIDIA가 고급 슈퍼컴퓨터를 활용하여 DLSS 모델을 지속적으로 개선하여 이미지 품질과 응답성이 크게 향상되었습니다.

DLSS 4를 통해 NVIDIA는 여러 데이터 세트를 보다 효과적으로 처리할 수 있는 트랜스포머 엔진이 포함된 강력한 새로운 신경 아키텍처로 전환합니다. 새로운 다중 프레임 생성(MFG) 모드를 사용하면 프레임당 최대 5개의 모델을 생성할 수 있어 렌더링 품질이 크게 향상됩니다.

이 획기적인 접근 방식은 DLSS 4가 75개 게임에 대한 초기 지원과 함께 제공될 수 있는 토대를 마련했으며, 이는 동시에 출시된 DLSS 강화 타이틀의 가장 큰 라이브러리입니다. 이미 DLSS 3 또는 3.5를 사용하고 있는 개발자는 통합이 간단하다는 것을 알게 될 것이며, 새로운 타이틀 라인과 기존 타이틀 라인 모두에서 강력한 지원을 보장합니다.

Reflex 2로 대기 시간 단축

NVIDIA의 Reflex 2 기술은 특히 경쟁적인 환경에서 게이머의 반응성을 향상시키는 것을 목표로 합니다. Frame Warp 기술을 활용하여 Reflex 2는 시스템 지연 시간을 75% 줄여 전반적인 게임 플레이 경험을 향상시킵니다.

이 향상은 프레임 렌더링 전에 마우스 위치를 실시간으로 샘플링하여 반응성을 크게 최적화합니다. Reflex 2는 다양한 고성능 타이틀에서 기본적으로 지원되므로 모든 RTX GPU 사용자가 이 발전의 혜택을 누릴 수 있습니다.

RTX AI로 게임 혁신

NVIDIA의 Blackwell 아키텍처는 게임에서 AI 통합을 강조합니다. Microsoft와 협력하여 DirectX의 Neural Rendering 기능에 액세스함으로써 NVIDIA는 RTX 50 GPU에서 비교할 수 없는 성능을 발휘할 준비가 되었습니다. 혁신에는 Neural Shaders와 고급 소재 처리가 포함되어 기존 그래픽에서 AI 기반 그래픽으로의 획기적인 전환을 약속합니다.

NVIDIA는 Neural Radiance Cache(NRC) 및 RTX Mega Geometry와 같은 새로운 기술을 통해 빛이 장면의 객체와 상호 작용하는 방식을 재정의하여 게임 환경에서 비교할 수 없는 사실감과 상호 작용을 제공합니다. 캐릭터 렌더링을 위한 AI 강화 기능의 도입은 가상 세계에 생생한 디테일을 제공하려는 의지를 더욱 강조합니다.

게임의 미래는 Blackwell의 역량에 의해 향상되고 있으며, 신경 물질과 조명 최적화의 고급 응용 프로그램은 시각적 충실도와 효율성을 극적으로 높일 예정입니다. NVIDIA가 계속해서 앞서 나가면서 게임 커뮤니티는 그래픽 성능과 AI 통합의 전례 없는 발전을 기대할 수 있습니다.

출처 및 이미지

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다