NVIDIA, Blackwell RTX 공개: MIG를 통해 Cyberpunk 2077의 4개 인스턴스를 실행하는 RTX PRO 6000으로 신경망 렌더링 및 게임 선보여

NVIDIA, Blackwell RTX 공개: MIG를 통해 Cyberpunk 2077의 4개 인스턴스를 실행하는 RTX PRO 6000으로 신경망 렌더링 및 게임 선보여

NVIDIA는 신경 렌더링과 게임 분야에서 최신 기술을 선보이며 기술 산업에 지속적으로 큰 영향을 미치고 있으며, 특히 RTX 5090과 RTX PRO 6000이 포함된 Blackwell RTX GPU 시리즈를 통해 그 영향력을 확대하고 있습니다.

NVIDIA, Hot Chips 2025에서 Blackwell RTX 혁신 기술 선보여

2023년 1월 출시된 Blackwell RTX 아키텍처는 인공지능(AI)에 중점을 둔 획기적인 기능들을 선보였습니다.이러한 혁신은 NVIDIA에게 새로운 시도가 아닙니다.2006년 CUDA 출시와 함께 시작된 이 여정은 가속 컴퓨팅과 AI 분야에서 괄목할 만한 발전을 이루었습니다.

2006년부터 2025년까지의 AI 개발 타임라인으로, NVIDIA의 주요 혁신과 성과를 강조하고 있습니다.

NVIDIA는 희소성(Sparsity), 새로운 명령어 집합 아키텍처(ISA), 그리고 최적화된 저정밀도 포맷과 같은 기술을 통해 컴퓨팅 밀도가 무어의 법칙 확장성을 넘어섰다고 주장합니다.2018년 실시간 레이 트레이싱 도입과 그 다음 해 DLSS 출시는 이러한 발전에 있어 중요한 이정표입니다.

성능 확장을 위한 GPU, CPU, 메모리 사양을 자세히 나타낸 NVIDIA Blackwell 아키텍처 다이어그램입니다.

이러한 혁신은 RT 코어와 Tensor 코어를 포함한 첨단 기술을 사용하여 달성되었으며, Blackwell은 이제 이러한 기능을 새로운 수준으로 확대했습니다.

AI와 렌더링 향상을 위한 Blackwell 아키텍처 도구를 갖춘 RTX 생태계 프레임워크입니다.

데이터 센터 분야에서 엔비디아는 FP4 정밀도를 도입하여 고밀도 확장이 필요한 워크로드에 4배 향상된 성능을 제공합니다.엔비디아 CEO 젠슨 황은 블랙웰 RTX를 통해 신경망 렌더링 시대의 도래를 촉진하며, 그래픽 분야에서 AI의 중추적인 역할을 재확인하고자 합니다. RTX 브랜드는 시뮬레이션, 콘텐츠 제작, 게임 분야의 혁신을 상징하며, 데이터 센터 기술을 소비자용 RTX GPU로 확장하는 길을 열었습니다.

신경 렌더링은 AI 비주얼, 매끄러운 반응성, 적응형 경험을 통해 향상된 게임 경험을 약속합니다.

그렇다면 블랙웰 아키텍처는 어떤 역할을 할까요? DLSS 4, MFG, ACE, 그리고 향상된 경로 추적과 같은 향상된 기능을 자랑하며, 이는 모두 성능 가속화와 시각적 충실도 향상을 위해 설계되었습니다.엔비디아는 블랙웰 RTX가 “성능, 점유 공간, 그리고 설계 주기를 10배 향상”시킬 수 있다고 주장합니다. DLSS 4는 AI를 전략적으로 사용하여 초기 프레임 이후 픽셀의 100%를 렌더링하여 궁극적으로 모바일 기기의 렌더링 시간을 단축하고 배터리 수명을 연장합니다.

RTX Blackwell 칩은 다음과 같은 설계 원칙을 따릅니다: 신경 작업 부하 최적화, 메모리 감소, 효율성.

RTX Blackwell GPU의 주요 설계 원칙은 다음과 같습니다.

  • 새로운 신경 워크로드에 대한 최적화
  • 메모리 공간 최소화
  • 신경망 및 그래픽 작업에 대한 고품질 서비스 보장
  • 확장 가능한 에너지 효율성
AI, 텐서 코어, G7 메모리, 고급 렌더링 아키텍처를 갖춘 NVIDIA RTX Blackwell 칩.

기술적인 측면에서 RTX Blackwell은 5세대 텐서 코어를 기반으로 4, 000 TOPS(초당 AI 테라 연산) 및 고속 FP4 지원을 제공하는 강력한 엔지니어링 솔루션입니다.4세대 RT 코어를 통해 메가 지오메트리를 목표로 최대 360 RT TFLOP의 성능을 제공하며, AI 관리 프로세스(AMP)는 그래픽 처리와 함께 AI 모델을 효과적으로 관리합니다.

셰이더와 텐서 코어를 특징으로 하는 신경 셰이더를 위한 RTX Blackwell SM 아키텍처의 다이어그램입니다.

RTX Blackwell 스트리밍 멀티프로세서(SM)의 아키텍처는 데이터센터용 아키텍처와 크게 다릅니다.주목할 만한 개선 사항 중 하나는 이전에는 분리되어 있던 FP32와 INT32 유닛을 통합하여 처리 효율을 향상시킨 것입니다.

RTX Blackwell SM이 신경 셰이더와 코어를 사용하여 셰이더 실행 재정렬을 2배 향상시키는 것을 보여주는 다이어그램입니다.

또한 RTX Blackwell은 셰이더 실행 재정렬(SER)을 향상시켜 셰이더 실행의 효율성을 두 배로 높였습니다.

FP4를 탑재한 5세대 블랙웰 텐서 코어는 이전 세대에 비해 처리량이 크게 향상되었습니다.

5세대 텐서 코어는 FP4를 지원하고 DLSS 4에 MFG 모드를 포함하여 GPU가 AI를 사용하여 4개의 프레임을 동시에 렌더링할 수 있도록 합니다.

DLSS4 + RTX Blackwell은 더 빠르고 효율적인 프레임 렌더링과 GPU 전력 절감으로 게임 성능을 향상시킵니다.

결과적으로, 프레임 생성과 함께 DLSS 4를 활용하면 코어 레일 게이팅 속도가 10배 향상되고 DRAM 자체 리프레시 속도가 100배 빨라져 개별 프레임 렌더링 시간이 크게 단축됩니다.모바일 플랫폼에서는 GPU 전력 소비를 최대 2배까지 줄여 배터리 수명을 크게 향상시킬 수 있습니다.

GDDR7 대 GDDR6x: 새로운 그래픽 DRAM 표준으로 향상된 데이터 전송 속도와 효율성.

GDDR7의 도입으로 RTX Blackwell은 최대 30Gbps의 속도를 달성하여 이전 세대 GDDR6보다 데이터 전송 속도를 두 배로 향상시켰습니다.이 새로운 메모리 표준은 모바일 플랫폼의 효율성을 더욱 향상시킵니다.

NVIDIA의 AMP 장치 덕분에 AI와 그래픽 워크로드를 동시에 실행하는 것이 현실이 되었고, 더 원활한 프레임 전달과 더 빠른 모델 응답이 가능해졌습니다.

Universal MIG 및 GPU 인스턴스 최적화 세부 정보를 표시하는 RTX PRO 6000 개요입니다.

NVIDIA는 게임 애플리케이션에서 전문가용 애플리케이션으로 전환하면서 RTX PRO 6000에 Universal MIG와 같은 새로운 기능을 탑재하고 있습니다.이를 통해 각각 24GB VRAM이 장착된 최대 4개의 RTX PRO GPU 인스턴스가 일관된 지연 시간과 처리량으로 동시에 작동할 수 있습니다.

인상적인 시연에서는 최대 설정에서 1080p로 Cyberpunk 2077의 4개 인스턴스를 실행하여 RTX PRO 6000의 성능을 보여주었습니다.이는 강력한 GPU로는 감당할 수 있는 작업이었습니다.

RTX PRO 6000 멀티 테넌트 스케일링 막대 차트, 1080p에서 실행되는 Cyberpunk 2077 성능 지표.

표준 시간 분할 인스턴스를 기준으로 MIG 2x 및 4x 모드와 비교했을 때 확장성이 60%나 향상되었습니다. RTX PRO 6000 Blackwell GPU는 Cyberpunk 2077과 같은 고사양 애플리케이션의 여러 인스턴스를 관리하는 데 매우 적합합니다.

이미지 샘플을 통해 Blackwell FP4 성능과 VRAM 사용량을 비교한 그래프입니다.

전반적으로 NVIDIA의 Blackwell GPU 아키텍처는 출시 이후 꾸준히 발전해 왔으며, 소비자 및 전문가용 애플리케이션 모두에서 꾸준히 발전해 왔습니다.더 많은 게임과 콘텐츠 제작 도구가 Blackwell이 제공하는 광범위한 AI 및 신경망 향상 기능을 통합함에 따라, 이 분야의 향후 발전에 대한 기대감은 더욱 커지고 있습니다.

출처 및 이미지

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다