NVIDIA, DGX AI PC용 GB10 슈퍼칩 세부 정보 공개: 3nm 기술, 20개 ARM v9.2 CPU 코어, 1000 TOPS NVFP4 Blackwell GPU, LPDDR5x-9400 메모리 지원, 140W TDP

NVIDIA, DGX AI PC용 GB10 슈퍼칩 세부 정보 공개: 3nm 기술, 20개 ARM v9.2 CPU 코어, 1000 TOPS NVFP4 Blackwell GPU, LPDDR5x-9400 메모리 지원, 140W TDP

NVIDIA는 최근 Blackwell GPU 아키텍처를 활용하여 최신 DGX AI Mini 슈퍼컴퓨터에 동력을 제공하는 최첨단 GB10 Superchip을 공개했습니다.

NVIDIA GB10 Superchip: 혁신적인 SoC 및 GPU 아키텍처

현재 주목을 받고 있는 것은 GB10 슈퍼칩을 탑재한 선구적인 시스템인 엔비디아 DGX 스파크입니다.이는 “AI PC” 시장에 중요한 진입을 알리는 신호탄입니다. DGX 스파크 발표 이후 수많은 기업들이 GB10 기술을 활용한 자체 AI PC 플랫폼을 구축하기 시작했습니다. Hot Chips 2025 컨퍼런스에서 엔비디아는 GB10 슈퍼칩에 대한 심층 분석을 통해 미니 개발자 스테이션과 워크스테이션을 위한 블랙웰 아키텍처를 효과적으로 확장하는 방법을 시연했습니다.

데이터 센터 통합을 갖춘 NVIDIA Blackwell GPU 아키텍처의 다이어그램입니다.

DGX Spark는 첨단 Blackwell 아키텍처를 기반으로 구축된 미니 AI 슈퍼컴퓨터로 구상되었습니다.

Blackwell 기술과 DGX Spark를 활용해 미니 AI 슈퍼컴퓨터를 구축하는 다이어그램.

DGX Spark Workstation의 주요 기능

DGX Spark Workstation에는 다음과 같은 몇 가지 뛰어난 기능이 통합되어 있습니다.

  • GB10 Grace Blackwell Superchip: AI, 데이터 과학, 컴퓨팅, 렌더링 및 시각화 작업에 최적화되었습니다.
  • 128GB 코히어런트 통합 시스템 메모리: 최대 2, 000억 개의 매개변수를 갖춘 대규모 AI 모델을 처리하고 최대 700억 개의 매개변수를 갖춘 모델을 미세 조정할 수 있습니다.
  • ConnectX-7 네트워킹: 두 개의 DGX Spark 시스템 간 상호 연결을 용이하게 하여 최대 4, 050억 개의 매개변수에 대한 모델 협업을 가능하게 합니다.
  • DGX Base OS 및 NVIDIA AI 소프트웨어 스택: 이를 통해 DGX Spark와 DGX Cloud 또는 가속화된 클라우드 인프라 간의 워크로드 전송이 원활하게 보장됩니다.
  • 다양한 배포 옵션: AI 워크스테이션이나 네트워크에 연결된 개인 AI 클라우드로 구성할 수 있습니다.
  • 향상된 사용자 경험: 다중 헤드 디스플레이와 다양한 연결 옵션을 지원합니다.
  • 컴팩트하고 에너지 효율적인 디자인: 모든 책상에 편안하게 맞으며 표준 벽면 콘센트로 작동합니다.
NVIDIA DGX Spark Workstation은 강력한 AI 기능과 컴팩트하고 효율적인 디자인을 갖추고 있습니다.

더 자세히 알아보기: GB10 Superchip 사양

GB10 슈퍼칩을 자세히 살펴보면, 시스템온칩(SoC)이 두 개의 다이렛으로 설계되었음을 알 수 있습니다. CPU와 메모리 서브시스템을 수용하는 S-다이렛과 GPU 코어를 담당하는 G-다이렛입니다.두 다이렛 모두 고급 2.5D 패키징 기술을 활용하며 TSMC의 최첨단 3nm 공정으로 제조됩니다.

NVIDIA GB10 Superchip: 20개 Arm 코어와 128GB 메모리를 포함한 AI 성능 사양.

CPU 아키텍처는 ARM v9.2 디자인을 기반으로 하며, 총 20개의 코어를 두 개의 클러스터로 구성합니다.각 코어는 전용 L2 캐시와 클러스터 간에 공유되는 32MB의 L3 캐시를 함께 사용합니다.

CPU, GPU, 메모리 세부 정보가 포함된 NVIDIA GB10 사양 시트입니다.

GB100 블랙웰 아키텍처를 활용하는 이 칩의 GPU 부분은 동일한 칩 패키지 내에 배치되어 통합 GPU(iGPU) 역할을 합니다. DLSS 4를 지원하는 5세대 텐서 코어와 RTX 레이 트레이싱 코어를 포함한 고급 기능을 자랑하며, AI 애플리케이션에 최적화된 FP32 연산 시 최대 31 TFLOP, NVFP4(FP4) 연산 시 최대 1000 TOPS의 뛰어난 연산 성능을 제공합니다.또한, GPU에는 성능 향상을 위해 24MB L2 캐시가 포함되어 있습니다.

메모리 성능 측면에서 NVIDIA GB10 Superchip은 256b LPDDR5x(통합 메모리 아키텍처)를 지원하며, 액세스 속도는 9, 400MT/s에 달하여 최대 301GB/s의 놀라운 원시 대역폭을 제공합니다.이러한 구성을 통해 최대 128GB의 메모리 용량을 구현할 수 있습니다.고성능 코히어런트 패브릭은 CHI-E 코히어런시 프로토콜에 맞춰져 있어 C2X 인터페이스를 통해 GPU에 600GB/s의 광범위한 시스템 대역폭을 제공합니다.

NVIDIA GB10 사양: 칩 그래픽을 포함한 디스플레이, 보안, TDP, OS 세부 정보.

또한 GB10은 CPU용 L4 캐시로 설계된 16MB 시스템 레벨 캐시를 탑재하여 여러 SoC 엔진 간의 전력 효율적인 데이터 공유를 지원합니다.고대역폭, 저전력 C2C 인터페이스는 NVIDIA의 NVLINK 기술을 활용합니다.

PCIe, USB, EoPCIe(Ethernet over PCIe)를 지원하는 강력한 연결 옵션을 제공합니다. DP Alt 모드를 사용하면 최대 4개의 디스플레이(DisplayPort 3개 + HDMI 1개)를 120Hz에서 최대 4K 해상도로 동시에 연결할 수 있으며, HDMI 2.1a를 사용하면 120Hz에서 8K 해상도까지 지원합니다.보안 또한 최우선으로 고려하여 듀얼 보안 루트(Dual Secure Root) 지원, SROOT 프로세서, OSROOT 프로세서, 그리고 fTPM 및 개별 TPM과의 호환성을 제공합니다.이 칩은 총 설계 전력(TDP)이 140W입니다.

다중 GPU 컴퓨팅 효율성을 위한 NVIDIA ConnectX를 활용한 GB10 확장성 다이어그램.

GB10 슈퍼칩의 확장성

GB10 슈퍼칩의 또 다른 주목할 만한 특징은 확장성입니다. NVIDIA의 ConnectX 기술을 통해 여러 개의 GB10 칩을 상호 연결하여 대규모 AI 모델 지원에 필수적인 향상된 처리량, 대역폭 및 DRAM 용량을 구현할 수 있습니다.각 ConnectX 네트워크 인터페이스 카드(NIC)는 PCIe Gen5 x8 인터페이스를 통해 GB10 SoC에 연결되며, 각 장치는 이더넷 프레임워크를 통해 통신합니다.

NVIDIA와 Mediatek의 협업 다이어그램, 효율성을 위해 CPU와 GPU 아키텍처를 병합했습니다.

엔비디아는 GB10 슈퍼칩 SoC를 미디어텍과의 성공적인 파트너십으로 설명하며, 미디어텍의 CPU IP를 활용했습니다.이 칩은 미디어텍 메모리 인프라 내에서 GPU 메모리 상호작용에 대한 상세한 성능 모델링을 거쳤습니다.

개발자를 위해 AI 및 GPU 성능을 최적화하는 디스플레이가 탑재된 NVIDIA DGX Spark 컴퓨터입니다.

GB10 슈퍼칩의 미래 전망

GB10 슈퍼칩의 가장 흥미로운 측면은 노트북이나 미니 PC와 같은 소비자 시장에도 출시될 수 있는 잠재력입니다.보도에 따르면, 곧 출시될 N1X와 N1 SoC는 최초의 소비자용 엔비디아 SoC가 될 가능성이 있으며, GB10은 이러한 칩이 제공할 수 있는 성능을 미리 엿볼 수 있는 기회를 제공합니다.

출처 및 이미지

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다