
NVIDIA는 랙 스케일 클러스터 구성에서 활용될 때 뛰어난 추론 기능을 제공하도록 설계된 Rubin CPX AI 칩이라는 획기적인 AI GPU 시리즈를 출시하면서 화제를 모았습니다.
NVIDIA의 Rubin CPX GPU: 랙 스케일 AI 성능의 새로운 벤치마크
컴퓨팅 발전에서 AI 추론의 중요성이 점차 커지고 있음을 인지한 엔비디아는 ‘CFX’ 라인업으로 새로운 여정을 시작했습니다.첫 제품인 루빈(Rubin) 시리즈는 AI 인프라 서밋(AI Infra Summit) 에서 공개되었습니다.주로 장기 컨텍스트 AI 애플리케이션을 위한 루빈 CPX GPU는 기존 루빈 GPU와 베라(Vera) CPU를 보완할 예정이며, 엔비디아는 이를 AI 추론 효율성의 “혁명”이라고 설명합니다.
Rubin CPX는 30페타플롭스의 NVFP4 컴퓨팅 성능과 128GB의 최첨단 GDDR7 메모리를 포함한 인상적인 사양을 자랑합니다.이 제품은 특별히 설계된 NVIDIA Vera Rubin NVL144 CPX 랙에 통합될 예정이며, 이 랙에는 144개의 Rubin CPX GPU, 144개의 Rubin GPU, 그리고 36개의 Vera CPU가 탑재되어 총 8엑사플롭스의 NVFP4 컴퓨팅 성능을 달성합니다.이는 Blackwell Ultra 시스템보다 7.5배 향상된 성능이며, Spectrum-X 이더넷과 같은 혁신 기술을 통해 향상된 성능으로 백만 토큰 규모의 컨텍스트 AI 추론 워크로드를 처리할 수 있도록 설계되었습니다.

이 플랫폼은 “30배에서 50배에 달하는 놀라운 투자 수익률”을 제공할 것으로 예상되며, Vera Rubin NVL144 CPX 랙은 차세대 생성형 AI 애플리케이션 개발의 현재 한계를 극복하는 데 필수적인 도구로 자리매김할 것입니다. Rubin CPX는 더 다양한 구성으로 출시될 것으로 예상되지만, 구체적인 사양은 아직 공개되지 않았습니다.그러나 HBM 대신 GDDR7 메모리를 탑재한 것은 많은 사용자에게 더욱 비용 효율적인 솔루션을 제시합니다.
엔비디아는 AI 환경의 복잡성을 능숙하게 헤쳐나가며 경쟁사가 우위를 점할 가능성을 최소화하고 있습니다.내년에 출시될 차세대 루빈 AI 라인업은 컴퓨팅 역량을 전례 없는 수준으로 끌어올릴 것으로 기대됩니다.
답글 남기기