NVIDIA Blackwell GPU, 탁월한 AI 추론 성능으로 압도적 우세: GB200 칩으로 최대 78%의 이익률 달성, 탁월한 소프트웨어 최적화 덕분에 AMD보다 우세

NVIDIA의 Blackwell GPU는 AI 추론 성능의 최전선에 자리 잡았으며, 이 기술을 활용하는 기업은 경쟁사에 비해 훨씬 높은 수익 마진을 얻을 수 있습니다.

NVIDIA의 포괄적인 AI 소프트웨어 및 최적화: AMD에 대한 경쟁 우위

모건 스탠리 리서치 의 최근 분석은 다양한 기술 제공업체의 AI 추론 워크로드와 관련된 이익률과 운영 비용을 면밀히 비교합니다.분석 결과에 따르면 AI 추론 “팩토리”로 기능하는 기업들은 50%를 넘는 이익률을 기록하고 있으며, NVIDIA가 단연 선두를 달리고 있습니다.

NVIDIA Blackwell GPU는 업계 최고의 AI 추론 성능으로 경쟁사를 압도합니다. GB200 칩을 사용하면 소프트웨어 최적화로 인해 최대 78%의 이익 마진을 달성하며 AMD보다 훨씬 앞서 나갑니다.1

이 연구는 NVIDIA, Google, AMD, AWS, Huawei 등 주요 업계 기업의 서버 랙을 활용하여 100MW의 전력을 필요로 하는 다양한 AI 팩토리를 평가했습니다.그중에서도 NVIDIA의 GB200 NVL72 “Blackwell” GPU 플랫폼은 77.6%의 높은 이익률과 약 35억 달러의 예상 수익을 달성하며 두각을 나타냈습니다.

구글의 TPU v6e pod가 74.9%의 이익률로 그 뒤를 바짝 쫓고 있으며, AWS의 Trn2 Ultraserver는 62.5%의 이익률로 3위를 차지했습니다.다른 솔루션들의 이익률은 40~50% 수준인 것으로 알려졌지만, AMD는 성능 지표에서 알 수 있듯이 앞으로 상당한 성장 잠재력을 가지고 있습니다.

GPU 매출 및 임대료 비교: NVIDIA, Google TPU, AMD, Huawei, AWS. Morgan Stanley 자료.

극명한 대조적으로, AMD는 최신 MI355X 플랫폼으로 전환하면서 28.2%라는 심각한 마이너스 마진을 기록했습니다.이전 모델인 MI300X는 AI 추론 성능 측면에서 무려 64.0%라는 엄청난 마이너스 마진을 기록하며 더욱 심각한 실적을 보였습니다.모건 스탠리 보고서는 칩당 시간당 매출 창출액을 분석했는데, 엔비디아의 GB200은 시간당 7.5달러, HGX H200은 3.7달러를 기록했습니다. AMD의 MI355X는 시간당 1.7달러에 그치는 반면, 대부분의 경쟁사들은 0.5달러에서 2달러 사이의 수익을 기록하며 엔비디아가 이 분야에서 우위를 점하고 있음을 보여줍니다.

NVIDIA, Google, AMD, AWS, HUAWEI의 AI 프로세서에 대한 수익 및 이익 추정치를 보여주는 막대형 차트입니다.

NVIDIA가 AI 추론 분야에서 상당한 우위를 점하는 것은 주로 FP4 지원과 CUDA AI 스택의 지속적인 개선 덕분입니다. NVIDIA는 Hopper와 Blackwell을 포함한 여러 초기 GPU 모델을 마치 고급 와인처럼 효과적으로 관리하여 매 분기마다 성능을 점진적으로 향상시켜 왔습니다.

AMD의 MI300 및 MI350 플랫폼은 하드웨어 성능 면에서는 뛰어나지만, 회사는 여전히 AI 추론을 위한 소프트웨어 최적화라는 과제에 직면해 있으며, 이 분야의 개선이 절실히 필요합니다.

다양한 플랫폼에 대한 AI 공장 비용 비교 차트.여기서 GB200 NVL72가 가장 높은 비용으로 나타났습니다.

특히 모건 스탠리는 AMD MI300X 플랫폼의 총소유비용(TCO)이 최대 7억 4, 400만 달러에 달한다고 강조했는데, 이는 엔비디아 GB200 플랫폼의 약 8억 달러와 비슷한 수준입니다.이는 AMD의 비용 구조가 경쟁 환경에서 유리하지 않을 수 있음을 시사합니다.신형 MI355X 서버의 예상 TCO는 5억 8, 800만 달러로 화웨이의 클라우드매트릭스 384와 유사하지만, 높은 초기 투자 비용은 잠재 사용자들이 AMD를 선택하지 않도록 만들 수 있습니다.특히 향후 몇 년 동안 AI 시장의 85%를 점유할 것으로 예상되는 엔비디아의 탁월한 AI 추론 성능을 고려할 때 더욱 그렇습니다.

엔비디아와 AMD 모두 서로의 경쟁에 발맞추기 위해 노력하고 있는 가운데, 엔비디아는 올해 블랙웰 울트라(Blackwell Ultra) GPU를 출시할 예정이며, 기존 GB200 모델 대비 50% 향상된 성능을 약속합니다.이어서 루빈(Rubin) 플랫폼이 2026년 상반기에 생산될 예정이며, 루빈 울트라(Rubin Ultra)와 파인만(Feynman) 플랫폼도 함께 출시될 예정입니다.한편, AMD는 루빈과 경쟁하기 위해 내년에 MI400을 출시할 계획이며, MI400 제품군에 여러 AI 추론 최적화를 적용할 것으로 예상되어 AI 분야에서 흥미진진한 경쟁이 펼쳐질 것으로 예상됩니다.

뉴스 출처: WallStreetCN, Jukanlosreve

출처 및 이미지