화웨이의 Ascend 910C AI 칩 클러스터 “CloudMatrix”는 NVIDIA의 “Blackwell” GB200 NVL72 시스템을 능가합니다. 중국의 AI 하드웨어가 미국을 상대로 발전하고 있습니다.

화웨이의 Ascend 910C AI 칩 클러스터 “CloudMatrix”는 NVIDIA의 “Blackwell” GB200 NVL72 시스템을 능가합니다. 중국의 AI 하드웨어가 미국을 상대로 발전하고 있습니다.

Huawei의 Ascend 910C AI 칩이 시장 진출을 앞두고 있으며, NVIDIA와의 경쟁 구도가 더욱 치열해질 것으로 알려졌습니다.

Huawei의 Ascend 910C 칩: 높은 전력 요구로 NVIDIA의 GB200을 능가하는 것을 목표로 함

AI 분야에서 영향력을 되찾기 위한 과감한 행보의 일환으로, 화웨이는 차세대 Ascend AI 칩을 선보이며 서구 기술 대기업들의 지배력에 도전할 것으로 예상됩니다.SemiAnalysis 의 보고서에 따르면, Ascend 910C 칩을 탑재한 인상적인 CloudMatrix 384 AI 클러스터로 구동될 화웨이의 첨단 랙 스케일 아키텍처에 대한 통찰력 있는 세부 정보가 공개되었습니다.이러한 발전은 중국이 고성능 컴퓨팅 기술 분야에서 점차 자립하고 있음을 시사합니다.

이미지 출처: SemiAnalysis

CloudMatrix 384(CM384) AI 클러스터는 “all-to-all 토폴로지”로 배열된 384개의 Ascend 910C 칩 구성을 자랑합니다.특히 Huawei는 NVIDIA의 GB200보다 5배 더 많은 칩을 탑재하여 구조적 한계를 극복했습니다.이는 Huawei가 전력 효율성이나 비용 효율성보다 성능 지표를 우선시하는 전략적 결정을 시사하는데, Huawei의 주된 목표는 NVIDIA의 역량을 압도하는 것입니다. CM384는 300PetaFLOPS의 BF16 컴퓨팅 성능을 달성할 것으로 예상되며, 이는 NVIDIA의 GB200 NVL72보다 거의 두 배에 달하는 성능입니다.또한, 향상된 고대역폭 메모리(HBM) 용량을 통해 놀라운 연산 성능을 제공할 것으로 기대됩니다.

견고한 가정용 컴퓨팅 대안으로 설계된 화웨이의 랙 솔루션은 중국의 첨단 기술 자립에 대한 야심에 완벽하게 부합합니다.그러나 한 가지 중요한 단점은 CM384의 예상 전력 소비량인데, 이는 GB200 NVL72보다 3.9배 높을 것으로 예상됩니다.이로 인해 다양한 AI 워크로드에서 와트당 성능 지표가 현저히 낮아집니다.그럼에도 불구하고, 이러한 전력 수요는 집중적인 AI 클러스터를 지원할 수 있는 충분한 발전 역량을 보유한 중국에게는 그다지 큰 문제가 되지 않습니다.

Huawei, 중국 국내 AI 시장에서 NVIDIA H100에 대응하기 위해 Ascend 910C 준비 1

CM384의 아키텍처는 중국 시장에 맞춰 특별히 설계되었으며, 이는 화웨이의 Ascend 910C AI 칩이 잠재적인 가격 및 전력 제약에도 불구하고 성공할 것임을 시사합니다.가장 중요한 우려 사항은 화웨이와 TSMC, 삼성 등 글로벌 기업들을 포함한 협력사들이 국내 기업뿐 아니라 AI 클러스터의 생산량을 얼마나 늘릴 것인가입니다.

한편, 엔비디아는 이전 미국 행정부의 제약 하에서 중국 시장에서의 입지를 유지하는 데 점점 더 어려움을 겪고 있습니다.국내 기업들과의 경쟁이 치열해짐에 따라, 화웨이가 이 치열한 경쟁에서 엔비디아와 대등한 위치를 유지하는 가운데, 엔비디아는 경쟁력을 유지하기 위해 대안 전략을 모색해야 합니다.

출처 및 이미지

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다