NVIDIA의 차기 Blackwell AI 서버는 회사가 과열 및 설계상의 구조적 결함과 관련된 문제를 해결하고자 고심하면서 심각한 공급망 문제에 직면하고 있다는 보도가 나왔습니다.
Blackwell AI 서버 배송 지연으로 고객들이 ‘Hopper’ 시리즈로 전환
NVIDIA의 Blackwell AI 서버 출시가 예상대로 진행되지 않아 Team Green이 현재 상당한 난관에 직면해 있음을 시사합니다. 원래 2024년 4분기에 양산을 시작할 예정이었지만, 새로운 AI 아키텍처는 과열 문제를 야기한 설계 결함으로 어려움을 겪고 있는 것으로 보입니다. NVIDIA는 이전에 이러한 문제가 해결되었다고 주장했지만, The Information 의 조사 보고서는 그렇지 않다고 지적하며 Blackwell AI 서버에 “글리치”가 발생했다고 특징지었습니다.
이 보고서는 NVIDIA의 GB200 AI 서버의 초기 대량 출하가 과열 및 오류 문제로 어려움을 겪었으며, 이는 주로 “칩 연결성” 문제에서 비롯되었다고 강조합니다. 이러한 문제는 Microsoft, Amazon, Google, Meta를 포함한 주요 고객들 사이에서 우려를 불러일으켰고, 이러한 회사들이 이전에 100억 달러가 넘는 계약을 체결했음에도 불구하고 Blackwell 서버에 대한 주문이 감소했습니다.
새로운 상황은 NVIDIA에 매우 중요하며 공급망 중단이 심각한 재정적 영향을 미칠 수 있기 때문에 AI 부문의 수익성에 잠재적 위협이 됩니다. 문제의 정확한 본질을 둘러싼 세부 사항은 불분명하지만 이전의 통찰력에 따르면 TSMC의 고급 패키징 기술인 CoWoS가 앞서 언급한 칩 연결 문제의 중심에 있습니다. NVIDIA는 TSMC에서 생산된 Blackwell GPU 마스크에 대한 수정 사항을 발표했지만 이러한 변경 사항은 아직 만족스러운 결과를 내지 못했습니다.
결과적으로 많은 고객이 Blackwell의 잔여 문제에 대한 해결책을 기다리는 동안 NVIDIA의 기존 Hopper 세대가 제공하는 것과 같은 보다 안정적인 대안으로 돌아가고 있습니다. 현재로서는 NVIDIA의 재무 실적에 미치는 영향의 범위가 불확실합니다. 그러나 적시에 해결책이 없다면 Blackwell 아키텍처의 미래 성공은 위태로워질 수 있으며, 이는 NVIDIA가 앞으로 나아가는 데 더 많은 문제를 초래할 수 있습니다.
답글 남기기