DeepSeek, AI 시장을 오도하다: 실제 훈련 비용은 보고된 것보다 400배 더 높다

DeepSeek의 R1 모델과 관련된 훈련 비용에 대한 논쟁이 전개되면서 상당한 시장 변동성이 발생하여 이전에는 인식되지 않았던 속임수의 층이 드러났습니다.실제 재정적 영향은 처음에 주장했던 것보다 실제로 더 놀랍습니다.

DeepSeek의 교육 비용이 보고된 “500만 달러”를 넘어선 것에 대한 개정된 통찰력

SemiAnalysis 의 포괄적인 연구는 DeepSeek의 R1 모델이 효율성을 극적으로 최적화하여 NVIDIA가 제공하는 것과 같은 강력한 컴퓨팅 리소스에 대한 필요성을 줄였다는 일반적인 이야기에 도전했습니다.처음에 업계 분석가들은 DeepSeek의 R1 모델 비용이 OpenAI의 GPT 모델과 관련된 비용과 비슷한 수치인 “500만 달러”에 불과하다고 보고했습니다.이 폭로는 소매 투자자들 사이에 공황의 물결을 일으켜 미국 주식 시장에 부정적인 영향을 미쳤습니다.그러나 더 많은 정보가 표면화됨에 따라 관련된 실제 비용에 대한 심층적인 조사가 필요합니다.

상황을 좀 더 구체적으로 설명하자면, DeepSeek은 중국 헤지펀드 High-Flyer의 자회사로 시작했습니다. SemiAnalysis에 따르면, DeepSeek은 2021년에 엄격한 수출 통제가 시행되기 전에 NVIDIA의 A100 GPU 10, 000대를 인수했습니다.모회사가 프로젝트를 분사하기로 결정한 후, DeepSeek은 빠르게 운영을 확장하여 컴퓨팅 역량을 크게 높였습니다.

DeepSeek 하드웨어 비용 분석 — 이미지 출처: SemiAnalysis

조사 결과에 따르면 DeepSeek에는 약 10, 000개의 “중국 전용” H800 AI GPU와 10, 000개의 최첨단 H100 AI 칩이 장착되어 있습니다.또한 이 조직은 NVIDIA의 H20 AI 가속기에 투자하여 DeepSeek과 High-Flyer의 벤처가 거래, 연구, 교육 및 추론을 포함한 활동을 위해 공유하는 상당한 “풀”을 만들었습니다.누적적으로 DeepSeek의 CapEx는 약 16억 달러로 추산되며 운영 비용은 약 9억 4, 400만 달러에 달할 것으로 소문났습니다.이는 이전 시장 계산보다 최대 400배 더 높은 수치입니다.

초기 비용 추정치는 R1 모델을 실행하는 데 관련된 총 교육 비용의 일부에 불과할 가능성이 높다는 점에 유의하는 것이 중요합니다.놀랍게도 DeepSeek은 명문 대학에서 채용 행사를 개최하여 현지 인재를 유치하는 소질을 보였고, 선정된 직원은 130만 달러가 넘는 급여를 받았습니다.이 전략을 통해 DeepSeek의 개발 팀은 OpenAI와 같은 업계 거물과 맞설 수 있는 경쟁력 있는 솔루션을 설계할 수 있었습니다.안타깝게도 잘못 보고된 재무 수치는 지난주 시장에서 소위 블랙 스완 사건의 원동력이 되었습니다.

SemiAnalysis는 DeepSeek의 AI 모델에 대한 광범위한 평가를 실시했습니다.독자들은 추가적인 통찰력과 복잡한 세부 사항을 알아보기 위해 이러한 결과를 탐색해 보는 것이 좋습니다.

출처 및 이미지