
关于 DeepSeek R1 模型的训练费用的争论不断展开,引发了巨大的市场波动,揭露了之前未被发现的一层欺骗。实际的财务影响确实比最初声称的更为惊人。
关于 DeepSeek 培训费用超过报道的“500 万美元”的修订见解
SemiAnalysis的一项综合研究挑战了流行的说法,即 DeepSeek 的 R1 模型极大地优化了效率,从而减少了对 NVIDIA 等强大计算资源的需求。最初,行业分析师报告称,DeepSeek 的 R1 模型费用仅为“500 万美元”——这一数字与 OpenAI 的 GPT 模型的成本相当。这一消息在散户投资者中引发了一波恐慌,对美国股市产生了不利影响。然而,随着更多信息浮出水面,有必要对所涉及的真实成本进行更深入的研究。
从更直观的角度来看,DeepSeek 最初是中国对冲基金 High-Flyer 的子公司。根据 SemiAnalysis 的数据,早在 2021 年,DeepSeek 在实施严格的出口管制之前就收购了 10, 000 台 NVIDIA 的 A100 GPU。在母公司决定分拆该项目后,DeepSeek 迅速扩大了业务范围,大大提高了其计算能力。

研究结果表明,DeepSeek 配备了约 10, 000 个“中国专用”的 H800 AI GPU,以及 10, 000 个尖端的 H100 AI 芯片。此外,该组织还投资了 NVIDIA 的 H20 AI 加速器,从而为 DeepSeek 和 High-Flyer 的企业创建了一个庞大的“资源池”,用于交易、研究、培训和推理等活动。据估计,DeepSeek 的资本支出总计约为 16 亿美元,据传运营费用将达到约 9.44 亿美元——这个数字比之前的市场计算高出 400 倍。

值得注意的是,初始成本估算可能仅占运行 R1 模型所需的总培训成本的一小部分。值得注意的是,DeepSeek 通过在知名大学举办招聘活动展示了吸引本地人才的能力,入选员工的薪水超过 130 万美元。这一策略使 DeepSeek 的开发团队能够设计出具有竞争力的解决方案,能够与 OpenAI 等行业巨头相媲美。不幸的是,误报的财务数据为上周所谓的市场黑天鹅事件提供了推动力。
SemiAnalysis 对 DeepSeek 的 AI 模型进行了广泛的评估;鼓励读者探索这些发现以获得进一步的见解和复杂的细节。
发表回复