DeepSeek 误导人工智能市场：实际培训成本比报道高出 400 倍

关于 DeepSeek R1 模型的训练费用的争论不断展开，引发了巨大的市场波动，揭露了之前未被发现的一层欺骗。实际的财务影响确实比最初声称的更为惊人。

关于 DeepSeek 培训费用超过报道的“500 万美元”的修订见解

SemiAnalysis的一项综合研究挑战了流行的说法，即 DeepSeek 的 R1 模型极大地优化了效率，从而减少了对 NVIDIA 等强大计算资源的需求。最初，行业分析师报告称，DeepSeek 的 R1 模型费用仅为“500 万美元”——这一数字与 OpenAI 的 GPT 模型的成本相当。这一消息在散户投资者中引发了一波恐慌，对美国股市产生了不利影响。然而，随着更多信息浮出水面，有必要对所涉及的真实成本进行更深入的研究。

从更直观的角度来看，DeepSeek 最初是中国对冲基金 High-Flyer 的子公司。根据 SemiAnalysis 的数据，早在 2021 年，DeepSeek 在实施严格的出口管制之前就收购了 10, 000 台 NVIDIA 的 A100 GPU。在母公司决定分拆该项目后，DeepSeek 迅速扩大了业务范围，大大提高了其计算能力。

研究结果表明，DeepSeek 配备了约 10, 000 个“中国专用”的 H800 AI GPU，以及 10, 000 个尖端的 H100 AI 芯片。此外，该组织还投资了 NVIDIA 的 H20 AI 加速器，从而为 DeepSeek 和 High-Flyer 的企业创建了一个庞大的“资源池”，用于交易、研究、培训和推理等活动。据估计，DeepSeek 的资本支出总计约为 16 亿美元，据传运营费用将达到约 9.44 亿美元——这个数字比之前的市场计算高出 400 倍。

值得注意的是，初始成本估算可能仅占运行 R1 模型所需的总培训成本的一小部分。值得注意的是，DeepSeek 通过在知名大学举办招聘活动展示了吸引本地人才的能力，入选员工的薪水超过 130 万美元。这一策略使 DeepSeek 的开发团队能够设计出具有竞争力的解决方案，能够与 OpenAI 等行业巨头相媲美。不幸的是，误报的财务数据为上周所谓的市场黑天鹅事件提供了推动力。

SemiAnalysis 对 DeepSeek 的 AI 模型进行了广泛的评估；鼓励读者探索这些发现以获得进一步的见解和复杂的细节。

来源和图片