
免责声明:本文不构成投资建议。作者不持有本文提及的任何股票。
DeepSeek 的 R1 AI 模型的首次亮相引发了美国和欧洲技术格局的变革。这些地区长期以来一直习惯于由于美国严格的出口管制限制中国获取先进半导体技术而产生的安全感,但现在却面临着重大挑战。中国正战略性地利用这一机会,承诺投入大量资金,以加速其蓬勃发展的 AI 行业。
Deepseek R1 是 AI 的 Sputnik 时刻。
— Marc Andreessen 🇺🇸(@pmarca)2025 年 1 月 26 日
DeepSeek 的开源 R1 模型通常被称为“人工智能的斯普特尼克时刻”,它已经引起了轰动,因为它不仅匹敌而且经常超越 OpenAI 的 o1 等知名人工智能模型的性能。这一发展代表着人工智能研究和实施的关键时刻。
首先,DeepSeek 团队非常出色,自他们的第一个模型以来,他们一直在做出绝对出色的工作,尤其是在效率方面。MLA 允许从 KV 缓存中获得约 10 倍的内存效率。他们在 8 位专家的帮助下获得了高效的 MoE,并且近乎完美……
– Armen Aghajanyan (@ArmenAgha) 2025 年 1 月 26 日
令人瞩目的是,DeepSeek 的产品以其效率而著称,其培训成本仅为西方公司同类模型的 1/50。再加上 R1 的开源特性,它为开发人员和用户创造了一个极具吸引力的方案。
这家伙在这个 Deep Copendemonium 中提出了第一个技术论点。赞!> 你对每个人都不利;不管是 50k H100、30k 还是 10k。不管是什么,肯定不是仅仅用 2k H800 来换取 500 万美元的培训。我的数学计算得出 MFU 为 22.4% https://t.co/HD3iNLFxbA pic.twitter.com/TeZexTHyby
DeepSeek 声称其 R1 模型仅使用 2000 个 H800 GPU 进行训练。然而,来自多位技术专家的分析表明,实际训练集群可能要大得多。尽管如此,围绕 DeepSeek 成本效率的担忧仍然非常严重,尤其是考虑到该公司对类似高级资源的收费仅为 OpenAI 通常收费的 3%。
中国对人工智能投资的承诺
随着美国科技巨头们努力应对 DeepSeek 胜利带来的不确定性,这种情况变得更加复杂。无一例外,NVIDIA 等公司的股价都大幅下跌——例如,NVIDIA 在盘前交易中下跌了 13%。与此形成鲜明对比的是,中国将向人工智能领域 投资1 万亿元人民币:
“中国银行计划未来5年向人工智能全产业链各类主体提供总规模不低于1万亿元的专项综合金融支持……”
该项融资旨在增强中国在人工智能技术领域的自主能力,改善与人工智能相关的基础设施能力(如数据中心),并促进整个领域的创新。
与此同时,美国公布了雄心勃勃的“星际之门”计划,计划未来四年至少投资 5000 亿美元来加强自身的人工智能基础设施。
您是否认为 DeepSeek 的 R1 模型标志着 AI 行业的一次重大转变?欢迎在下方评论区发表您的观点。
发表回复