
本文并非投资建议。作者不持有本文提及的股票。
xAI 推出 Grok 3 LLM:改变游戏规则还是炒作过度?
令人兴奋的是,xAI 在周一的直播中发布了 Grok 3 语言模型 (LLM),主持人正是埃隆·马斯克。这家人工智能公司将 Grok 3 标榜为人工智能领域无与伦比的进步;然而,一些行业专家对其宣传的基准表示怀疑,指出其存在明显缺陷。
grok 3 是世界上最聪明的人工智能
现已向所有 Premium+ 订阅者开放
— Grok (@grok) 2025 年 2 月 18 日
根据 xAI 的一篇文章,Grok 3 模型被吹捧为“世界上最智能的人工智能”,引起了各个领域的好奇。
GROK 3:解决物理、游戏和宇宙问题
xAI 最新模型的完整介绍和演示
0:00 xAI 的使命:了解宇宙 1:20 团队介绍 2:01 Grok 意味着深刻理解 2:29 从 Grok 2 到 Grok 3 6:30 Grok 3 基准测试 9:07 Grok 3 改进…… https://t.co/7qbB6O16Yb pic.twitter.com/BomGwAOa1I
— Mario Nawfal (@MarioNawfal) 2025 年 2 月 18 日
完整的演示视频可在上述链接的帖子中找到。此外,继被称为“DeepSeek 效应”之后,马斯克宣布早期版本 Grok 2 将很快开源,从而为该技术的发展提供更多见解。
xAI 的新“Grok 3”模型(昨晚发布)在数学、科学和编码基准测试中击败了所有其他公开发布的基础模型(包括 DeepSeek-V3 和 GPT-4o)。pic.twitter.com/ iB6KuDPsdc
— Stock Talk (@stocktalkweekly) 2025 年 2 月 18 日
xAI 一直积极宣称 Grok 3 超越了所有其他公开的基础模型,例如 DeepSeek-V3 和 GPT-4o,特别是在数学、科学和编程等领域。法学硕士甚至在 Arena 基准测试中取得了令人印象深刻的1, 402分。
xAI 超出预期
看来 Grok 3 是世界上最强大的人工智能pic.twitter.com/OtO6rGD22e
— Manifold (@ManifoldMarkets) 2025 年 2 月 18 日
与此同时,在投机投资领域,Manifold Markets 上关于 Grok 3 被评为最强大人工智能的押注合约正倾向于“是”的结论。然而,我们观察到,可能性从周一晚间的 91% 显著下降到目前的 78%。
看来,尽管对 Grok 3 的批评性评论有限,但可能会影响这些下降的可能性。
我的意思是……你需要推理模型来回答这类问题
— Bao Bui (@vqbaobui) 2025 年 2 月 18 日
例如,DeepSeek 前员工 Zihan Wang 向 Grok 3 提出了一个物理问题,他展示了一幅图像:两个不同大小的铁球悬挂在比萨斜塔的不同高度,问哪个会先落地。预期的合理答案是较重的球,但 Grok 3 错误地表示两个球会同时落地。
你可以区分影响者和普通人。甚至@Teknium1也在亲吻戒指。他们没有谈论 FrontierMath、Arc-AGI 或 HLE,却将其宣传为“最智能的模型”,这是有原因的。我的初步测试与@karpathy 的感觉相同:接近 o1-pro,但与 o3-mini 相差甚远。
— relletreknit (@relletreknit) 2025 年 2 月 18 日
此外,越来越多的人质疑 xAI 决定不发布 Grok 3 在 FrontierMath、Arc-AGI 或 HLE 等既定基准上的性能指标。
值得注意的是,这些批评并非旨在贬低 Grok 3 的潜力,Grok 3 无疑是一个强大的 AI 模型。相反,它们提出了一个重要的问题,即 xAI 声称其优越性的真实性。
金融发展和未来前景
在另一个同样重要的发展中,彭博社最近报道称,xAI 正在寻求高达 100 亿美元的新融资,可能使其估值飙升至 750 亿美元。此前,这家初创公司在一轮融资中获得了 60 亿美元,估值为 400 亿美元。
去年年初我们几乎无法进行 10 公里的训练,但为了 Grok3 我们不停地进行了 100 公里的训练。太自豪了,未来还会有更多!
— Guodong Zhang (@Guodzh) February 18, 2025
值得注意的是,xAI 的张国栋宣布 Grok 3 使用了令人印象深刻的 100, 000 个 GPU 进行训练,这表明资源和能力有了显著的飞跃。这一发展是在预测到 2032 年 AI 芯片销售收入可能飙升至2270 亿美元之际取得的。
欲了解更多详细信息和见解,您可以在此处 查看完整文章。
发表回复