三星紧凑型 AI 模型在解决 ARC-AGI 难题方面超越 Gemini 2.5 Pro 等大型语言模型

虽然三星的相机技术目前可能缺乏重大突破，但其在人工智能 (AI) 方面的进步值得关注。该公司最新的 AI 计划推出了一个模型，其性能显著优于其他大型语言模型 (LLM)，其中一些模型的规模约为其 10, 000 倍。

三星创新微型递归模型介绍

三星的策略类似于修改书面草稿的细致过程；该模型会反复识别和纠正错误——这比传统的法学硕士（LLM）课程有了显著的改进。传统的法学硕士课程在面临逻辑挑战时，只要出现一个错误，就会陷入困境。虽然思路链式推理对这些模型有所辅助，但在压力之下，其有效性仍然脆弱。

最初，三星尝试通过增加模型层数来提升模型复杂度；然而，这种方法导致了过拟合，并阻碍了泛化。有趣的是，减少层数并增加递归迭代次数，反而提升了 TRM 的性能。

值得注意的是，三星的 TRM 不仅可以与 DeepSeek R1、谷歌的 Gemini 2.5 Pro 和 OpenAI 的 o3-mini 等更大的 LLM 相媲美，而且在许多情况下甚至超过了它们的性能，同时只使用了它们参数数量的一小部分。