苹果的 AI 模型在最新更新后落后于 OpenAI 的 GPT-4o

苹果的 AI 模型在最新更新后落后于 OpenAI 的 GPT-4o

苹果在 2025 年 WWDC 上公布 AI 领域重大进展

在最近的 WWDC 2025 大会上,苹果在 AI 能力方面取得了重大进展,推出了一系列兼顾开发者和消费者需求的更新。其中包括推出Foundation Models 框架,该框架允许开发者将 AI 功能集成到他们的应用程序中,同时优先考虑用户隐私。该框架利用了苹果专有的 AI 模型,并且免费提供。

下一代语言基础模型

此外,苹果还推出了一系列全新的语言基础模型,据称比前代模型速度更快、更高效。这些模型旨在改进工具使用,增强推理能力,并支持 15 种不同语言的多模态输入(包括图像和文本)。

Apple Intelligence 模型概述

Apple Intelligence 包含两种不同的基础模型:

  • 使用 Apple Silicon 针对设备性能进行优化的 30 亿参数模型。
  • 专为私有云计算量身定制的基于服务器的专家混合模型。

设备端模型专注于执行与文本相关的任务。其功能包括摘要、实体提取、文本理解、内容提炼、短对话和创意生成,而非通用聊天机器人。

性能基准和比较

核心问题在于苹果模型相对于领先竞争对手的表现。苹果没有依赖传统的人工智能基准,而是分享了其内部评估的结果,这些评估评估了语言和推理能力。

苹果智能模型

根据苹果的评估,设备上的 3B 模型与 Qwen-2.5-3B 竞争良好,并且在英语语言任务中与更大的 Qwen-3-4B 和 Gemma-3-4B 表现出色。虽然其基于服务器的模型略优于 Llama-4-Scout,但与 Qwen-3-235B 和 OpenAI 的高级 GPT-4o 相比,其表现并不理想。

图像输入评估

在评估图像输入能力方面,苹果的设备端模型超越了 InternVL 和 Qwen,展现出与 Gemma 相当的性能。其服务器模型虽然优于 Qwen-2.5-VL,但落后于 Llama-4-Scout 和 GPT-4o。

苹果在人工智能领域的未来之路

这些发现表明,苹果在基础 AI 技术开发方面仍有相当大的提升空间。与 GPT-4o 的比较似乎是为了展现更乐观的性能前景。与 OpenAI 最新的 O 系列模型或谷歌的 Gemini 2.5 Pro 进行比较,可能会发现更大的性能差距。随着苹果持续发展其内部能力,未来几年它在快速发展的 AI 领域中如何定位,将令人拭目以待。

来源和图片

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注