
去年,微软宣布开发 Copilot Vision,旨在彻底改变用户在 Microsoft Edge 中与网页交互的方式。这款创新的 AI 助手最初面向美国的 Pro 订阅用户推出,现在可供免费用户使用,尽管仍有地域限制。
在推出后,Windows Latest 主动使用美国的虚拟机探索了 Copilot Vision 的功能。首先,在 Bing 上搜索“Copilot Vision”,选择相关链接,然后点击“立即试用”。接受条款和条件为这一尖端体验奠定了基础。

虽然微软简要概述了 Copilot Vision 的操作方式,但许多用户发现最初的说明不够清晰。
在 Windows 11 上的 Microsoft Edge 中开始使用 Copilot Vision
在 Edge 的侧边栏中启动 Copilot Vision 后,我首先点击此处浏览官方 Vision 页面。 我很高兴了解它的功能,于是向 Copilot Vision 提出了一个有关网页内容的问题。 不幸的是,在我们交谈的过程中,AI 很快就消失了。
我以为这只是暂时故障,于是重复了我的询问。遗憾的是,经过短暂的交流后,人工智能在回答中途停了下来,试图想出一个答案,但未能保持连贯的对话。很明显,Copilot 很难掌握上下文并进行流畅的对话。
继续在微软的网站上,我询问页面上有多少个按钮。Copilot Vision 正确地回答说有一个显眼的按钮,上面标着“试试看”。然而,它却无法识别用于播放视频的第二个重要按钮。

当我尝试进一步与 Copilot Vision 互动时(要求它点击按钮或播放视频),我遭到了拒绝。人工智能表示无法与页面元素交互,甚至无法暂停其口头输出。
评估副驾驶视觉的效用
关闭不必要的窗口后,我导航到Windows Latest 的主页并重新访问了 Copilot Vision。令我欣慰的是,它准确地描述了一篇新文章。这一刻激发了人们对 Vision 潜力的乐观情绪,但它的可靠性仍然引起了重大担忧。
接下来,我在亚马逊英国站测试了 Copilot,要求根据搜索结果对最佳 SSD 进行分析。该 AI 列出了许多 SSD 的详细信息,但在要求比较 Acer 和 WD 的产品时却表现不佳。尽管 Copilot 提供了表面分析,但由于缺乏外部网络查询功能,因此未能达到预期效果。
当我询问 Acer SSD 的性能规格时,Copilot 无法提供具体信息,因为这超出了它目前的理解和能力。尝试通过 Bing 访问其他数据失败,因为它拒绝了我的搜索请求。

虽然 Copilot 可以帮助快速从可见区域提取数据,但其深度不足,因此在严肃研究中不太可靠。在收到赞助产品提醒时,AI 仅识别出 Sandisk,而忽略了三星等竞争对手,尽管它们出现在页面上。

这一疏忽进一步表明,Copilot Vision 只能解释可见的屏幕元素,无法导航整个页面,从而限制了其功能。即使在向下滚动网站以查找其他项目时,它也会失去连续性,无法记住之前的提及。

最终,Copilot Vision 目前的表现还有许多不足之处。它倾向于过度寻求用户的认可(经常为不足之处道歉),这表明需要进一步改进。必须集成一些重要功能,例如改进的滚动功能或访问网页完整内容的能力,以提升用户体验。
常见问题
1.什么是 Copilot Vision,它如何在 Microsoft Edge 中工作?
Copilot Vision 是集成到 Microsoft Edge 中的 AI 助手,可让用户通过语音命令与网页互动。通过激活该功能,用户可以提出问题并接收有关其屏幕上显示的内容的语音回复。
2.为什么 Copilot Vision 在网页交互方面存在困难?
Copilot Vision 目前的局限性包括无法与页面元素交互或在线搜索外部信息,从而降低了其提供全面响应的有效性。它只能分析可见的文本,但无法就内容进行深入而有意义的对话。
3. Copilot Vision 适用于所有 Microsoft Edge 用户吗?
Copilot Vision 最初仅面向美国 Pro 订阅用户开放,现在也已向免费用户开放。不过,目前这项服务的推出也仅限于美国用户。
发表回复 ▼