
Copilot Vision 已经推出一段时间了,但它最近与 Windows 11 Copilot 应用的集成标志着一次重大飞跃。几个月前,我曾测试过它,当时它还只能在浏览器中使用,效果并不理想。然而,它的桌面应用版本现已面向美国以外(欧盟地区除外)的用户开放,展现出显著的改进。
最初,我在 Edge 浏览器中使用 Vision 的体验有限——它只能与当前打开的标签页交互。这意味着它的功能受到了限制。Windows 桌面应用的显著升级在于它能够超越单个浏览器标签页进行交互,允许用户选择任何打开的窗口。这项增强功能极大地扩展了它在各种应用程序中的可用性,无论是访问命令提示符、应用程序统计信息还是游戏窗口——尽管我没有在游戏环境中测试过它。

启动桌面应用并选择 Vision 功能后,我会看到一个菜单,可以从任何打开的窗口中进行选择。在我的第一次测试中,我打开了一篇关于构建媒体服务器的文章。虽然交互感觉与我之前的体验相似,但 AI 提供了流畅的对话。然而,当我询问文章作者使用的操作系统时,它却显得不足——它在页面下方的位置太靠后,Vision 无法检索到该信息。
但仍有一个限制:Vision 只能访问选定窗口内可见的内容。这意味着它无法滚动或访问网页上的其他信息,也无法直接与按钮交互。不过,它可以通过以独特的动画突出显示相关按钮来引导用户,但最终的交互仍然需要手动点击。

探索增强功能
与之前的局限性不同,Copilot Vision 新增了在网络上搜索更多信息的功能。最初,当我向出版社申请作者信息时,它拒绝了,并请求允许在线搜索。获得许可后,它成功地从作者页面提供了书名和其他详细信息,表明它对信息复述的掌握还算不错。

为了进一步评估 AI 的功能,我展示了 DietPi 设置的 shell 命令脚本的屏幕截图。在这个例子中,助手正确地概述了每个命令的用途,无需查阅网页即可重复细节。

接下来,我只显示了命令并请求说明。Vision 准确地描述了每个参数的功能,表明它拥有强大的内部知识库,因为它没有引用任何在线资源。

为了进一步验证其准确性,我测试了一系列之前从未引入过的 Docker 命令。虽然 Vision 有效地描述了前四个命令的操作,但需要进一步的练习才能让它继续执行下去。

总结我的评估,这些回应总体上是准确的,但 Vision 是否利用在线资源或仅仅利用自己的数据集仍然不清楚。

这篇关于 Windows 11 版 Copilot Vision 的概述突显了其显著的改进。如果您熟悉Copilot 数据策略,我鼓励您探索其功能——它已无缝集成到应用程序中。
发表回复