探索 Microsoft Copilot 的全新音频 AI：比 ChatGPT 更个性化的声音

微软持续创新其人工智能工具，最近发布了功能强大的屏幕分析实用程序Copilot Vision 。继此次发布之后，他们正在测试一项名为Copilot Audio Expressions的新功能，该工具能够为您的脚本生成类似人类的音频。这项先进的人工智能技术不仅可以大声朗读文本，还可以根据您的输入进行创造性的解读。

感兴趣的朋友可以在Copilot Labs官方网站上测试这款工具，它提供两种不同的模式：情感模式和故事模式。用户可以选择近十几种不同的语音和风格。Windows Late 进行的详细评估凸显了该工具的有效性，尤其是在英语能力方面。

在探索过程中，Windows Late 从一段描绘熙熙攘攘的火车站的虚构剧本开始。他们将剧本输入工具，并指定所需的语音风格。最终，他们选择使用“表情”选项，搭配Oak语音和旁白风格。

该应用程序快速生成了一段音频，可使用内置网页播放器播放。值得注意的是，表情模式最长可录制 59 秒的音频。用户可能期待的是 AI 语音朗读文字，但实际输出却更具动感。AI 巧妙地增强了文本效果，引入了更多元素并进行了重新表述，从而提升了参与度，最终带来更引人入胜的聆听体验。

另一个突出的功能是无需用户账户即可下载MP3格式的音频文件，方便在各种设备上播放。表情模式展示了令人印象深刻的自定义选项，也引发了人们对故事模式的好奇。

使用故事模式创作引人入胜的故事

进一步探索后，Windows 最新版本切换到了“故事”模式，该模式会自动选择声音和风格，无需进行单独调整。只需输入一个简单的提示——“讲述一只潜伏在阴影中寻找猎物的猫的故事”，该工具便会生成一个 90 秒的创意叙事。这个故事包含一位以美国口音呈现的人类叙述者的声音，以及那只猫以英国口音呈现的独特声音，营造出一种娱乐性的音频体验。