
微软持续创新其人工智能工具,最近发布了功能强大的屏幕分析实用程序Copilot Vision 。继此次发布之后,他们正在测试一项名为Copilot Audio Expressions的新功能,该工具能够为您的脚本生成类似人类的音频。这项先进的人工智能技术不仅可以大声朗读文本,还可以根据您的输入进行创造性的解读。
感兴趣的朋友可以在Copilot Labs官方网站上测试这款工具,它提供两种不同的模式:情感模式和故事模式。用户可以选择近十几种不同的语音和风格。Windows Late 进行的详细评估凸显了该工具的有效性,尤其是在英语能力方面。
在探索过程中,Windows Late 从一段描绘熙熙攘攘的火车站的虚构剧本开始。他们将剧本输入工具,并指定所需的语音风格。最终,他们选择使用“表情”选项,搭配Oak语音和旁白风格。

该应用程序快速生成了一段音频,可使用内置网页播放器播放。值得注意的是,表情模式最长可录制 59 秒的音频。用户可能期待的是 AI 语音朗读文字,但实际输出却更具动感。AI 巧妙地增强了文本效果,引入了更多元素并进行了重新表述,从而提升了参与度,最终带来更引人入胜的聆听体验。
另一个突出的功能是无需用户账户即可下载MP3格式的音频文件,方便在各种设备上播放。表情模式展示了令人印象深刻的自定义选项,也引发了人们对故事模式的好奇。
使用故事模式创作引人入胜的故事
进一步探索后,Windows 最新版本切换到了“故事”模式,该模式会自动选择声音和风格,无需进行单独调整。只需输入一个简单的提示——“讲述一只潜伏在阴影中寻找猎物的猫的故事”,该工具便会生成一个 90 秒的创意叙事。这个故事包含一位以美国口音呈现的人类叙述者的声音,以及那只猫以英国口音呈现的独特声音,营造出一种娱乐性的音频体验。

听众可以通过检查该工具生成的两个音频片段来探索输出质量。
总体而言,Copilot Audio Expressions工具是一款令人印象深刻的 AI 音频生成解决方案,非常适合制作引人入胜的音频片段。如果您有兴趣体验这项创新技术,请务必访问Copilot Labs 网站并尝试一下。
发表回复