
在Material 3 Expressive发布几天后,谷歌即将在其AI计划中推出一项引人注目的功能——Illuminate,这是一个值得关注的进展。此前,该功能曾被泄露,用户幽默地将其设计称为“女性化”。

TestingCatalog最近分享的洞察表明,谷歌正在增强 Illuminate 的功能。最新更新引入了一个主页,其中包含 AI 驱动的音频摘要,涵盖《弗兰肯斯坦》和《了不起的盖茨比》等经典文学作品。新工具套件中包含一些实验性功能,例如“编辑”按钮和生成封面图片的功能。然而,最引人注目的功能是“Sparks”,它旨在根据用户提示制作简短的、类似 TikTok 的讲解视频。

Sparks 的描述强调视频是“100%由 AI 生成的”,这表明单个模型负责根据提示协调视频和音频生成。
根据 TestingCatalog 的介绍,这些竖屏视频的样例已经上线,时长在一到三分钟之间,不过生成这些视频的工具目前似乎仅限于 Google 内部使用。以下是这些视频的示例(注意:播放前请调低音量):
更多示例可在TestingCatalog 的 X 主题中找到。这些示例视频的质量引发了人们对其底层技术的猜测,可能与谷歌的 Veo 3 模型或强大的 Gemini 多模态模型的变体有关。
此外,人们对其与 NotebookLM 的关联也越来越好奇。NotebookLM 是另一项与 Illuminate 合作的服务,它引发了人们对谷歌正在探索的“实验性”生成式 AI 工具数量的质疑。谷歌已确认计划将一个包含 AI 主机的视频概览功能集成到 NotebookLM 中,使用户能够收到 AI 制作的、针对其上传文档的视频解说。
TestingCatalog 进一步指出,鉴于对话格式相似,Illuminate 的 Sparks 功能和 NotebookLM 的视频功能背后的技术很可能具有共同的基础。
发表回复