谷歌正在为 Google Docs 引入一项新功能:由 Gemini 驱动的 AI 音频摘要。用户现在可以点击几下,即可收听一份自然语音生成的文档概述,无需通读全文或听完完整朗读。

该功能于 2026 年 2 月 12 日开始分批推送,预计在 15 天内完成全球部署。但值得注意的是,并非所有用户都能使用——目前仅对特定 Google Workspace 和 AI 订阅计划开放。
功能亮点
- 智能语音摘要:AI 自动提炼文档核心内容,包括跨多个标签页的信息,生成 1–3 分钟的语音概述。
- 自然语音风格:采用与 Gemini 应用一致的高质量合成语音,语调流畅、接近真人。
- 个性化选项:
- 多种声音角色:如“叙述者”、“说服者”、“教练”等,适配不同场景
- 播放速度调节:支持加速或减速收听
- 便捷入口:网页端 Docs 中依次点击 工具 > 音频 > 收听文档摘要,即可唤出带进度条的迷你播放器。
此前,Google Docs 已支持 Gemini 全文朗读功能。音频摘要则进一步升级,从“读出来”迈向“讲重点”。
可用范围(截至 2026 年 2 月)
该功能仅限以下订阅用户使用:
- Google Workspace Business Standard / Plus
- Enterprise Standard / Plus
- Google AI Ultra for Business(附加组件)
- Google AI Pro for Education(附加组件)
- Google AI Pro / Ultra(个人或团队版)
普通免费用户及基础版 Workspace 用户暂无法访问。
适用场景
- 快速了解会议纪要、项目报告或研究论文的核心结论
- 在通勤、做饭或运动时“听”文档,提升信息获取效率
- 教育场景中帮助学生把握长篇文本主旨
- 为视觉疲劳用户提供替代性阅读方式
注意事项
- 摘要基于当前文档内容生成,不包含外部链接或未加载的协作者评论
- 多语言支持情况取决于 Gemini 模型的语言能力(目前以英语为主,逐步扩展)
- 音频摘要不会保存到云端,每次生成均为实时推理结果
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...














