谷歌文档上线 AI 音频摘要:Gemini 生成语音概述,支持多声音风格

早报8小时前发布 小马良
2 0

谷歌正在为 Google Docs 引入一项新功能:Gemini 驱动的 AI 音频摘要。用户现在可以点击几下,即可收听一份自然语音生成的文档概述,无需通读全文或听完完整朗读。

谷歌文档上线 AI 音频摘要:Gemini 生成语音概述,支持多声音风格

该功能于 2026 年 2 月 12 日开始分批推送,预计在 15 天内完成全球部署。但值得注意的是,并非所有用户都能使用——目前仅对特定 Google Workspace 和 AI 订阅计划开放。

功能亮点

  • 智能语音摘要:AI 自动提炼文档核心内容,包括跨多个标签页的信息,生成 1–3 分钟的语音概述
  • 自然语音风格:采用与 Gemini 应用一致的高质量合成语音,语调流畅、接近真人。
  • 个性化选项
    • 多种声音角色:如“叙述者”、“说服者”、“教练”等,适配不同场景
    • 播放速度调节:支持加速或减速收听
  • 便捷入口:网页端 Docs 中依次点击 工具 > 音频 > 收听文档摘要,即可唤出带进度条的迷你播放器。

此前,Google Docs 已支持 Gemini 全文朗读功能。音频摘要则进一步升级,从“读出来”迈向“讲重点”。

可用范围(截至 2026 年 2 月)

该功能仅限以下订阅用户使用

  • Google Workspace Business Standard / Plus
  • Enterprise Standard / Plus
  • Google AI Ultra for Business(附加组件)
  • Google AI Pro for Education(附加组件)
  • Google AI Pro / Ultra(个人或团队版)

普通免费用户及基础版 Workspace 用户暂无法访问

适用场景

  • 快速了解会议纪要、项目报告或研究论文的核心结论
  • 在通勤、做饭或运动时“听”文档,提升信息获取效率
  • 教育场景中帮助学生把握长篇文本主旨
  • 为视觉疲劳用户提供替代性阅读方式

注意事项

  • 摘要基于当前文档内容生成,不包含外部链接或未加载的协作者评论
  • 多语言支持情况取决于 Gemini 模型的语言能力(目前以英语为主,逐步扩展)
  • 音频摘要不会保存到云端,每次生成均为实时推理结果
© 版权声明

相关文章

暂无评论

none
暂无评论...