谷歌正在将其 AI 驱动的 Gemini 聊天机器人打造成一个全面的生产力工具。周二,谷歌为 Gemini 添加了两项新功能:“画布”(Canvas)和音频概览(Audio Overview),进一步提升了 Gemini 在写作、编程和内容消费方面的用户体验。
Gemini Canvas:交互式创作空间
Gemini Canvas 是一个类似于 OpenAI 的 ChatGPT Canvas 和 Anthropic 的 Artifacts 的工作空间,为用户提供了一个交互式环境,用于创建、优化和分享写作及编程项目。
功能亮点
无缝协作:Canvas 与 Gemini 无缝协作,用户可以在其中起草长篇消息,并进行编辑和微调。 实时预览:用户可以更新草稿的特定部分,并通过专用工具调整语气、长度和格式。 协作与分享:用户可以轻松将内容导出到 Google Docs,方便团队协作。 编程支持:Canvas 支持生成并预览 HTML、React 代码及其他 Web 应用原型,用户可以要求 Gemini 修改预览内容,Canvas 将实时刷新。
使用场景
写作优化:用户可以高亮一段文字并要求 Gemini 使其更简洁、更专业或更非正式。 代码预览:用户可以要求 Gemini 生成 HTML 表单代码,并在 Web 应用中预览其外观和功能。

音频概览:内容消费新体验
除了 Canvas,谷歌还将 NotebookLM 的音频概览功能 引入了 Gemini。这一功能能够为文档、网页和其他来源生成逼真的播客风格音频摘要。
功能亮点
多格式支持:音频概览支持多种格式的文件和内容。 便捷操作:用户可以通过提示栏上传文档,触发音频概览快捷方式,生成摘要后可以下载或分享。
使用场景
高效学习:用户可以在移动设备上通过音频概览快速了解长篇文章或报告的核心内容。 内容分享:用户可以将音频摘要分享给他人,方便远程协作和学习。

免费开放
从周二起,Canvas 和音频概览功能对全球 Gemini 用户免费开放。不过,目前 Canvas 的代码预览功能仅限于网页版,而音频概览摘要仅支持英语。
谷歌的这一举措表明,AI 聊天机器人正在从简单的对话工具转变为全面的生产力套件。通过提供交互式工作空间和音频内容消费功能,谷歌正在推动 Gemini 在写作、编程和内容消费领域的应用,为用户提供更加高效和便捷的体验。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...