OpenAI今天宣布,为 ChatGPT 推出免费版本的高级语音模式。该功能基于 GPT-4o mini 模型,这是其最新模型 GPT-4o 的一种变体。这一举措旨在为更多用户提供更高效、更具交互性的语音交互体验,尽管其功能实现上存在一些限制。
功能介绍与体验
免费版本的高级语音模式在自然对话流程和语气上与高级版 GPT-4o 基本一致,但采用了更低计算成本的服务交付模型。OpenAI 表示,GPT-4o mini 能够为用户提供类似的体验,同时通过更高的计算效率,使得该功能能够面向更广泛的用户群体。

要使用高级语音模式,用户只需点击 ChatGPT 应用程序屏幕右下角的语音图标,即可进入专用界面。在此界面中,用户可以随时启用或关闭麦克风,并根据需要结束对话。不过,需要注意的是,用户必须授予 ChatGPT 访问麦克风的权限,才能使用这一功能。
使用限制
尽管高级语音模式为用户带来了更动态和交互式的对话体验,但 OpenAI 对其使用设置了明确的限制:
- 每日使用时长限制:音频输入和输出的使用受到每日速率限制,且该限制可能会根据情况调整。当用户剩余 3 分钟的音频使用量时,系统会发出警告,一旦达到限制,对话将自动结束。
- 功能优化与改进:尽管存在限制,OpenAI 仍对高级语音模式进行了多项改进,包括支持五种新语音、允许用户提供自定义提示并稍后回忆对话内容,以及提升整体对话速度和扩展支持的外语口音。
平台支持
OpenAI 近期还宣布,高级语音模式已扩展到 macOS 和 Windows 上的 ChatGPT 桌面应用程序,这意味着用户不仅可以在移动设备上体验该功能,还能在桌面端享受更便捷的语音交互。

© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...