ChatGPT 高级语音模式重磅升级：声音更自然，新增实时翻译功能

222 0

OpenAI 近日对 ChatGPT 的高级语音模式（Advanced Voice Mode）进行了重大更新，进一步拉近了 AI 与人类对话之间的距离。此次升级不仅让语音输出更加自然、富有情感，还新增了多语言实时翻译功能，标志着语音交互体验迈向新高度。

更像“人”的语音交互体验

早在去年 GPT-4o 发布时，OpenAI 就引入了高级语音模式，利用原生多模态模型（如 GPT-4o），实现接近实时的音频响应。其平均响应时间约为 320 毫秒，在理想条件下最快可达 232 毫秒，已接近人类在日常对话中的反应速度。

该模式不仅能生成语音，还能捕捉非语言线索，例如语速、停顿、重音变化，并作出带有情感色彩的回应，使整个对话更加自然流畅。

在今年早些时候的一次小更新中，OpenAI 已经优化了语音中断问题并改善了口音表现。而本次更新则在此基础上更进一步：

语调更细腻：语音更具层次感，听起来更像是真人表达。
节奏更真实：包括自然的停顿、语气转折和重音强调。
情感识别增强：能够更准确地表达共情、讽刺等复杂情绪。

新增多语言实时翻译功能

此次更新最引人注目的新功能之一是语音翻译支持。用户只需简单指令，即可让 ChatGPT 在对话过程中持续进行跨语言翻译，直到收到“停止”命令为止。

这一功能的应用场景非常广泛，包括：

跨语言会议或访谈；
外语学习辅助；
国际旅行中的即时沟通。

OpenAI 表示，这项更新有望取代部分专用语音翻译应用，为用户提供一个更智能、更集成的解决方案。

使用限制与改进方向

尽管这次更新带来了显著提升，OpenAI 也坦承仍存在一些技术限制：

音频质量波动：某些语音选项下可能出现音调不稳定或音高异常变化。
偶发“幻听”现象：极少数情况下会生成意外的声音，如背景音乐、广告片段或无意义语句。

这些问题将随着后续迭代逐步优化，OpenAI 承诺将持续提升音频一致性和稳定性。

目前仅向付费用户开放

需要注意的是，新版高级语音模式目前仅面向 ChatGPT Plus、Team 和 Enterprise 用户开放。普通用户暂时无法体验全部功能。

早报 # ChatGPT # OpenAI # 高级语音模式

文章版权归作者所有，未经允许请勿转载。

逆势豪赌视频生成！当 OpenAI 退守企业市场，埃隆·马斯克的 xAI 全力投入AI视频生成

早报 # OpenAI # xAI # 埃隆·马斯克

6天前

080

告别多平台切换！谷歌 Flow 迎来重大更新，统一图像与视频工作流并支持项目无缝迁移

早报 # Flow # ImageFX # Whisk

1个月前

01010

20B 与 120B 模型上线！Ollama 一键运行 OpenAI 最新开源模型gpt-oss

教程 # gpt-oss # Ollama # OpenAI

8个月前

09650

谷歌的视频生成模型Veo 2 登陆 Gemini，但目前付费用户才可以使用

早报 # Gemini Advanced # Veo 2 # 谷歌

12个月前

03070

暂无评论

暂无评论...

ChatGPT 高级语音模式重磅升级：声音更自然，新增实时翻译功能

更像“人”的语音交互体验

新增多语言实时翻译功能

使用限制与改进方向

目前仅向付费用户开放

Helix 升级：Figure 推动人形机器人迈向“类人分拣”新高度

谷歌AI 视频生成实验项目Sparkify：Gemini 与 Veo 驱动的未来内容创作工具

相关文章

逆势豪赌视频生成！当 OpenAI 退守企业市场，埃隆·马斯克的 xAI 全力投入AI视频生成

告别多平台切换！谷歌 Flow 迎来重大更新，统一图像与视频工作流并支持项目无缝迁移

20B 与 120B 模型上线！Ollama 一键运行 OpenAI 最新开源模型gpt-oss

谷歌的视频生成模型Veo 2 登陆 Gemini，但目前付费用户才可以使用

暂无评论

文章

智谱突袭发布GLM-5.1：编码能力暴涨 30%，直逼 Claude Opus，手把手教你接入 Claude Code 与 OpenClaw

美团开源 LongCat-Next：原生多模态新范式，用“离散 Token”统一文本、图像与语音

新阿里通义千问发布 Qwen3.5-Omni：全模态原生大模型，215 项 SOTA 碾压 Gemini 3.1 Pro

ComfyUI 原生支持 Wan2.2 Fun：首尾帧控制与多模态视频生成全面集成

新Kimi 会员计费大升级：告别“按次计数”，迎来“统一额度”时代

LMArena 最新排名出炉！阿里千问杀入全球前五，Qwen3.5-Max-Preview 力压豆包、Kimi 成国产最强

OpenMAIC

ITELLOU

S.H.I.T

Tripo

CoPaw

Accio Work

ChatGPT 高级语音模式重磅升级：声音更自然，新增实时翻译功能

更像“人”的语音交互体验

新增多语言实时翻译功能

使用限制与改进方向

目前仅向付费用户开放

Helix 升级：Figure 推动人形机器人迈向“类人分拣”新高度

谷歌AI 视频生成实验项目Sparkify：Gemini 与 Veo 驱动的未来内容创作工具

相关文章

文章

标签云

网址

OpenMAIC

ITELLOU

S.H.I.T

Tripo

CoPaw

Accio Work