豆包 APP 语音通话重磅升级:首发全双工语音大模型 Seeduplex

6小时前 小马良
5 0

字节跳动旗下 AI 助手 豆包 APP 近日宣布其实时语音通话功能迎来重大升级,正式上线原生全双工端到端语音大模型 Seeduplex。此次更新旨在解决传统语音交互中的“听不清”、“抢话”和“反应慢”三大痛点,带来更接近真人交流的自然体验。

豆包 APP 语音通话重磅升级:首发全双工语音大模型 Seeduplex

核心技术:Seeduplex 全双工模型

Seeduplex 是豆包团队自主研发的原生全双工端到端语音大模型。与传统“识别-理解-生成-合成”的串联式链路不同,Seeduplex 实现了语音输入与输出的并行处理,具备以下核心能力:

1. 极致抗干扰:嘈杂环境也能“听得清”

  • 精准降噪:在餐厅、展览、街道等复杂声学场景下,能有效过滤背景噪音和旁人交谈声。
  • 抗误触发:大幅降低因环境人声导致的误打断或误回复,确保 AI 只响应用户的指令,不被无关声音带偏。
  • 实测表现:记者在多人交谈环境中测试发现,Seeduplex 能准确锁定用户语音源,对话连贯性显著优于过往版本。

2. 动态判停:拒绝“抢话”,懂你的停顿

  • 语义级判断:不再单纯依赖静音时长来判断用户是否说完,而是结合语音特征与**语义上下文进行综合研判。
  • 自然节奏:能够识别用户思考时的短暂停顿、语气词或犹豫,避免在用户未表达完整时强行插话(即“抢话”现象)。
  • 类人交互:对话节奏更贴合人类自然交流习惯,留出适当的回应空间,减少机械感。

3. 超低延迟:高频互动更流畅

  • 毫秒级响应:端到端架构大幅降低了从听到说的整体时延。
  • 游戏化场景优化:在“飞花令”、“成语接龙”等需要快速反应的高频互动场景中,响应速度提升明显,体验更加丝滑。

如何体验?

目前,Seeduplex 能力已全面覆盖豆包 APP 的实时语音通话功能。

  1. 打开 豆包 APP
  2. 点击底部的 “打电话” 按钮(或语音通话入口)。
  3. 即可开启实时语音通话,体验全双工、低延迟、抗干扰的全新交互。

暂无评论

none
暂无评论...