公告

豆包 APP 语音通话重磅升级：首发全双工语音大模型 Seeduplex

6小时前小马良

字节跳动旗下 AI 助手 豆包 APP 近日宣布其实时语音通话功能迎来重大升级，正式上线原生全双工端到端语音大模型 Seeduplex。此次更新旨在解决传统语音交互中的“听不清”、“抢话”和“反应慢”三大痛点，带来更接近真人交流的自然体验。

豆包 APP 语音通话重磅升级：首发全双工语音大模型 Seeduplex

核心技术：Seeduplex 全双工模型

Seeduplex 是豆包团队自主研发的原生全双工端到端语音大模型。与传统“识别-理解-生成-合成”的串联式链路不同，Seeduplex 实现了语音输入与输出的并行处理，具备以下核心能力：

1. 极致抗干扰：嘈杂环境也能“听得清”

精准降噪：在餐厅、展览、街道等复杂声学场景下，能有效过滤背景噪音和旁人交谈声。
抗误触发：大幅降低因环境人声导致的误打断或误回复，确保 AI 只响应用户的指令，不被无关声音带偏。
实测表现：记者在多人交谈环境中测试发现，Seeduplex 能准确锁定用户语音源，对话连贯性显著优于过往版本。

2. 动态判停：拒绝“抢话”，懂你的停顿

语义级判断：不再单纯依赖静音时长来判断用户是否说完，而是结合语音特征与**语义上下文进行综合研判。
自然节奏：能够识别用户思考时的短暂停顿、语气词或犹豫，避免在用户未表达完整时强行插话（即“抢话”现象）。
类人交互：对话节奏更贴合人类自然交流习惯，留出适当的回应空间，减少机械感。

3. 超低延迟：高频互动更流畅

毫秒级响应：端到端架构大幅降低了从听到说的整体时延。
游戏化场景优化：在“飞花令”、“成语接龙”等需要快速反应的高频互动场景中，响应速度提升明显，体验更加丝滑。

如何体验？

目前，Seeduplex 能力已全面覆盖豆包 APP 的实时语音通话功能。

打开 豆包 APP。
点击底部的 “打电话” 按钮（或语音通话入口）。
即可开启实时语音通话，体验全双工、低延迟、抗干扰的全新交互。

暂无评论

none

暂无评论...