公告

MiniMax Speech 2.6 发布：250ms 低延迟、多语言实时语音合成

5个月前小马良

188 00

MiniMax 正式推出 Speech 2.6 版本，进一步强化其在实时语音合成与智能文本处理领域的能力。新版本面向开发者与企业用户，主打低延迟交互、高自然度语音生成与多语言支持，适用于智能客服、实时翻译、语音助手等场景。

地址：https://www.minimaxi.com/audio
API：https://platform.minimax.io/docs/api-reference/speech-t2a-intro

核心特性

超低延迟：端到端语音合成延迟 低于 250 毫秒，满足实时对话交互需求；
智能文本规范化：自动识别并格式化 URL、电子邮件、日期、数字等结构化文本，提升语音播报准确性；
高保真语音克隆：支持基于少量样本的语音复刻，结合 LoRA 微调技术，实现自然、流畅且富有表现力的语音输出；
多语言动态切换：支持 40 余种语言，并在单次对话中实时切换语种，无需重新初始化模型。

适用场景

跨语言客服系统；
实时语音翻译设备；
个性化语音助手；
有声内容自动化生成。

MiniMax 表示，Speech 2.6 已通过 API 开放，开发者可集成至现有应用中。该版本延续了其轻量化与高兼容性设计，支持主流云平台部署。

暂无评论

none

暂无评论...