MiniMax Speech 2.6 发布:250ms 低延迟、多语言实时语音合成
MiniMax 正式推出 Speech 2.6 版本,进一步强化其在实时语音合成与智能文本处理领域的能力。新版本面向开发者与企业用户,主打低延迟交互、高自然度语音生成与多语言支持,适用于智能客服、实时翻译、语音助手等场景。
- 地址:https://www.minimaxi.com/audio
- API:https://platform.minimax.io/docs/api-reference/speech-t2a-intro
核心特性
- 超低延迟:端到端语音合成延迟 低于 250 毫秒,满足实时对话交互需求;
- 智能文本规范化:自动识别并格式化 URL、电子邮件、日期、数字等结构化文本,提升语音播报准确性;
- 高保真语音克隆:支持基于少量样本的语音复刻,结合 LoRA 微调技术,实现自然、流畅且富有表现力的语音输出;
- 多语言动态切换:支持 40 余种语言,并在单次对话中实时切换语种,无需重新初始化模型。
适用场景
- 跨语言客服系统;
- 实时语音翻译设备;
- 个性化语音助手;
- 有声内容自动化生成。
MiniMax 表示,Speech 2.6 已通过 API 开放,开发者可集成至现有应用中。该版本延续了其轻量化与高兼容性设计,支持主流云平台部署。
暂无评论...











