MiniMax旗下的海螺AI在其海外版成功推出语音模型T2A-01-HD后,也于昨天在国内版正式上线了基于T2A-01系列语音模型的“海螺语音”。这一更新为用户带来了更加自然、流畅的超拟人人声体验。
主要特性
- 文本转语音:只需输入文字,即可生成高质量的人声音频,支持最长10000字符的文本转换。
- 个性化配置:用户可以自由调整输出语音的情绪、语速、音高和音色,以适应不同场景的需求。
- 多语言支持:提供包括中文、粤语、英语、日语、韩语在内的17种语言选项,满足全球用户的多样化需求。
性能评测
官方使用与Seed-TTS论文相同的评测集和工具进行测试,通过计算合成音频的字错率(WER)和复刻相似度(SIM),结果显示:
- 在中文方面,海螺语音表现出最佳的字错率和相似度;
- 对于英文,其性能接近真实录音的水平,具有很高的准确性和相似性。
情感理解和多样化的音色选择
海螺语音不仅具备情感理解能力,能够智能识别并重现语音中的细微情感差别,使声音更加生动、情绪表达更加精准。此外,它还提供了超过300种预置音色供用户选择,涵盖不同的语言、口音、性别和年龄层,风格从不羁、诙谐到慈祥等应有尽有,适用于有声书、ASMR耳语、新闻播报等多种场景。
评论0