拟人化实时交互系统SpeechGPT 2.0-preview:支持多种音色,200毫秒延迟 复旦大学自然语言处理实验室近期推出了SpeechGPT 2.0-preview,这是他们为实现情景智能而开发的第一个拟人化实时交互系统。基于百万小时级别的语音数据训练而成,这款端到端的语音大模型不仅能... 多模态模型# SpeechGPT 2.0-preview# 语音模型 2周前0870