ElevenLabs发布Scribe v2 Realtime:新一代超低延迟语音转文本模型
ElevenLabs正式推出Scribe v2 Realtime,这是其专为实时转录打造的最新低延迟语音转文本模型。该模型处理语音仅需约150毫秒,非常适合需要即时转换的实时应用场景。公司宣称其在实时自动语音识别系统中创下了准确度新标准,尤其在处理含背景噪音或复杂内容的困难音频时表现卓越。

该模型支持超过90种语言,包括英语、法语、德语、意大利语、西班牙语、葡萄牙语、印地语和日语。其针对语音助手、会议转录和对话式AI应用进行了优化,拓展了ElevenLabs在实时客户互动与自动化方面的工具集。
Scribe v2 Realtime满足SOC 2、ISO27001、PCI DSS Level 1、HIPAA及GDPR等企业安全与隐私标准,并提供欧盟和印度数据驻留选项及零留存模式。用户可通过ElevenLabs API或ElevenLabs Agents平台使用该模型,企业版方案支持30个及以上并发会话。
暂无评论...











