
Cartesia
Cartesia 不仅带来了 SSM 架构驱动的低延迟 TTS、真实场景优化的 STT 模型,更通过 Line 平台解决了语音代理开发的“最后一公里”问题。其核心价值在于:让“实时、自然、可靠”的语音交互不再是技术难题,让开发者无需关注底层模型与基础设施,专注于业务逻辑与用户体验。
法国AI公司Gladia正式发布新一代语音识别模型Solaria,重塑呼叫中心等语音优先平台的实时通信体验。这款企业级语音转文字(STT)引擎以行业领先的准确率和超低延迟,为全球客户服务市场带来突破性解决方案。



据Gladia CEO Jean-Louis Queguiner透露,全球49%的企业曾因语言障碍蒙受经济损失。Solaria的推出直接针对三大行业痛点:
Gladia已与开源实时AI语音框架LiveKit达成战略合作,通过API集成让开发者快速获得多语言能力。目前其客户网络覆盖Attention、VEED.IO等700多家企业,服务超过15万用户。
这家成立于2022年的巴黎初创公司在2024年获得1600万美元A轮融资后,正加速构建端到端音频API基础设施。Solaria作为其产品矩阵的最新成员,将语音识别、生成式AI与语音合成技术深度融合,重新定义实时语音数据处理的标准。

免费用户每月可以转录10小时内容,可以上传音视频也可使用麦克风进行实时转录

对于中文的转录效果不错,但断句可能会有点问题

Queguiner表示将继续通过数据增强训练提升准确率,虽然尚未公布具体企业定价,但承诺将成为"市场最具性价比的解决方案"。随着40人团队持续扩张,Gladia计划进一步巩固其在欧美市场的技术领先地位。







