讯飞星火 X1 升级版上线:国产大模型在推理与幻觉治理上的关键突破

早报4个月前发布 小马良
152 0

科大讯飞今日正式宣布,基于全国产算力训练的深度推理大模型——讯飞星火 X1 升级版全面上线。此次更新不仅是性能的提升,更在推理能力、多语言支持、幻觉治理和行业落地等关键维度实现系统性跃升。

作为讯飞星火系列的核心底座模型,X1 升级版在多个任务上对标 OpenAI 最新主流版本(如 o3),并在翻译、数学推理、文本生成等场景保持领先。更重要的是,它在事实性与忠实性幻觉治理上的显著进步,为大模型在高可靠性要求场景中的规模化落地扫清了关键障碍。

综合能力再升级:持续对标国际一流水平

讯飞星火 X1 升级版在多项核心能力上实现全面提升:

  • 翻译:支持中英等主流语种高质量互译,信息准确、语言流畅;
  • 推理:逻辑链更完整,复杂问题拆解能力增强;
  • 文本生成:语义连贯性、风格一致性进一步优化;
  • 数学能力:在2024年6月国内大模型挑战高考数学全国卷测试中,X1-0420 版本已突破 140分(满分150),本次升级后数学推理能力再次精进;
  • 多语言覆盖:已支持 130+ 语种,为全球用户提供全栈自主可控的中文大模型“第二种选择”。

科大讯飞强调,该模型完全基于国产算力平台训练,从底层算力到算法架构实现全链路自主可控,标志着我国在大模型核心技术领域的独立能力持续增强。

幻觉治理取得实质性突破

“幻觉”问题长期制约大模型在医疗、教育、金融等高敏感场景的应用。此次升级,讯飞星火 X1 在两个关键维度实现显著改进:

  1. 事实性幻觉治理
    模型生成内容是否符合客观事实?X1 升级版通过增强知识校验机制与推理路径约束,大幅降低“编造信息”“虚构数据”等现象。
  2. 忠实性幻觉治理
    当用户提供参考资料时,模型是否严格忠于原文?升级后,X1 在引用、摘要、问答等任务中能更准确地锚定源内容,避免偏离或误读。

这两项能力的提升,使星火 X1 在政务、法律、科研等对准确性要求极高的领域具备更强的落地可行性。

语音同传大模型全面跃升:更自然、更实时、更智能

依托星火 X1 底座,讯飞同步升级了语音同传大模型,在翻译质量、响应速度与语音听感上实现全方位进化。

翻译质量显著提升

采用多维度评价体系(内容完整度、信息准确度、语言质量等),计算出翻译综合质量得分(0–100分):

  • 相较2025年1月首发版本,整体效果提升20%
  • 单人演讲场景,中英双向翻译得分超过90分
  • 多人会议复杂场景下,得分仍可达80分以上,有效消除传统同传的“碎片化割裂感”。

“译”与“说”无缝耦合

讯飞首次应用基于文本自适应调度的流式语音合成技术,实现翻译输出与语音播报的动态协同。语音自然度、拟人度和舒适度显著提升,接近专业人工同传听感。

智能双语识别,无需手动切换

新模型支持中英文混合发言自动识别,并实时切换翻译方向。在双边会议、国际商务洽谈等场景中,参会者可自由使用母语发言,系统自动识别语种并完成翻译,避免因手动操作导致的交流中断。

目前,该语音同传大模型已全面上线讯飞双屏翻译机 2.0、讯飞 AI 录音笔、讯飞同传等产品,广泛应用于国际会议、外事接待、跨国协作等场景。

行业智能体同步进化,驱动关键领域效率提升

以星火 X1 为底座,讯飞同步优化了多个垂直领域的大模型与智能体:

星火代码大模型

  • 提升项目级代码理解与生成能力;
  • 支持单元测试自动生成、WEB 应用对话式编程;
  • 已在金融、制造、能源、科技等100余家重点企业落地应用;
  • 在典型场景中,研发效率提升超过50%

教育、医疗、企业服务等场景

  • 教育:增强解题推理、知识点关联与个性化辅导能力;
  • 医疗:提升病历理解、诊疗建议生成的准确性;
  • 企业应用:优化会议纪要生成、公文撰写、流程自动化等任务表现。

这些行业模型的持续迭代,正推动AI从“能用”向“好用”“可靠用”迈进。

如何体验?

讯飞星火 X1 升级版能力已全面开放:

  • ✅ 网页端与 App 用户可直接体验最新功能;
  • ✅ 全新 API 已同步上线 讯飞开放平台,支持开发者快速集成。

科大讯飞表示,将持续推进大模型核心技术攻关,致力于打造“顶天立地”的AI能力——既追求技术前沿突破,也深耕产业真实需求。

© 版权声明

相关文章

暂无评论

none
暂无评论...