腾讯推出混元自研深度思考模型 T1 正式版:吐字快、能秒回,擅长超长文处理

腾讯正式推出了其自主研发的深度思考模型——混元 T1 正式版。这款模型以其快速响应、擅长处理超长文本及强大的推理能力而著称,标志着腾讯在AI领域的又一重要进展。

腾讯推出混元自研深度思考模型 T1 正式版:吐字快、能秒回,擅长超长文处理

混元 T1 的特点与优势

  • 快速响应:混元 T1 能够迅速回应用户提问,具有极高的效率。
  • 超长文处理:特别优化了对超长文本的理解和推理能力,有效解决了上下文丢失和长距离信息依赖的问题。
  • 强化学习优化:通过大规模强化学习训练,并针对数学、逻辑推理、科学和代码等领域进行了专项优化,使得混元 T1 在这些领域表现出色。
  • 高效架构:采用 Hybrid-Mamba-Transformer 融合模式,降低了传统 Transformer 架构的计算复杂度和内存占用,提高了训练和推理效率。

性能表现

在多个基准测试中,如 MMLU-PRO、CEval、AIME 和 Zebra Logic 等,混元 T1 展现了业界领先的推理能力。尤其是在体现推理模型基础能力的 MMLU-PRO 数据集中,混元 T1 取得了 87.2 分的好成绩,仅次于当前顶尖模型 o1。此外,在内部人工体验集评估中,混元 T1 在文创指令遵循、文本摘要等方面也展现了优异的表现。

腾讯推出混元自研深度思考模型 T1 正式版:吐字快、能秒回,擅长超长文处理腾讯推出混元自研深度思考模型 T1 正式版:吐字快、能秒回,擅长超长文处理

应用场景与API使用

混元 T1 已上线腾讯云官网,适用于多种应用场景,包括但不限于销售团队分析行业趋势、金融分析师评估市场数据、研究人员探索新兴趋势以及购物者比较产品信息等。API 使用价格为每百万 tokens 输入 1 元,输出 4 元,极具性价比。

© 版权声明

相关文章

暂无评论

none
暂无评论...