字节跳动发布豆包大模型 1.5 Pro,性能超越 GPT-4o 和 Claude 3.5 Sonnet

字节跳动今日正式发布了其最新的豆包大模型 1.5 Pro(Doubao-1.5-pro),该模型在多个测评基准上,包括知识、代码、推理和中文等方面,展现了优于 GPT-4o 和 Claude 3.5 Sonnet 的综合得分。目前,Doubao-1.5-pro 已经在豆包 App 上灰度上线,开发者也可以通过火山引擎直接调用 API。

技术亮点

据官方介绍,豆包大模型 1.5 Pro 使用了较小的激活参数进行预训练,并采用了大规模稀疏的 MoE(Mixture of Experts)架构,实现了等效于 7 倍激活参数的传统 Dense 模型的性能,远超行业标准的 MoE 架构约 3 倍杠杆的效率。

新增功能与改进

除了核心的语言处理能力外,此次更新还包括:

  • 豆包视觉理解模型 Doubao-1.5-vision-pro:此版本在多模态数据合成、动态分辨率、多模态对齐以及混合训练方面进行了全面升级,显著增强了模型在视觉推理、文字文档识别、细粒度信息理解和指令遵循方面的能力。
  • 豆包实时语音模型 Doubao-1.5-realtime-voice-pro:作为一款集成了语音理解和生成的一体化模型,它支持端到端的语音对话,具有低延迟和对话中可随时打断的特点。这款模型已经在豆包 App 中全量开放,用户需将应用升级至 7.2.0 版本以体验新功能。预计火山引擎将在上半年通过方舟平台提供相应的 API 服务。

训练透明度与定价策略

值得注意的是,豆包大模型 1.5 Pro 在整个训练过程中未使用任何其他模型生成的数据,确保了训练过程的高度原创性和独立性。此外,尽管推出了多项技术改进,但豆包大模型 1.5 系列的所有产品,包括 Doubao-1.5-pro、Doubao-1.5-lite 和 Doubao-1.5-vision-pro,将继续维持原有价格不变,即“加量不加价”。

0

评论0

没有账号?注册  忘记密码?