Voyage AI 推出Voyage 4 系列模型:共享嵌入空间 + 专家混合架构,重新定义文本嵌入效率

大语言模型17小时前发布 小马良
4 0

Voyage AI 正式推出 Voyage 4 系列文本嵌入模型,带来两项行业首创技术:统一的共享嵌入空间 与 首个生产级 MoE(专家混合)嵌入模型。这一系列不仅在检索精度上树立新标杆,更通过灵活的模型组合策略,显著降低企业级应用的长期成本。

无论你是构建 RAG 系统、智能体记忆库,还是高并发语义搜索服务,Voyage 4 都提供了前所未有的灵活性与性价比。

Voyage AI 推出Voyage 4 系列模型:共享嵌入空间 + 专家混合架构,重新定义文本嵌入效率

四款模型,一套嵌入空间

Voyage 4 系列包含四个版本,全部生成兼容的嵌入向量,可在同一向量空间中互操作:

模型定位特点
voyage-4-large旗舰版首个 MoE 架构嵌入模型,精度最高,服务成本比同类稠密模型低 40%
voyage-4平衡版接近 voyage-3-large 的精度,保持中等规模效率
voyage-4-lite轻量版精度媲美 voyage-3.5,参数更少,成本更低
voyage-4-nano开源版Apache 2.0 许可,免费发布于 Hugging Face,适合本地开发与原型验证

✅ 所有模型支持 256/512/1024/2048 维套娃式嵌入(MRL) 和 多种量化格式(FP32、INT8、二值化),可大幅压缩向量数据库存储与计算开销。

Voyage AI 推出Voyage 4 系列模型:共享嵌入空间 + 专家混合架构,重新定义文本嵌入效率

行业首创:共享嵌入空间 + 非对称检索

这是 Voyage 4 最具突破性的设计——不同模型生成的查询与文档嵌入可直接匹配

例如:

  • 用 voyage-4-large 对整个文档库做一次高精度向量化(一次性成本)
  • 用 voyage-4-nano 或 voyage-4-lite 实时处理用户查询(持续低成本)

这种 “非对称检索” 模式特别适合生产环境:

  • 文档更新频率低 → 用大模型保证表示质量
  • 查询流量高 → 用小模型控制延迟与费用

无需重新索引文档,即可随时升级查询模型,实现“精度-成本”动态平衡。

技术亮点:MoE 架构首次用于嵌入模型

voyage-4-large 是全球首个采用 专家混合(Mixture of Experts, MoE)架构 的生产级嵌入模型。它在推理时仅激活部分参数子集,从而:

  • 达到当前最高的检索精度(在 29 个基准数据集上平均领先 OpenAI v3 Large 14.05%
  • 服务成本比同等稠密模型低 40%
  • 保持高吞吐,适合高并发场景

这意味着你不再需要在“精度”和“成本”之间做痛苦取舍。

性能表现:全面超越主流竞品

在涵盖 医疗、法律、代码、金融、技术文档等 8 大领域的评估中:

  • 通用检索voyage-4-large 平均 NDCG@10 领先
    • Cohere Embed v4:+8.20%
    • OpenAI text-embedding-v3-large:+14.05%
  • 非对称检索:即使查询端使用轻量模型,精度仍显著优于对称方案

注:评估基于标准余弦相似度 + NDCG@10 指标,确保结果可复现、可比对。

Voyage AI 推出Voyage 4 系列模型:共享嵌入空间 + 专家混合架构,重新定义文本嵌入效率

如何开始使用?

  • 云端 API
    voyage-4-large / voyage-4 / voyage-4-lite 已上线 Voyage API,前 2 亿 tokens 免费。MongoDB Atlas 用户可通过 Atlas 嵌入与重排 API 直接调用。
  • 本地开源
    voyage-4-nano 已发布至 Hugging Face,Apache 2.0 许可,支持私有部署,欢迎社区贡献。
© 版权声明

相关文章

暂无评论

none
暂无评论...