Voyage AI 推出Voyage 4 系列模型：共享嵌入空间 + 专家混合架构，重新定义文本嵌入效率

40 0

Voyage AI 正式推出 Voyage 4 系列文本嵌入模型，带来两项行业首创技术：统一的共享嵌入空间 与 首个生产级 MoE（专家混合）嵌入模型。这一系列不仅在检索精度上树立新标杆，更通过灵活的模型组合策略，显著降低企业级应用的长期成本。

无论你是构建 RAG 系统、智能体记忆库，还是高并发语义搜索服务，Voyage 4 都提供了前所未有的灵活性与性价比。

Voyage 4 系列包含四个版本，全部生成兼容的嵌入向量，可在同一向量空间中互操作：

模型	定位	特点
`voyage-4-large`	旗舰版	首个 MoE 架构嵌入模型，精度最高，服务成本比同类稠密模型低 40%
`voyage-4`	平衡版	接近 `voyage-3-large` 的精度，保持中等规模效率
`voyage-4-lite`	轻量版	精度媲美 `voyage-3.5`，参数更少，成本更低
`voyage-4-nano`	开源版	Apache 2.0 许可，免费发布于 Hugging Face，适合本地开发与原型验证

✅ 所有模型支持 256/512/1024/2048 维套娃式嵌入（MRL） 和 多种量化格式（FP32、INT8、二值化），可大幅压缩向量数据库存储与计算开销。

这是 Voyage 4 最具突破性的设计——不同模型生成的查询与文档嵌入可直接匹配。

例如：

这种 “非对称检索” 模式特别适合生产环境：

无需重新索引文档，即可随时升级查询模型，实现“精度-成本”动态平衡。

voyage-4-large 是全球首个采用 专家混合（Mixture of Experts, MoE）架构 的生产级嵌入模型。它在推理时仅激活部分参数子集，从而：

这意味着你不再需要在“精度”和“成本”之间做痛苦取舍。

在涵盖 医疗、法律、代码、金融、技术文档等 8 大领域的评估中：

通用检索：voyage-4-large 平均 NDCG@10 领先
- Cohere Embed v4：+8.20%
- OpenAI text-embedding-v3-large：+14.05%
非对称检索：即使查询端使用轻量模型，精度仍显著优于对称方案

注：评估基于标准余弦相似度 + NDCG@10 指标，确保结果可复现、可比对。

云端 API：
voyage-4-large / voyage-4 / voyage-4-lite 已上线 Voyage API，前 2 亿 tokens 免费。MongoDB Atlas 用户可通过 Atlas 嵌入与重排 API 直接调用。
本地开源：
voyage-4-nano 已发布至 Hugging Face，Apache 2.0 许可，支持私有部署，欢迎社区贡献。