Gemini Embedding 正式上线:支持多语言、灵活维度,现已全面可用

大语言模型5个月前发布 小马良
189 0

谷歌首个正式版 Gemini Embedding文本嵌入模型(gemini-embedding-001) 现已在 Gemini API  Vertex AI 平台对开发者全面开放使用。

自今年三月以实验性版本推出以来,该嵌入模型在 Massive Text Embedding Benchmark(MTEB)多语言排行榜 中持续领先,展现出强大的通用性与性能优势。

模型能力亮点

✅ 多任务表现优异

gemini-embedding-001 在多种自然语言处理任务中均表现出色,包括但不限于:

  • 语义检索
  • 文本分类
  • 相似度匹配
  • 内容理解

相比此前的文本嵌入模型以及部分外部商业模型,它在科学、法律、金融和编程等多个领域都实现了显著提升,提供统一且前沿的嵌入体验。

技术特性一览

特性描述
语言支持支持超过 100 种语言
最大输入长度最长支持 2048 tokens
输出维度默认为 3072 维,支持动态调整至更低维度(如 1536、768),便于优化性能与存储成本
核心技术基于 Matryoshka Representation Learning(MRL)架构,实现高质量嵌入效果

谷歌推荐在需要高质量结果的场景下使用 3072、1536 或 768 维输出。

定价与使用方式

Gemini Embedding 的定价为:

  • 每百万 token 输入:0.15 美元

谷歌在 Gemini API 中提供免费试用额度与付费层级,您可以先免费试用,再根据实际需求选择合适的调用限制。

如何开始?

您可以通过以下方式快速接入:

  • 访问 Google AI Studio 开始免费使用
  • 使用 embed_content 接口即可兼容现有代码逻辑

文档与资源

为了帮助开发者顺利上手,谷歌提供了以下资源:

这些资料将帮助您快速集成并测试新模型的表现。

模型弃用计划提醒

随着 gemini-embedding-001 的正式上线,一些旧版本模型将在未来逐步停用:

模型名称停用时间
gemini-embedding-exp-03-07已不再受支持
embedding-0012025年8月14日
text-embedding-0042026年1月14日

谷歌建议尽早将项目迁移至最新版本模型,以确保服务稳定性和最佳性能。

© 版权声明

相关文章

暂无评论

none
暂无评论...