谷歌首个正式版 Gemini Embedding文本嵌入模型(gemini-embedding-001) 现已在 Gemini API 和 Vertex AI 平台对开发者全面开放使用。

自今年三月以实验性版本推出以来,该嵌入模型在 Massive Text Embedding Benchmark(MTEB)多语言排行榜 中持续领先,展现出强大的通用性与性能优势。
模型能力亮点
✅ 多任务表现优异
gemini-embedding-001 在多种自然语言处理任务中均表现出色,包括但不限于:
- 语义检索
- 文本分类
- 相似度匹配
- 内容理解
相比此前的文本嵌入模型以及部分外部商业模型,它在科学、法律、金融和编程等多个领域都实现了显著提升,提供统一且前沿的嵌入体验。

技术特性一览
| 特性 | 描述 |
|---|---|
| 语言支持 | 支持超过 100 种语言 |
| 最大输入长度 | 最长支持 2048 tokens |
| 输出维度 | 默认为 3072 维,支持动态调整至更低维度(如 1536、768),便于优化性能与存储成本 |
| 核心技术 | 基于 Matryoshka Representation Learning(MRL)架构,实现高质量嵌入效果 |
谷歌推荐在需要高质量结果的场景下使用 3072、1536 或 768 维输出。
定价与使用方式
Gemini Embedding 的定价为:
- 每百万 token 输入:0.15 美元
谷歌在 Gemini API 中提供免费试用额度与付费层级,您可以先免费试用,再根据实际需求选择合适的调用限制。
如何开始?
您可以通过以下方式快速接入:
- 访问 Google AI Studio 开始免费使用
- 使用
embed_content接口即可兼容现有代码逻辑
文档与资源
为了帮助开发者顺利上手,谷歌提供了以下资源:
这些资料将帮助您快速集成并测试新模型的表现。
模型弃用计划提醒
随着 gemini-embedding-001 的正式上线,一些旧版本模型将在未来逐步停用:
| 模型名称 | 停用时间 |
|---|---|
| gemini-embedding-exp-03-07 | 已不再受支持 |
| embedding-001 | 2025年8月14日 |
| text-embedding-004 | 2026年1月14日 |
谷歌建议尽早将项目迁移至最新版本模型,以确保服务稳定性和最佳性能。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...















