谷歌Gemini 2.5正式退出预览:性能提升、成本降低,面向开发者全面可用

早报6个月前发布 小马良
216 0

2025年6月17日,谷歌宣布其Gemini系列模型中的 Gemini 2.5 Pro 和 Gemini 2.5 Flash 正式退出预览阶段,并推出 Gemini 2.5 Flash-Lite 的预览版。这一更新标志着Gemini系列在稳定性与实用性方面迈出了重要一步。

目前,Gemini系列已全面上线 Google AI Studio、Vertex AI、Gemini 应用以及搜索功能中,为开发者和企业用户提供更高效、灵活的大模型服务。

🚀 主要更新亮点

✅ 更强的性能与更低的成本

  • 响应更快:Gemini 2.5 Flash-Lite 针对高吞吐量、低延迟场景设计,回答时间低于 100毫秒
  • 成本更低:每 token 成本较前代模型进一步下降。
  • 效率提升:Flash 系列模型采用混合Transformer+检索架构,现在每次回复所需的 token 数量减少 20%-30%

✅ 持续支持百万级上下文窗口

Gemini 2.5 全系模型继续保持 100万个token 的超长上下文窗口,适用于复杂任务处理,如长文档分析、多轮对话及代码生成。

💡 新增功能详解

🔍 Gemini 2.5 Pro:Deep Think 模式上线

  • Deep Think 模式:专为解决复杂问题设计,例如数学推导、代码调试、科学建模等,能够探索多个假设路径。
  • 原生音频输出:支持直接生成语音输出,拓展了在语音助手、教育、客服等场景的应用。
  • Project Mariner:新增对计算机操作的支持,能模拟用户界面交互,用于自动化测试或辅助开发。
  • 安全增强:增强了对“间接提示注入攻击”的防护能力,提升模型在敏感环境下的安全性。

🧠 Gemini 2.5 Flash-Lite:轻量高效的新成员

作为Flash系列的最新版本,Flash-Lite 在编码、数学和多模态任务上均优于此前的 Gemini 2.0 Flash-Lite,适合大规模部署和高频调用场景。

📊 性能表现优异

在多个权威评测中,Gemini 2.5 表现亮眼:

  • WebDev Arena 编码排行榜:获得 1415 ELO 分,领先同类模型。
  • LMArena 偏好测试:在人类偏好评估中排名首位。

这些成绩表明,Gemini 2.5 在代码理解、多模态推理和自然语言生成等方面具备显著优势。

🧩 开发者友好与企业应用

此次发布的稳定版本不仅面向普通用户开放使用,也为开发者和企业提供了更多选项:

  • 生产级稳定性:适合构建长期运行的企业级AI应用。
  • 预算型模型(Flash):平衡性能与成本,适合资源受限项目。
  • 前沿模式限制访问:确保关键任务的安全性和可控性。

谷歌表示,这种层级化的模型策略有助于满足不同用户的多样化需求。

📈 合作伙伴反馈与落地进展

在测试期间,多家公司已将Gemini 2.5应用于实际业务中,包括:

  • Spline
  • Rooms
  • Snap
  • SmartBear

这些企业在图像生成、内容创作、软件测试等多个领域验证了Gemini 2.5的实用价值。

© 版权声明

相关文章

暂无评论

none
暂无评论...