今日,谷歌宣布其 Gemini 模型系列迎来重大更新:Gemini 2.5 Pro 和 Gemini Flash 正式进入稳定版本,并面向所有用户全面开放。同时,谷歌还推出了一个全新的轻量级模型 —— Gemini Flash-Lite(预览版),专为处理“大规模分类和总结”等高吞吐任务设计。
此次更新不仅在性能和可用性上进行了显著提升,还带来了一项令人瞩目的新功能:Gemini 现已支持视频上传与分析功能。
🚀 Gemini 2.5 Flash-Lite 预览上线
除了 Pro 与 Flash 的稳定发布,谷歌同步推出了适用于高吞吐量场景的轻量模型 —— Gemini Flash-Lite。该模型目前处于预览阶段,主打更低的成本与更快的响应速度,适用于以下应用场景:
- 大规模文本分类
- 自动摘要生成
- 实时数据筛选与过滤
这一新成员进一步丰富了 Gemini 系列的产品线,满足从开发者到企业用户的多样化需求。
🎥 新增视频上传与分析功能
用户现在可以在安卓版 Gemini 应用中直接上传本地视频进行分析。操作方式类似于添加图片:点击“+”按钮后,即可从图库中选择视频片段。

上传后,用户可以要求 Gemini 对视频内容进行:
- 整体概述
- 特定物品识别
- 关键时间点查找
Gemini 不仅会以文字形式反馈结果,还会在回复上方展示视频的相关片段截图,帮助用户更直观地理解分析内容。
需要注意的是,由于视频体积和复杂度较高,Gemini 的分析可能需要一定时间完成,具体取决于视频长度和服务器负载情况。
🔁 视频功能是对 YouTube 总结能力的延伸
Gemini 的视频分析功能是对其现有能力的一次重要扩展。此前,Gemini 已能通过链接总结 YouTube 视频内容,如今则进一步支持本地视频文件上传与解析,极大提升了实用性和灵活性。
不过,目前 Gemini 尚不支持直接录制视频,摄像头界面仍只允许拍摄照片并附加至提示词中。
💡 Gemini 视频功能上线平台
目前,Gemini 的视频上传与分析功能已在以下平台上线:
- 安卓端 Gemini App
- Gemini 网页版
这意味着,无论是移动办公、学习辅助还是内容整理,用户都可以借助 Gemini 的视觉理解能力,更高效地处理视频信息。
📊 Gemini 在 AI 助手竞争中的优势
随着视频分析功能的加入,Gemini 在与竞品如 OpenAI 的 ChatGPT 的比拼中又添一强项。
虽然 ChatGPT 支持实时摄像头画面分析(类似 Gemini Live),也能处理图像、PDF 和文档文件,但目前仍不支持本地视频上传与分析。相比之下,Gemini 在多媒体理解方面展现出更强的综合能力。















