谷歌在今年的 I/O 2025 大会上,正式推出了其最新的开源多模态语言模型 Gemma 3n。这款模型专为手机、平板和笔记本电脑等终端设备设计,在性能、内存占用和多模态能力方面均有显著提升,被认为是目前最适合本地运行的 AI 模型之一。

与此同时,谷歌还上线了一款名为 Google AI Edge Gallery 的安卓应用,帮助开发者和普通用户更方便地在本地设备上运行这些前沿模型。本文将为你详细介绍 Gemma 3n 的核心特性以及 Google AI Edge Gallery 的使用方式。
Gemma 3n:轻量但强大,支持视频理解
虽然 Gemma 3n 是一个只有 5B 参数的模型,但它却具备处理音频、文本、图像甚至视频的能力,内存占用也仅相当于传统 2B 模型的水平。
主要优势包括:
- 响应速度提升约 1.5 倍:在移动设备上的推理效率更高。
- 低内存占用:通过逐层嵌入、键值缓存共享等技术优化资源消耗。
- 多模态能力:不仅限于文本处理,还能理解图像、音频和视频内容。
- 系统集成计划:未来将内置到 Android 和 Chrome 系统中,带来更广泛的落地场景。

Google AI Edge Gallery:本地AI体验的新平台
为了更好地推广和测试本地模型的应用效果,谷歌推出了实验性应用 Google AI Edge Gallery。该应用目前已推出Android版,iOS 版本正在开发中。

核心功能一览:
📱 完全离线运行
所有生成式AI任务均在本地完成,无需联网即可使用。
🤖 多模型切换
支持从 Hugging Face 下载并切换不同模型,便于对比性能差异。
🖼️ 图像提问
上传图片后,可通过文字提问获取描述、识别物体或解决图像中的问题(如数学题)。
✍️ 提示实验室
提供多种单轮任务模板,包括自由提示、文本总结、语气重写、代码生成等。
💬 AI聊天
支持多轮对话交互,保留上下文信息,模拟真实对话场景。
📊 性能统计
实时查看模型推理过程中的关键指标,如首次生成时间(TTFT)、解码速度、延迟等。
🧩 本地模型支持
可导入 LiteRT 格式的 .task 模型文件,进行本地测试。
🔗 开发者友好
提供模型卡、源码链接等资源,方便开发者进一步研究和部署。
🏁 快速上手
几分钟内即可完成安装与配置,开始探索各类AI功能。
如何下载与安装?
1. 下载 APK 文件
此APP是开源的,目前没有上架Google Play应用商店,需要从GitHub页面下载

2. 安装方法(推荐直接安装)
- 将 APK 文件发送到手机上,点击 APK 文件进行安装;
- 若提示“未知来源”,请在设置中开启允许安装未知来源应用;
- 确认安装即可。

应用界面说明
打开应用后,主界面会展示多个功能模块,点击即可进入对应功能页:
- 主屏幕:选择功能入口(如“图像提问”、“AI聊天”、“提示实验室”)。
- 模型选择:选择已下载或在线下载模型。

- 任务界面:根据所选功能执行具体操作。
- 设置/参数:调整模型推理参数,如 CPU/GPU 切换、温度设置等。本人使用红米K70手机,GPU运行速度会比CPU快不少。

模型管理与本地导入
下载与尝试模型
- 选择功能时,系统会列出兼容模型;
- 若模型未下载,点击“下载”按钮;
- 下载完成后,“下载”变为“尝试”,即可使用;
- 登录 Hugging Face 并接受许可条款后,方可下载部分受限制模型。

删除模型
- 在模型选择界面,点击模型旁的删除图标即可卸载。
导入本地模型
1.如果你的网络环境不允许在线下载模型,可以从本人提供的网盘下载
2. 打开应用,点击右下角“+”号;
3. 选择 .task
模型文件;
4. 配置参数(是否支持图像、CPU/GPU偏好);
5. 完成导入后即可正常使用。



核心功能使用指南
🖼️ 图像提问(Ask Image)
- 进入“图像提问”功能;
- 选择支持多模态的模型(如 Gemma 3n);
- 调整参数(可选);
- 上传图片或者拍照,输入问题,如“图中有什么?”、“帮我分析这个图表”;
- 查看输出结果,并可复制或查看性能数据。

✍️ 提示实验室(单轮任务,Prompt Lab)
- 点击“提示实验室”;
- 选择合适的模型;
- 从模板中选择任务类型(自由提示、总结、语气重写、代码生成);
- 输入提示词或文本,点击“发送”;
- 获取生成结果并查看统计信息。

💬 AI聊天(多轮对话,AI Chat)
- 点击“AI聊天”;
- 选择模型;
- 在输入框中发起对话;
- 模型将保留上下文,持续回应;
- 可随时查看每一轮的性能表现。

常见问题解答
❓ 是否有 iOS 版本?
✅ 当前仅支持 Android,iOS 版本即将推出。
❓ 是否会登陆 Play Store 或 App Store?
✅ 目前是 GitHub 发布的实验 Alpha 版,后续将上线各大应用商店。
❓ 模型来自哪里?
✅ 多数模型来自 Hugging Face LiteRT 社区或 Google AI Edge 官方渠道,应用内附有模型卡链接供查阅。
❓ 模型下载失败怎么办?
✅ 检查网络连接,确认 Hugging Face 登录状态及许可协议是否已接受。
❓ 应用崩溃或性能不佳?
✅ 尝试重启应用;性能表现因设备硬件和模型大小而异,可在“统计”中查看详细指标。本人使用红米K70手机,回复速度不错,但对于手机温度上升也快。