Lemonade
Lemonade

Lemonade最新版

官方版无广告189

Lemonade 是一个开源平台,专注于让用户在本地运行大语言模型。它利用先进的硬件如 NPU 和 Vulkan GPU 加速,提供快速响应和高效性能,适合个人电脑环境。Lemonade 由 AMD 赞助,采用 Apache 2.0 许可。

更新日期:
2025年7月17日
语言:
中文
平台:

811KB0 人已下载 手机查看

你是否希望在自己的电脑上轻松运行大语言模型(LLMs),而无需依赖远程服务器?Lemonade 正是为此而生的一个开源项目,它专注于提升本地推理性能,尤其支持 AMD 平台下的 NPU 和 Vulkan GPU 加速。

该项目由 AMD 赞助开发,提供 CLI 命令行工具、API 接口以及图形界面,致力于为用户提供一个“开箱即用”的本地 LLM 使用体验。

官网将其定义为:“Refreshingly fast LLMs on GPUs and NPUs”,强调其在本地运行的速度与效率优势。

为什么选择 Lemonade?

在当前大模型普遍依赖云端部署的背景下,Lemonade 提供了一个轻量级、高性能、且注重隐私的替代方案:

  • ✅ 支持多种硬件加速:包括 AMD Ryzen AI 系列 NPU 和 Radeon GPU(通过 Vulkan)
  • ✅ 易于使用:提供 GUI、CLI 和 OpenAI 兼容 API
  • ✅ 支持主流模型格式:GGUF 和 ONNX
  • ✅ 本地化运行:无需联网、无额外费用、保护用户数据隐私

安装方式灵活,适配不同用户需求

Lemonade 提供了多种安装方式,满足从普通用户到开发者的不同需求:

🖥️ 图形界面安装(Windows)

适合不想折腾命令行的用户:

🧰 命令行安装(CLI)

适合开发者和高级用户:

pip install lemonade-server

或从源码编译安装,详见官方文档:Install Options

快速上手指南

  • 安装完成后启动服务
  • 拉取模型(以 Gemma-3-4b-it-GGUF 为例):
    lemonade-server pull Gemma-3-4b-it-GGUF
  • 运行模型
    lemonade-server run Gemma-3-4b-it-GGUF
  • 访问内置聊天界面 或通过 CLI 进行交互

其他常用命令:

  • 列出已支持模型:
    lemonade-server list
  • 源码安装时使用 lemonade-server-dev 前缀

支持硬件与模型格式一览

硬件类型支持平台操作系统引擎支持
CPU所有平台Windows, LinuxOGA、llamacpp、HF
GPUVulkanWindows, Linux✅(Ryzen AI 7000/8000/300,Radeon 7000/9000)
NPUAMD Ryzen AI 300-

✅ 支持模型格式

  • GGUF(基于 llama.cpp 的量化模型)
  • ONNX(通用神经网络交换格式)

完整模型库详见:Model Documentation
自定义模型可通过模型管理器导入(访问 http://localhost:8000/#model-management)

开放接口,便于集成

Lemonade 提供了兼容 OpenAI 标准的 API 接口,方便开发者接入已有工具链:

  • 基础 URLhttp://localhost:8000/api/v1
  • 默认 API Keylemonade(仅需填写,不用于验证)

这意味着你可以直接使用 openai-python 等客户端库调用本地模型,实现无缝迁移。

此外还提供:

未来计划:提升桌面端集成体验

Lemonade 团队正在推进多个增强功能,其中一项关键路线图任务是:

开发原生消息主机,取代当前基于 WebSocket 的桥接机制,以提高与桌面客户端(如 Cursor、Claude Desktop)连接的稳定性与性能。

这将进一步降低本地 AI 工具链的使用门槛,推动更多开发者采用本地运行模式。

相关软件

Cortex

Cortex - 最新版

Cortex 是一款类似于 Ollama 的开源命令行软件,专为运行大语言模型而设计。它通过简洁的命令行操作,让用户能够快速启动和运行大型语言模型,支持 macOS、Windows 和 Linux 等多种操作系统。
llama.cpp

llama.cpp - 最新版

llama.cpp 是一个轻量、高效的开源 AI 项目,适合在各种硬件上运行 LLM,提供丰富的工具和后端支持,开发者可通过 CLI 和 HTTP 服务器轻松使用。它支持模型微调、量化技术,并与 Hugging Face 和 ModelScope 等平台无缝集成,是构建 AI 应用程序的理想选择。
BrowserBee

BrowserBee - 最新版

BrowserBee 是一款注重隐私的开源 Chrome 扩展,允许您使用自然语言控制浏览器。它结合了大语言模型 (LLM) 的指令解析与规划能力以及 Playwright 的强大浏览器自动化功能来完成任务。 由于 BrowserBee 完全在浏览器内运行(除了 LLM 外),它可以安全地与登录的网站交互,而不会影响安全性或需要后端基础设施。

暂无评论

none
暂无评论...