Open-LLM-VTuber是一款独特的语音交互AI伴侣,结合了实时语音对话、视觉感知和生动的Live2D形象。它能够在你的电脑上完全离线运行,无需联网,确保隐私安全。无论是虚拟女友、男友、萌宠还是其他角色,Open-LLM-VTuber都能满足你的需求。

项目支持Windows、macOS和Linux系统,并提供网页版和桌面客户端两种使用方式。桌面客户端特别支持透明背景的桌宠模式,让AI伴侣可以时刻陪伴在你的屏幕上的任意位置。
虽然长期记忆功能暂时下线(即将回归),但聊天记录的持久化存储功能确保了你可以随时继续之前的对话,不会丢失任何互动瞬间。
在后端支持方面,Open-LLM-VTuber集成了多种LLM对话引擎、文本转语音模型和语音识别方案。用户还可以通过角色定制指南,自定义AI伴侣的形象和人设。
功能亮点
🖥️ 跨平台支持
- 完美支持Windows、macOS和Linux系统。
- 支持英伟达和非英伟达GPU,可在CPU上运行,或使用云API处理资源密集型任务。
- 部分组件在macOS上支持GPU加速。
🔒 离线模式
- 使用本地模型完全离线运行,无需联网。
- 对话内容仅存储在本地设备,确保隐私安全。
💻 网页版与桌面客户端
- 提供网页版和桌面客户端两种使用方式。
- 桌面客户端支持窗口模式和桌宠模式,可自由切换。
- 支持丰富的交互功能和个性化设置。
🎯 高级交互功能
- 👁️ 视觉感知:支持摄像头、屏幕录制和截图,AI伙伴可以“看到”你和你的屏幕。
- 🎤 语音打断:无需耳机,AI不会听到自己的声音。
- 🫱 触摸反馈:通过点击或拖拽与AI互动。
- 😊 Live2D表情:设置情绪映射,让AI的表情由后端控制。
- 🐱 宠物模式:支持透明背景全局置顶和鼠标穿透,可将AI拖到屏幕上的任意位置。
- 🗣️ AI主动说话功能:AI可以主动发起对话。
- 💭 AI内心OS:AI的表情、想法和动作可以被看到,但不会被读出来。
- 💾 聊天记录持久化:随时切换到以前的对话。
- 🌍 TTS翻译支持:支持多语言对话(如中文对话,AI使用日语声音)。
🧠 广泛的模型支持
- 🤖 大语言模型 (LLM):Ollama、OpenAI(及兼容API)、Gemini、Claude、Mistral、DeepSeek、智谱、GGUF、LM Studio、vLLM等。
- 🎙️ 语音识别 (ASR):sherpa-onnx、FunASR、Faster-Whisper、Whisper.cpp、Whisper、Groq Whisper、Azure ASR等。
- 🔊 语音合成 (TTS):sherpa-onnx、pyttsx3、MeloTTS、Coqui-TTS、GPTSoVITS、Bark、CosyVoice、Edge TTS、Fish Audio、Azure TTS等。
🔧 高度可定制
- ⚙️ 简单的模块配置:通过配置文件轻松切换功能模块,无需深入代码。
- 🎨 角色随心定制:导入自定义Live2D模型,修改Prompt塑造AI人设,进行音色克隆。
- 🧩 Agent自由实现:继承并实现Agent接口,接入HumeAI EVI、OpenAI Her、Mem0等架构。
- 🔌 良好的可扩展性:模块化设计,轻松添加自定义LLM、ASR、TTS模块。
项目命名
Open-LLM-VTuber的命名源于项目的开发初衷:采用开源方案,在Windows以外的平台离线运行,复现闭源的AI Vtuber(如neuro-sama)。因此,它不仅是“AI伴侣”,更是一个具有独特视觉和语音交互能力的虚拟VTuber。
使用方式
- 下载与安装:从项目官网或GitHub下载适合你系统的版本。
- 配置:根据需求修改配置文件,选择适合的LLM、ASR和TTS模型。
- 启动:运行桌面客户端或网页版,开始与你的AI伴侣互动。
- 定制:导入自定义Live2D模型,修改Prompt或进行音色克隆,打造专属AI伴侣。