Open LLM Vtuber
Open LLM Vtuber

Open LLM Vtuber最新版

官方版无广告14

Open-LLM-VTuber通过强大的功能和高度的可定制性,为用户带来了一个生动、智能且个性化的AI虚拟伴侣。无论你是技术爱好者还是普通用户,都能轻松上手并享受与AI互动的乐趣。

更新日期:
2025年3月18日
语言:
中文
平台:

121MB0 人已下载 手机查看

Open-LLM-VTuber是一款独特的语音交互AI伴侣,结合了实时语音对话、视觉感知和生动的Live2D形象。它能够在你的电脑上完全离线运行,无需联网,确保隐私安全。无论是虚拟女友、男友、萌宠还是其他角色,Open-LLM-VTuber都能满足你的需求。

Open LLM Vtuber

项目支持Windows、macOS和Linux系统,并提供网页版和桌面客户端两种使用方式。桌面客户端特别支持透明背景的桌宠模式,让AI伴侣可以时刻陪伴在你的屏幕上的任意位置。

虽然长期记忆功能暂时下线(即将回归),但聊天记录的持久化存储功能确保了你可以随时继续之前的对话,不会丢失任何互动瞬间。

在后端支持方面,Open-LLM-VTuber集成了多种LLM对话引擎、文本转语音模型和语音识别方案。用户还可以通过角色定制指南,自定义AI伴侣的形象和人设。

功能亮点

🖥️ 跨平台支持

  • 完美支持Windows、macOS和Linux系统。
  • 支持英伟达和非英伟达GPU,可在CPU上运行,或使用云API处理资源密集型任务。
  • 部分组件在macOS上支持GPU加速。

🔒 离线模式

  • 使用本地模型完全离线运行,无需联网。
  • 对话内容仅存储在本地设备,确保隐私安全。

💻 网页版与桌面客户端

  • 提供网页版和桌面客户端两种使用方式。
  • 桌面客户端支持窗口模式和桌宠模式,可自由切换。
  • 支持丰富的交互功能和个性化设置。

🎯 高级交互功能

  • 👁️ 视觉感知:支持摄像头、屏幕录制和截图,AI伙伴可以“看到”你和你的屏幕。
  • 🎤 语音打断:无需耳机,AI不会听到自己的声音。
  • 🫱 触摸反馈:通过点击或拖拽与AI互动。
  • 😊 Live2D表情:设置情绪映射,让AI的表情由后端控制。
  • 🐱 宠物模式:支持透明背景全局置顶和鼠标穿透,可将AI拖到屏幕上的任意位置。
  • 🗣️ AI主动说话功能:AI可以主动发起对话。
  • 💭 AI内心OS:AI的表情、想法和动作可以被看到,但不会被读出来。
  • 💾 聊天记录持久化:随时切换到以前的对话。
  • 🌍 TTS翻译支持:支持多语言对话(如中文对话,AI使用日语声音)。

🧠 广泛的模型支持

  • 🤖 大语言模型 (LLM):Ollama、OpenAI(及兼容API)、Gemini、Claude、Mistral、DeepSeek、智谱、GGUF、LM Studio、vLLM等。
  • 🎙️ 语音识别 (ASR):sherpa-onnx、FunASR、Faster-Whisper、Whisper.cpp、Whisper、Groq Whisper、Azure ASR等。
  • 🔊 语音合成 (TTS):sherpa-onnx、pyttsx3、MeloTTS、Coqui-TTS、GPTSoVITS、Bark、CosyVoice、Edge TTS、Fish Audio、Azure TTS等。

🔧 高度可定制

  • ⚙️ 简单的模块配置:通过配置文件轻松切换功能模块,无需深入代码。
  • 🎨 角色随心定制:导入自定义Live2D模型,修改Prompt塑造AI人设,进行音色克隆。
  • 🧩 Agent自由实现:继承并实现Agent接口,接入HumeAI EVI、OpenAI Her、Mem0等架构。
  • 🔌 良好的可扩展性:模块化设计,轻松添加自定义LLM、ASR、TTS模块。

项目命名

Open-LLM-VTuber的命名源于项目的开发初衷:采用开源方案,在Windows以外的平台离线运行,复现闭源的AI Vtuber(如neuro-sama)。因此,它不仅是“AI伴侣”,更是一个具有独特视觉和语音交互能力的虚拟VTuber。

使用方式

  1. 下载与安装:从项目官网或GitHub下载适合你系统的版本。
  2. 配置:根据需求修改配置文件,选择适合的LLM、ASR和TTS模型。
  3. 启动:运行桌面客户端或网页版,开始与你的AI伴侣互动。
  4. 定制:导入自定义Live2D模型,修改Prompt或进行音色克隆,打造专属AI伴侣。

    相关软件

    Heygem

    Heygem - 最新版

    Heygem是一款专为Windows系统设计的全离线视频合成工具,它能够精确克隆您的外貌和声音,让您的形象数字化。您可以通过文字和语音驱动虚拟形象,进行视频制作。
    AigcPanel

    AigcPanel - 最新版

    AigcPanel 是一个一站式 AI 数字人系统,整合了多种开源模型,包括 CosyVoice、MuseTalk、LatentSync 和 Wav2Lip 等,旨在为用户提供简单易用的数字人生成和管理工具。它支持视频合成、声音合成、声音克隆等功能,简化了本地模型管理,并提供一键导入和使用 AI 模型的能力。

    暂无评论

    none
    暂无评论...