英伟达推出实时语音对话模型PersonaPlex,打造支持自定义角色与声音的自然对话AI
长期以来,语音对话 AI 面临一个根本性矛盾: 传统级联系统(ASR → LLM → TTS)允许你自定义角色和声音,但对话僵硬、延迟高、无法被打断; 全双工模型(如 Moshi)实现了自然的话轮转换...
UI-Decorators:ComfyUI 前端子图增强工具集,提升 ComfyUI 子图可读性
在 ComfyUI 的工作流搭建中,子图(SubGraph)的组织与可读性往往直接影响操作效率。UI-Decorators 是一套专为 ComfyUI 设计的轻量工具集,内置4个实用节点,核心作用是增...
Ollama 新增图像生成功能!macOS 率先体验,双模型(Z-Image Turbo 与 FLUX.2 Klein)支持中英文本渲染 + 高精度创作
Ollama 正式上线图像生成实验性功能,目前已在 macOS 系统开放使用,Windows 和 Linux 版本也即将推出。该功能无需复杂配置,仅需一行终端命令就能调用文生图模型生成图像,支持直接在...
LightOn AI推出的第二代模型 LightOnOCR-2-1B:1B 参数端到端 OCR 模型,支持边界框输出
在文档数字化处理领域,兼顾高精度转录、轻量化部署、高效推理的OCR模型一直是行业刚需。LightOn AI推出的第二代模型 LightOnOCR-2-1B,以1B参数量实现端到端PDF文档转写能力,不...
FlashLabs推出Chroma 1.0:首个开源实时语音对话模型,支持低延迟个性化语音克隆
在虚拟人交互与语音合成领域,兼顾低延迟、高保真语音克隆、多轮对话理解的模型一直是技术难点。由FlashLabs开发的 Chroma 1.0 正是一款突破性的多模态因果语言模型,它不仅能直接处理音频输入...
ComfyUI_FL-HeartMuLa:原生优化的多语言 AI 歌曲生成节点,支持中英日韩西歌词
此前我们介绍过HeartMuLa_ComfyUI这款插件,你可能被其高显存占用劝退。现在,ComfyUI_FL-HeartMuLa 提供了更好的选择——这是一个原生开发、显存优化的 ComfyUI 节...
ComfyUI-Flux2Klein-Enhancer:精准调控 FLUX.2 Klein 提示词响应的增强节点
如果你正在使用 FLUX.2 Klein 9B 模型进行文生图或图像编辑,你可能遇到过这些问题: 复杂提示词中某些概念被忽略 图像编辑时原始内容保留过多或丢失过快 难以平衡主体、细节与风格的生成权重 ...
纳德拉警告 AI 需证明“有用性”,微软却正将 Copilot 塞进记事本
在瑞士达沃斯世界经济论坛上,微软 CEO 萨提亚·纳德拉发出了一则耐人寻味的警告: “如果 AI 不能为个人、社区和行业带来实际成果,我们将很快失去社会许可——去获取能源等稀缺资源,只为生成更多 to...
智谱发布 GLM-4.7-Flash:30B 级 MoE 模型,本地部署首选编码与代理助手
智谱 AI 正式推出 GLM-4.7-Flash——一款基于 30B 总参数、激活 3B(A3B)的稀疏混合专家(MoE)架构 的大语言模型。它在高性能与高效率之间取得出色平衡,成为本地部署场景下理想...
FIBO Edit 上线 ComfyUI:基于授权数据的 JSON 原生图像编辑,商业使用安全
ComfyUI 官方宣布,Bria AI 的 FIBO Edit 模型现已通过合作伙伴节点集成至 ComfyUI。这是一款专为生产环境设计的图像编辑模型,其最大亮点在于:完全基于 100% 授权数据训...















