小马良

帅气的我简直无法用语言描述！

文章3889 网址1230 模型98 软件290 评论3

已发布3889

英伟达推出实时语音对话模型PersonaPlex，打造支持自定义角色与声音的自然对话AI

长期以来，语音对话 AI 面临一个根本性矛盾：传统级联系统（ASR → LLM → TTS）允许你自定义角色和声音，但对话僵硬、延迟高、无法被打断；全双工模型（如 Moshi）实现了自然的话轮转换...

1周前

0210

UI-Decorators：ComfyUI 前端子图增强工具集，提升 ComfyUI 子图可读性

在 ComfyUI 的工作流搭建中，子图（SubGraph）的组织与可读性往往直接影响操作效率。UI-Decorators 是一套专为 ComfyUI 设计的轻量工具集，内置4个实用节点，核心作用是增...

插件 # ComfyUI # UI-Decorators # 子图

1周前

0230

Ollama 新增图像生成功能！macOS 率先体验，双模型（Z-Image Turbo 与 FLUX.2 Klein）支持中英文本渲染 + 高精度创作

Ollama 正式上线图像生成实验性功能，目前已在 macOS 系统开放使用，Windows 和 Linux 版本也即将推出。该功能无需复杂配置，仅需一行终端命令就能调用文生图模型生成图像，支持直接在...

工具 # LUX.2 Klein # Ollama # Z-Image-Turbo

1周前

0240

LightOn AI推出的第二代模型 LightOnOCR-2-1B：1B 参数端到端 OCR 模型，支持边界框输出

在文档数字化处理领域，兼顾高精度转录、轻量化部署、高效推理的OCR模型一直是行业刚需。LightOn AI推出的第二代模型 LightOnOCR-2-1B，以1B参数量实现端到端PDF文档转写能力，不...

多模态模型 # LightOn AI # LightOnOCR-2-1B # OCR 模型

1周前

0520

FlashLabs推出Chroma 1.0：首个开源实时语音对话模型，支持低延迟个性化语音克隆

在虚拟人交互与语音合成领域，兼顾低延迟、高保真语音克隆、多轮对话理解的模型一直是技术难点。由FlashLabs开发的 Chroma 1.0 正是一款突破性的多模态因果语言模型，它不仅能直接处理音频输入...

语音模型 # Chroma # FlashLabs # 实时语音对话模型

1周前

03800

ComfyUI_FL-HeartMuLa：原生优化的多语言 AI 歌曲生成节点，支持中英日韩西歌词

此前我们介绍过HeartMuLa_ComfyUI这款插件，你可能被其高显存占用劝退。现在，ComfyUI_FL-HeartMuLa 提供了更好的选择——这是一个原生开发、显存优化的 ComfyUI 节...

插件 # AI音乐 # ComfyUI_FL-HeartMuLa # HeartMuLa

1周前

0220

ComfyUI-Flux2Klein-Enhancer：精准调控 FLUX.2 Klein 提示词响应的增强节点

如果你正在使用 FLUX.2 Klein 9B 模型进行文生图或图像编辑，你可能遇到过这些问题：复杂提示词中某些概念被忽略图像编辑时原始内容保留过多或丢失过快难以平衡主体、细节与风格的生成权重 ...

插件 # ComfyUI-Flux2Klein-Enhancer # FLUX.2 Klein 9B

1周前

0330

纳德拉警告 AI 需证明“有用性”，微软却正将 Copilot 塞进记事本

在瑞士达沃斯世界经济论坛上，微软 CEO 萨提亚·纳德拉发出了一则耐人寻味的警告： “如果 AI 不能为个人、社区和行业带来实际成果，我们将很快失去社会许可——去获取能源等稀缺资源，只为生成更多 to...

早报 # AI # Copilot # 微软

1周前

0160

智谱发布 GLM-4.7-Flash：30B 级 MoE 模型，本地部署首选编码与代理助手

智谱 AI 正式推出 GLM-4.7-Flash——一款基于 30B 总参数、激活 3B（A3B）的稀疏混合专家（MoE）架构的大语言模型。它在高性能与高效率之间取得出色平衡，成为本地部署场景下理想...

大语言模型 # GLM-4.7-Flash # 智谱

1周前

0340

FIBO Edit 上线 ComfyUI：基于授权数据的 JSON 原生图像编辑，商业使用安全

ComfyUI 官方宣布，Bria AI 的 FIBO Edit 模型现已通过合作伙伴节点集成至 ComfyUI。这是一款专为生产环境设计的图像编辑模型，其最大亮点在于：完全基于 100% 授权数据训...

工作流 # BRIA AI # FIBO Edit # 图像编辑

1周前

0230

加载更多

小马良

英伟达推出实时语音对话模型PersonaPlex，打造支持自定义角色与声音的自然对话AI

UI-Decorators：ComfyUI 前端子图增强工具集，提升 ComfyUI 子图可读性

Ollama 新增图像生成功能！macOS 率先体验，双模型（Z-Image Turbo 与 FLUX.2 Klein）支持中英文本渲染 + 高精度创作

LightOn AI推出的第二代模型 LightOnOCR-2-1B：1B 参数端到端 OCR 模型，支持边界框输出

FlashLabs推出Chroma 1.0：首个开源实时语音对话模型，支持低延迟个性化语音克隆

ComfyUI_FL-HeartMuLa：原生优化的多语言 AI 歌曲生成节点，支持中英日韩西歌词

ComfyUI-Flux2Klein-Enhancer：精准调控 FLUX.2 Klein 提示词响应的增强节点

纳德拉警告 AI 需证明“有用性”，微软却正将 Copilot 塞进记事本

智谱发布 GLM-4.7-Flash：30B 级 MoE 模型，本地部署首选编码与代理助手

FIBO Edit 上线 ComfyUI：基于授权数据的 JSON 原生图像编辑，商业使用安全

Clawdbot/Moltbot

Situation Monitor

Higgsfield AI

新QoderWork

Fogsight (雾象)

ITELLOU