Stable Diffusion绘画实用工具

UI工具

Stable Diffusion web UI

由AUTOMATIC1111开发的Stable Diffusion web UI是最先流行的SD前端工具,此工具是基于 Gradio 库的SD UI界面

ComfyUI

ComfyUI采用模块化涉及,基于基于图形/节点/流程图的界面设计使得其功能异常强大。

Fooocus

Fooocus基于Gradio的SD绘画软件,其功能和界面设计参考了Midjourney,优点是对电脑性能要求低,上手门槛低。

InvokeAI

InvokeAI号称是面向专业人士的 AI 绘画工具,支持 Docker安装,其界面设计比较像官方的DreamStudio。

StableSwarmUI

StableSwarmUI是Stability.ai完全基于ComfyUI开发,为ComfyUI套了个更漂亮的用户界面。

OnnxStack

OnnxStack是基于.NET开发,可以与ONNX Runtime 和 Microsoft ML 无缝集成,支持AMD和英特尔显卡使用。

朱雀大模型检测

朱雀大模型检测

腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
Open ASR 排行榜

Open ASR 排行榜

Open ASR 排行榜 对 Hugging Face Hub 上的语音识别模型进行排名和评估。我们报告平均 WER(字错误率)(⬇️ 越低越好)和 RTFx(实时因子)(⬆️ 越高越好),模型根据其平均 WER 从低到高进行排名。
Magi

Magi

MAGI-1是由Sand AI研究团队开发的一种新型视频生成模型。该模型通过自回归预测视频块序列来生成视频,每个视频块由固定长度的连续帧组成。这是首个具有顶级质量输出的自回归视频模型,而且还是开源的,目前Sand AI还推出了视频生成平台Magi,不过目前仅支持图生视频。
Tripo

Tripo

Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
Qwen Chat

Qwen Chat

Qwen Chat是阿里通义团队在海外市场推出了一款全新的AI助手,可以看作是通义千问的海外版,这款助手基于开源的Open WebUI框架开发而成。
Higgsfield AI

Higgsfield AI

Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
查看完整榜单