Stable Cascade

Estimated reading: 1 minute 1146 views

Stability AI在2月14日发布了基于Würstchen架构的文生图模型——Stable Cascade。好消息是,ComfyUI已在本周末的更新中正式支持Stable Cascade,官方还释出了Stable Cascade工作流,使用方法非常简单。

Stable Cascade与现有的Stable Diffusion系列模型有所不同。Stable Cascade的构建基于一个流水线,该流水线由三个独立模型——Stages A、B和C组成。若需详细了解Stable Cascade模型,请参阅《Stability AI发布新模型Stable Cascade》一文

1、更新ComfyUI

首先,请确保您的ComfyUI已更新至最新版本

2、下载模型

访问官方的Stable Cascade模型下载页面,下载stage_b.safetensorsstage_c.safetensors模型

  • 将这两个模型文件放置在ComfyUI/models/unet目录下;同样地,下载stage_a.safetensors模型并将其放在ComfyUI/models/vae目录中
  • 下载CLIP模型,并将其重命名为clip_g_sdxl.fp16.safetensors,然后将其放置在ComfyUI/models/clip目录下

3、加载工作流

将官方提供的工作流文件直接拖放到ComfyUI界面上,加载后界面将如下所示:

点击放大进行查看

4、生成图片

  • 初次使用工作流生成图片时,可能会稍慢一些,但随后的生成速度将恢复正常
  • 在我的4070显卡上,使用官方工作流生成一张1024分辨率的图片大约需要14秒

注意:如果你的显卡和内存配置不太好,可以尝试bf16模型来进行生成.

名词解释:在深度学习与AI中,bfloat16(BF16)是一种半精度浮点格式,它用16位存储数值,通过优化指数部分的位宽来保持对大动态范围的支持,与FP32相似。在处理大型模型时,诸如stage_b_bf16.safetensors这样的表述意味着模型参数及中间结果可能以bfloat16格式存于安全张量内,从而减小内存使用、加快计算速度,并确保训练和推理的有效性。这种技术旨在充分利用现代GPU或TPU的BF16硬件加速特性,在不明显降低模型性能的同时提高资源效率。

生成效果

使用OpenAI最新发布的Sora模型在文生图模式所使用的提示词,大家对比看看,那个效果好?

提示词:Close-up portrait shot of a woman in autumn, extreme detail, shallow depth of field

左边是Sora,右边是Stable Cascade,下面对比图片都是按此拼接

提示词:Vibrant coral reef teeming with colorful fish and sea creatures

提示词:Digital art of a young tiger under an apple tree in a matte painting style with gorgeous details

提示词:A snowy mountain village with cozy cabins and a northern lights display, high detail and photorealistic dslr, 50mm f/1.2

如果你无法下载模型和工作流,可以从网盘进行下载:

暂无评论

none
暂无评论...
分享此文档

Stable Cascade

或复制链接

文章目录
Fogsight (雾象)

Fogsight (雾象)

雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
朱雀大模型检测

朱雀大模型检测

腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
Next AI Draw.io

Next AI Draw.io

Next AI Draw.io 是一个基于 Next.js 的 Web 应用,将大语言模型(LLM)与 draw.io 的强大图表能力深度集成。用户可通过自然语言指令创建、修改和增强专业图表,无需手动拖拽。
Tripo

Tripo

Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
Higgsfield AI

Higgsfield AI

Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
OiiOii AI

OiiOii AI

OiiOii.ai 是一个基于多智能体架构的动画生成平台,其核心目标是将动画制作从线性协作流程,转变为端到端的自动化生成。用户只需上传一张图片或输入一段文字描述,系统即可自动完成剧本生成、分镜设计、角色建模、镜头调度、配乐合成与最终渲染,输出一段完整动画视频。
查看完整榜单