Stable Cascade
Stability AI在2月14日发布了基于Würstchen架构的文生图模型——Stable Cascade。好消息是,ComfyUI已在本周末的更新中正式支持Stable Cascade,官方还释出了Stable Cascade工作流,使用方法非常简单。
模型介绍
Stable Cascade与现有的Stable Diffusion系列模型有所不同。Stable Cascade的构建基于一个流水线,该流水线由三个独立模型——Stages A、B和C组成。若需详细了解Stable Cascade模型,请参阅《Stability AI发布新模型Stable Cascade》一文
使用指南
1、更新ComfyUI
首先,请确保您的ComfyUI已更新至最新版本
2、下载模型
访问官方的Stable Cascade模型下载页面,下载stage_b.safetensors
和stage_c.safetensors
模型
- 将这两个模型文件放置在
ComfyUI/models/unet
目录下;同样地,下载stage_a.safetensors
模型并将其放在ComfyUI/models/vae
目录中 - 下载CLIP模型,并将其重命名为
clip_g_sdxl.fp16.safetensors
,然后将其放置在ComfyUI/models/clip
目录下
3、加载工作流
将官方提供的工作流文件直接拖放到ComfyUI界面上,加载后界面将如下所示:
4、生成图片:
- 初次使用工作流生成图片时,可能会稍慢一些,但随后的生成速度将恢复正常
- 在我的4070显卡上,使用官方工作流生成一张1024分辨率的图片大约需要14秒
注意:如果你的显卡和内存配置不太好,可以尝试bf16模型来进行生成.
名词解释:在深度学习与AI中,bfloat16(BF16)是一种半精度浮点格式,它用16位存储数值,通过优化指数部分的位宽来保持对大动态范围的支持,与FP32相似。在处理大型模型时,诸如stage_b_bf16.safetensors这样的表述意味着模型参数及中间结果可能以bfloat16格式存于安全张量内,从而减小内存使用、加快计算速度,并确保训练和推理的有效性。这种技术旨在充分利用现代GPU或TPU的BF16硬件加速特性,在不明显降低模型性能的同时提高资源效率。
生成效果
使用OpenAI最新发布的Sora模型在文生图模式所使用的提示词,大家对比看看,那个效果好?
提示词:Close-up portrait shot of a woman in autumn, extreme detail, shallow depth of field
提示词:Vibrant coral reef teeming with colorful fish and sea creatures
提示词:Digital art of a young tiger under an apple tree in a matte painting style with gorgeous details
提示词:A snowy mountain village with cozy cabins and a northern lights display, high detail and photorealistic dslr, 50mm f/1.2
如果你无法下载模型和工作流,可以从网盘进行下载:
123网盘:https://www.123pan.com/s/I1oZVv-odSGA.html 提取码:5KAG
评论0