适用于FLUX 和 SD3.5模型的新采样器Style-Friendly SNR：更好地捕捉独特的风格，并生成风格对齐度更高的图像

近年来，大型扩散模型在生成高质量图像方面取得了显著进展。然而，这些模型在学习新的、个性化的艺术风格方面存在困难，这限制了独特风格模板的创建。传统的微调方法通常盲目地利用预训练中使用的目标和噪声水平分布，导致风格对齐次优。

风格友好信噪比（SNR）采样器

为了解决这一问题，首尔国立大学的研究人员提出了一种称为风格友好信噪比（SNR）采样器的新方法。该方法在微调过程中将信噪比分布积极地偏向更高的噪声水平，从而专注于风格特征出现的噪声水平。这种方法使得模型能够更好地捕捉独特的风格，并生成风格对齐度更高的图像。

论文：https://arxiv.org/abs/2411.14793

例如，一个艺术家想要创作一系列具有特定风格的作品，比如模仿梵高油画的风格。使用Style-Friendly SNR Sampler，艺术家可以提供一些梵高风格的参考图像，然后生成新的图像，这些图像不仅包含所需的文本内容，还具有梵高油画的风格特征，如色彩方案、笔触和布局。

适用于FLUX 和 SD3.5模型的新采样器Style-Friendly SNR：更好地捕捉独特的风格，并生成风格对齐度更高的图像

主要功能

1、信噪比分布偏移：

更高的噪声水平：通过将信噪比分布偏向更高的噪声水平，模型能够更好地捕捉和学习独特的风格特征。
风格对齐：这种方法使得生成的图像在风格对齐方面表现出更高的质量，更好地保留了参考图像中的艺术风格。

2、个性化内容创作：

风格模板：风格友好SNR采样器允许扩散模型学习和共享新的“风格模板”，增强个性化内容创作。
多样化风格：该方法能够生成多种风格的图像，包括个人水彩画、简约平面卡通、3D渲染、多面板图像和带文字的模因等。

3、适用模型：

FLUX：风格友好SNR采样器使FLUX能够有效地学习新的、独特的艺术风格。
SD3.5：同样适用于SD3.5，扩大了风格驱动生成的范围。

主要特点：

风格友好的采样：通过在微调过程中向更高噪声水平偏置SNR分布，专注于风格特征出现的噪声水平。
无需额外训练：方法允许在不进行额外训练的情况下，通过微调现有模型来学习新的风格。
提高风格一致性：与现有方法相比，能够更准确地捕捉和生成具有特定风格的图像。

工作原理：

Style-Friendly SNR Sampler的核心思想是在微调扩散模型时，调整噪声水平的采样分布。具体来说，它通过以下步骤工作：

噪声水平调整：在微调过程中，将SNR分布向更高噪声水平（更低的log-SNR值）偏置，这些水平是风格特征（如色彩方案和布局）出现的关键。
风格特征捕捉：通过在这些关键噪声水平上的训练，模型能够更好地学习并捕捉到风格特征。
生成风格化图像：使用微调后的模型，根据文本提示和学习到的风格模板，生成具有高度风格一致性的图像。

实验结果

研究人员通过多种风格生成任务展示了风格友好SNR采样器的有效性：

个人水彩画：生成的水彩画图像风格一致，细节丰富，能够很好地捕捉水彩画的独特质感。
简约平面卡通：生成的卡通图像简洁明快，风格一致，适合用于平面设计和插画。
3D渲染：生成的3D渲染图像具有高度的真实感和细节，适用于游戏和电影制作。
多面板图像：生成的多面板图像在风格上保持一致，适合用于漫画和故事板。
带文字的模因：生成的模因图像风格独特，文字与图像完美融合，适合用于社交媒体和广告。

文章版权归作者所有，未经允许请勿转载。

DreamReward：通过人类偏好反馈来提升从文本到3D内容生成的质量

新技术 # 3D模型 # DreamReward

12个月前

04180

基于扩散模型的图像处理系统PromptFix：能够根据人类的指令执行各种图像处理任务，如上色、提升照片亮度、去除水印、抠图、去雾和去模糊等

新技术 # PromptFix # 图像处理 # 扩散模型

4个月前

02250

用于组合式文生图新框架GraPE：将复杂的多步生成任务分解为三个独立的步骤

新技术 # GraPE # 文生图

3个月前

01290

AI视频生成新框架Motion-I2V：让用户通过简单的轨迹绘制或区域选择来控制生成的视频内容

新技术 # AI视频生成 # Motion-I2V # 清华大学

1年前

04750

暂无评论

暂无评论...

适用于FLUX 和 SD3.5模型的新采样器Style-Friendly SNR：更好地捕捉独特的风格，并生成风格对齐度更高的图像

风格友好信噪比（SNR）采样器

主要功能

主要特点：

工作原理：

实验结果

用于类别无关的姿态估计新型框架EdgeCape

ViewExtrapolator：于在新视角合成领域中进行新视角外推

相关文章

DreamReward：通过人类偏好反馈来提升从文本到3D内容生成的质量

基于扩散模型的图像处理系统PromptFix：能够根据人类的指令执行各种图像处理任务，如上色、提升照片亮度、去除水印、抠图、去雾和去模糊等

用于组合式文生图新框架GraPE：将复杂的多步生成任务分解为三个独立的步骤

AI视频生成新框架Motion-I2V：让用户通过简单的轨迹绘制或区域选择来控制生成的视频内容

暂无评论

文章

高级插图模型Illustrious：专门针对插画和动画任务进行了优化，主要用于生成动漫风格的图像

频繁切换太麻烦？整合AI绘画应用「Stability Matrix」

Stable Diffusion 中的CFG Scale是什么？

新清华大学与清程极智开源大模型推理引擎“赤兔 Chitu”，实现 DeepSeek 推理成本降低一半、性能翻番

阿里通义实验室 Wan 团队推出一体化视频编辑框架 VACE

Stable Diffusion中迭代步数 (Steps)的作用及优化指南

纳米AI搜索

通义万象

新Same.Dev

DiffRhythm（谛韵）

Mercury Coder

星野APP

适用于FLUX 和 SD3.5模型的新采样器Style-Friendly SNR：更好地捕捉独特的风格，并生成风格对齐度更高的图像

风格友好信噪比（SNR）采样器

主要功能

主要特点：

工作原理：

实验结果

用于类别无关的姿态估计新型框架EdgeCape

ViewExtrapolator：于在新视角合成领域中进行新视角外推

相关文章

文章

标签云

网址

纳米AI搜索

通义万象

新Same.Dev

DiffRhythm（谛韵）

Mercury Coder

星野APP