文生图模型,SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。不仅提供Stable Diffusion、ComfyUI、Fooocus、Flux等热门工具的详细教程和丰富资源，还为您带来行业最新进展与趋势解读。无论您是初学者还是资深创作者，都能在这里快速找到所需信息，开启AI创作之旅。 | 第2页

LongAlign：改进文生图模型的长文本对齐

文生图模型的快速发展使它们能够从给定的文本生成前所未有的结果。然而，随着文本输入变长，现有的编码方法如 CLIP 面临限制，并且将生成的图像与长文本对齐变得具有挑战性。为了解决这些问题，香港大学、新加...

5个月前

03020

Fluid: 基于连续令牌和随机顺序生成的文生图模型

在视觉领域，自回归模型的扩展并没有像在大语言模型中那样取得显著的成功。为了探索这一问题，Google DeepMind 和麻省理工学院的研究人员进行了一项研究，重点探讨了两个关键因素：模型是使用离散还...

新技术 # Fluid:# 文生图模型

5个月前

02640

半策略偏好优化方法SePPO：用于优化和微调文生图模型，使其更好地符合人类的审美和偏好

罗切斯特大学、普渡大学、延世大学、腾讯 AI 实验室和华盛顿大学的研究人员推出半策略偏好优化方法SePPO，用于优化和微调扩散模型（如用于生成图像的模型），使其更好地符合人类的审美和偏好，而无需依赖外...

新技术 # SePPO # 半策略偏好优化 # 文生图模型

5个月前

02460

针对文生图模型的一次性个性化定制技术TextBoost：使用单个参考图像，通过微调文本编码器，来生成与文本提示相匹配的定制化图像

韩国科学技术院推出一种针对文本到图像模型的一次性个性化定制技术TextBoost，这种方法使用单个参考图像，通过微调文本编码器，来生成与文本提示相匹配的定制化图像。例如，你想要通过一段描述来生成一张图...

新技术 # TextBoost # 个性化定制 # 文生图模型

6个月前

03310

人类偏好优化技术NCPPO：改善文生图模型，使其生成的图像更加符合人类的偏好

俄罗斯国家研究型高等经济大学的研究人员推出新方法NCPPO，它用于改善文本到图像的扩散模型（Diffusion Models），使其生成的图像更加符合人类的偏好。扩散模型是一种生成模型，它们通过逐步去...

新技术 # NCPPO # 人类偏好 # 文生图模型

9个月前

03510

基于提示、针对文生图模型的新型剪枝方法APTP：减少文生图模型在计算资源受限的环境中部署时的计算负担，同时保持模型性能

马里兰大学和佛罗里达州立大学推出一种针对文生图模型的新型剪枝方法APTP（Adaptive Prompt-Tailored Pruning，自适应提示定制剪枝），这是一种专门为文生图模型设计的、基于提...

新技术 # APTP # 剪枝方法 # 文生图模型

9个月前

04410

新型文生图模型CountGen：根据文本提示准确地生成指定数量的对象

巴伊兰大学、英伟达和特拉维夫大学的研究人员推出新型文生图模型CountGen，它能够根据文本提示准确地生成指定数量的对象。在以往的技术中，尽管文本到图像的扩散模型取得了巨大成功，但它们在控制生成图像中...

新技术 # CountGen # 文生图模型

9个月前

03140

基准测试CommonsensenT2I：用于评估文生图模型（T2I）生成符合现实生活常识的图像的能力

宾夕法尼亚大学和加州大学圣塔芭芭拉分校的研究人员推出基准测试CommonsensenT2I，用于评估文生图模型（T2I）生成符合现实生活常识的图像的能力。简单来说，就是研究这些模型是否能够根据文字描述...

新技术 # CommonsensenT2I # 基准测试 # 文生图模型

9个月前

03700

文生图模型偏好优化方法MaPO（边界感知偏好优化）：让计算机在学习生成图像时，能够更好地符合人类的偏好

韩国科学技术研究院、Huggingface和高丽大学的研究人员推出一种新的文本到图像扩散模型的偏好优化方法，这种方法被称为“边界感知偏好优化”（Margin-aware Preference Opti...

新技术 # MaPO # 文生图模型 # 边界感知偏好优化

9个月前

05040

英伟达推出新型文生图模型BlobGEN：基于blob（斑点）的文本到图像扩散模型

英伟达推出新型文生图模型BlobGEN，这个模型的核心思想是将场景分解为视觉原语——被称为密集的blob（斑点）表示——这些表示包含了场景的细粒度细节，同时具备模块化、易于理解和构建的特点。例如，一个...

新技术 # BlobGEN # 文生图模型 # 英伟达

10个月前

06580

腾讯混元团队推出支持中英双语提示词的文生图模型Hunyuan-DiT：能够根据上下文与用户进行多轮多模态对话，生成并优化图像

腾讯混元团队推出支持中英双语提示词的文生图模型Hunyuan-DiT，它特别擅长理解中文和英文的文本提示，并据此生成图像，Hunyuan-DiT能够根据上下文与用户进行多轮多模态对话，生成并优化图像。...

新技术 # Hunyuan-DiT # 提示词 # 文生图模型

10个月前

05380

文生图模型新架构MoA：根据用户的个性化需求生成包含特定人物的图像，同时保持原有模型的风格和多样性

Snap推出新架构注意力混合（Mixture-of-Attention，简称MoA），即在个性化图像生成中实现主体与上下文解耦的注意力混合模型（MoA），用于个性化文本到图像的扩散模型。简单来说，Mo...

图像模型 # MoA # 文生图模型

1个月前

07640

文生图模型

LongAlign：改进文生图模型的长文本对齐

Fluid: 基于连续令牌和随机顺序生成的文生图模型

半策略偏好优化方法SePPO：用于优化和微调文生图模型，使其更好地符合人类的审美和偏好

针对文生图模型的一次性个性化定制技术TextBoost：使用单个参考图像，通过微调文本编码器，来生成与文本提示相匹配的定制化图像

人类偏好优化技术NCPPO：改善文生图模型，使其生成的图像更加符合人类的偏好

基于提示、针对文生图模型的新型剪枝方法APTP：减少文生图模型在计算资源受限的环境中部署时的计算负担，同时保持模型性能

新型文生图模型CountGen：根据文本提示准确地生成指定数量的对象

基准测试CommonsensenT2I：用于评估文生图模型（T2I）生成符合现实生活常识的图像的能力

文生图模型偏好优化方法MaPO（边界感知偏好优化）：让计算机在学习生成图像时，能够更好地符合人类的偏好

英伟达推出新型文生图模型BlobGEN：基于blob（斑点）的文本到图像扩散模型

腾讯混元团队推出支持中英双语提示词的文生图模型Hunyuan-DiT：能够根据上下文与用户进行多轮多模态对话，生成并优化图像

文生图模型新架构MoA：根据用户的个性化需求生成包含特定人物的图像，同时保持原有模型的风格和多样性

纳米AI搜索

朱雀大模型检测

通义万象

Open ASR 排行榜

DiffRhythm（谛韵）

AI21 Labs

文生图模型

网址

纳米AI搜索

朱雀大模型检测

通义万象

Open ASR 排行榜

DiffRhythm（谛韵）

AI21 Labs