模型 | 第86页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型

排序

发布更新浏览点赞

虚拟服装试穿Magic Clothing：根据特定的服装和文本提示来生成穿着这些服装的定制化角色图像

小i研究院发布了OOTDiffusion的分支版本Magic Clothing，它能够根据特定的服装和文本提示来生成穿着这些服装的定制化角色图像。这项技术的核心在于高度的图像可控性，即在生成的图像中保...

11个月前

01,1160

高效且多功能的框架Ctrl-Adapter：在各种图像和视频生成模型中加入丰富的控制功能

北卡罗来纳大学教堂山分校的研究人员推出高效且多功能的框架CTRL-Adapter，它能够为任何图像或视频扩散模型添加多样的空间控制功能。它支持多种实用的应用，如视频控制、多条件视频控制、稀疏帧条件下的...

图像模型 # Ctrl-Adapter # 空间控制 # 视频生成模型

11个月前

08380

新型超分辨率技术APISR：专门针对动漫图像和视频的高质量增强

来自密歇根大学、耶鲁大学和浙江大学推出新型超分辨率技术APISR，专门针对动漫图像和视频的高质量增强。超分辨率技术（Super-Resolution, SR）是一种图像处理技术，旨在从低分辨率的图像中...

图像模型 # APISR # 动漫图像 # 超分辨率技术

11个月前

08400

统一框架UniFL：通过统一的反馈学习来提升稳定扩散模型（Stable Diffusion）的性能

来自字节跳动和中山大学的研究人员推出利用反馈学习机制来全面增强扩散模型的统一框架UniFL，它通过统一的反馈学习来提升稳定扩散模型（Stable Diffusion）的性能。UniFL作为一种通用、高...

图像模型 # Stable Diffusion # UniFL

11个月前

07480

时间延时视频生成模型MagicTime：学习现实世界中的物理知识，并能够生成展示这些知识的时间延时视频

来自北京大学深圳研究生院、罗彻斯特大学、新加坡国立大学、广东工业大学和加州大学圣克鲁斯分校的研究人员推出新型时间延时视频生成模型MagicTime，这个模型的目标是学习现实世界中的物理知识，并能够生成...

视频模型 # MagicTime # 时间延时视频生成模型

11个月前

05570

新型文生图架构Diffusion-RWKV：基于RWKV模型，为改进图像生成任务而设计

昆仑万维推出新型文生图架构Diffusion-RWKV，它是为了改进图像生成任务而设计的。这个架构是基于RWKV模型，这是一种在自然语言处理（NLP）领域中使用的模型，但经过了特别的修改，使其更适合处...

图像模型 # Diffusion-RWKV # RWKV模型 # 文生图架构

11个月前

04880

个性化视觉编辑框架SwapAnything：可以在保持上下文不变的情况下，用参考提供的个性化概念替换图像中的任何物体

来自加州大学圣克鲁斯分校和Adobe的研究人员推出个性化视觉编辑框架SwapAnything，它可以在保持上下文不变的情况下，用参考提供的个性化概念替换图像中的任何物体。与现有的个性化主体替换方法...

图像模型 # SwapAnything # 个性化视觉编辑

11个月前

05160

新型框架Diffusion-KTO：用于调整文生图模型，使其生成的图像更符合人类的偏好

加州大学洛杉矶分校、松下人工智能研究中心和 Salesforce 人工智能研究中心的研究人员推出新型框架Diffusion-KTO，它专门用于调整文生图模型，使其生成的图像更符合人类的偏好。这个过程不...

图像模型 # Diffusion-KTO # 文生图模型

11个月前

06460

创新图像生成框架BeyondScene：能够生成高分辨率（超过8K）、以人为中心的场景图像

来自韩国首尔国立大学的研究团队推出创新图像生成框架BeyondScene，它能够生成高分辨率（超过8K）、以人为中心的场景图像。这个框架特别擅长处理包含多个人物和复杂细节的场景，即使这些场景的描述超出...

图像模型 # BeyondScene # 图像生成框架 # 高分辨率

11个月前

06590

图像编辑框架ByteEdit：提升基于扩散模型的生成性图像编辑任务的性能

字节跳动推出图像编辑框架ByteEdit，这是一个精心设计的创新反馈学习框架，旨在增强生成图像编辑任务的效果、提升遵从度，并加速处理速度。它专门用于提升基于扩散模型的生成性图像编辑任务的性能。Byte...

图像模型 # ByteEdit # 图像编辑框架

11个月前

01,0700

新型文生图模型YaART：利用人类反馈的强化学习与人类偏好进行对齐

来自俄罗斯Yandex、斯科尔科沃科学技术学院、莫斯科国立大学和高等经济学院的研究团队推出新型的、适用于生产环境的文本到图像级联扩散模型YaART（Yet Another Art Rendering ...

图像模型 # YaART # 文生图模型

11个月前

05650

新型图像生成模型MoMA：具有灵活的零样本能力，专注于主体驱动的个性化图像生成

来自字节跳动和罗格斯大学的研究人员推出新型图像生成模型MoMA（Multimodal LLM Adapter），这是一个开放词汇、无需训练的个性化图像模型，具有灵活的零样本能力，专注于主体驱动的个性化...

图像模型 # MoMA # 个性化图像生成 # 文生图模型

11个月前

09410

加载更多

模型

虚拟服装试穿Magic Clothing：根据特定的服装和文本提示来生成穿着这些服装的定制化角色图像

高效且多功能的框架Ctrl-Adapter：在各种图像和视频生成模型中加入丰富的控制功能

新型超分辨率技术APISR：专门针对动漫图像和视频的高质量增强

统一框架UniFL：通过统一的反馈学习来提升稳定扩散模型（Stable Diffusion）的性能

时间延时视频生成模型MagicTime：学习现实世界中的物理知识，并能够生成展示这些知识的时间延时视频

新型文生图架构Diffusion-RWKV：基于RWKV模型，为改进图像生成任务而设计

个性化视觉编辑框架SwapAnything：可以在保持上下文不变的情况下，用参考提供的个性化概念替换图像中的任何物体

新型框架Diffusion-KTO：用于调整文生图模型，使其生成的图像更符合人类的偏好

创新图像生成框架BeyondScene：能够生成高分辨率（超过8K）、以人为中心的场景图像

图像编辑框架ByteEdit：提升基于扩散模型的生成性图像编辑任务的性能

新型文生图模型YaART：利用人类反馈的强化学习与人类偏好进行对齐

新型图像生成模型MoMA：具有灵活的零样本能力，专注于主体驱动的个性化图像生成

OpenStock

NotebookLM

oLLM

OpenAI Codex CLI

Fogsight (雾象)

CachyOS

模型

网址

OpenStock

NotebookLM

oLLM

OpenAI Codex CLI

Fogsight (雾象)

CachyOS