百科 | 第178页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

VideoElevator：利用文生图模型来增强文生视频的质量和细节

来自哈尔滨大学和清华大学的研究团队推出VideoElevator，利用文生图模型来增强文生视频的质量和细节，这个过程是无需训练的，可以直接插入现有的模型中使用，还能利用文生图模型来实现风格迁移，非常方...

2年前

06350

大语言模型适配器ELLA：提升了文生图模型处理复杂描述的能力

腾讯推出大语言模型适配器（LLM Adapter）ELLA，无需 U-Net 或大语言模型训练，就可通过 ELLA ，为文生图模型增强文本对齐，解决大多数模型受限于 CLIP 本身对密集提示词的理解能...

新技术 # DPG-Bench # ELLA # TSC

2年前

09530

图像编辑框架StableDrag：通过点（handle points）来精确控制图像编辑

南京大学软件新技术国家重点实验室和腾讯公司研究团队推出图像编辑框架StableDrag，它专注于通过点（handle points）来精确控制图像编辑。项目主页论文地址 StableDrag提供了...

新技术 # StableDrag # 图像编辑

2年前

05650

运动引导扩散模型Pix2Gif：用于图像到GIF（视频）的生成

微软印度研究院和微软雷蒙德研究院的研究人员推出运动引导扩散模型Pix2Gif，该模型可用于图像到GIF（视频）的生成。项目主页 GitHub Demo 他们采取了与众不同的方法，将任务定位为受文本和...

新技术 # GIF # Pix2Gif

2年前

06960

ViewDiff：从文本或图像生成多视图图像

来自Meta和慕尼黑工业大学的研究人员推出ViewDiff，它能够根据文本描述或已有的图像输入，生成与3D对象一致的高质量图像。项目主页 GitHub 想象一下，你只需要告诉计算机你想要的3D对象是...

新技术 # 3D模型 # ViewDiff # 多视角

2年前

06720

分辨率适配器ResAdapte：解决SD模型生成超大图片和非训练分辨率图片时的肢体异常以及画面崩坏问题

字节跳动推出ResAdapter，它是一个用于SD模型的分辨率适配器，可以生成任意风格领域的图像，并且能够在不同的分辨率下保持图像的一致性和质量。项目主页 GitHub 模型地址简单来说，可以解决...

新技术 # ResAdapte # SD模型

2年前

09230

阿里推出高保真图像到视频生成框架AtomoVideo

阿里旗下阿里妈妈研究人员推出高保真图像到视频生成框架AtomoVideo，它能够将输入的图像转化为高保真的视频。相较于现有的技术，它提供了更出色的运动强度和一致性，而且完美兼容各种个性化文生图模型，无...

新技术 # AI视频 # AtomoVideo

2年前

07180

Stable Diffusion 3核心技术研究论文详解

要点提炼： Stability AI发布了深入剖析Stable Diffusion 3核心技术的研究论文基于人类偏好评估，Stable Diffusion 3在遵循提示内容及排版质量上超越了DALL...

科普 # MMDiT # Stability AI # Stable Diffusion 3

2年前

01,3710

个性化图像生成RealCustom：理解你的描述，并生成符合你要求的个性化图像

来自中科大、字节跳动的研究人员推出新型文本到图像定制方法RealCustom。这种方法的目标是为给定的主题生成受文本驱动的图像，这在内容创作领域具有革命性的意义。项目主页论文地址想象一下，你想要...

新技术 # RealCustom # 个性化图像生成

2年前

05710

视觉变换器VisionLLaMA：基于LLaMA架构设计，用于处理图像任务

来自美团、浙江大学、Moonshot AI的研究人员推出名为VisionLLaMA的新型视觉变换器（Vision Transformer），它是基于LLaMA（Large Language Model...

新技术 # VisionLLaMA # 视觉变换器

2年前

06060

【3月4日·SD早报】多款ComfyUI插件发布，欧美漫画风模型

软件及插件更新汇总 1、FastSD CPU 1.0.0 beta 26发布 FastSD CPU是专为在CPU环境下运行Stable Diffusion模型设计的工具，它充分利用OpenVINO技术...

早报 # ComfyUI SUPIR # DeforumationQT # FastSD CPU

2年前

08650

独特视角SDXL Lora：Head POV

Head POV是一个视角SDXL Lora，这一视角的独特之处在于，它是以动物的后脑勺为观察点。尽管初版模型训练数据相对较少，可能导致生成的图片并不完美，但作者已经计划扩充数据集，并对图像位置信息进...

百科 # Head POV # SDXL Lora # 视角

2年前

08130

加载更多

百科