VideoElevator:利用文生图模型来增强文生视频的质量和细节来自哈尔滨大学和清华大学的研究团队推出VideoElevator,利用文生图模型来增强文生视频的质量和细节,这个过程是无需训练的,可以直接插入现有的模型中使用,还能利用文生图模型来实现风格迁移,非常方...新技术# VideoElevator# 文生图模型# 文生视频2年前06350
大语言模型适配器ELLA:提升了文生图模型处理复杂描述的能力腾讯推出大语言模型适配器(LLM Adapter)ELLA,无需 U-Net 或大语言模型训练,就可通过 ELLA ,为文生图模型增强文本对齐,解决大多数模型受限于 CLIP 本身对密集提示词的理解能...新技术# DPG-Bench# ELLA# TSC2年前09530
图像编辑框架StableDrag:通过点(handle points)来精确控制图像编辑南京大学软件新技术国家重点实验室和腾讯公司研究团队推出图像编辑框架StableDrag,它专注于通过点(handle points)来精确控制图像编辑。 项目主页 论文地址 StableDrag提供了...新技术# StableDrag# 图像编辑2年前05650
运动引导扩散模型Pix2Gif:用于图像到GIF(视频)的生成微软印度研究院和微软雷蒙德研究院的研究人员推出运动引导扩散模型Pix2Gif,该模型可用于图像到GIF(视频)的生成。 项目主页 GitHub Demo 他们采取了与众不同的方法,将任务定位为受文本和...新技术# GIF# Pix2Gif2年前06960
ViewDiff:从文本或图像生成多视图图像来自Meta和慕尼黑工业大学的研究人员推出ViewDiff,它能够根据文本描述或已有的图像输入,生成与3D对象一致的高质量图像。 项目主页 GitHub 想象一下,你只需要告诉计算机你想要的3D对象是...新技术# 3D模型# ViewDiff# 多视角2年前06720
分辨率适配器ResAdapte:解决SD模型生成超大图片和非训练分辨率图片时的肢体异常以及画面崩坏问题字节跳动推出ResAdapter,它是一个用于SD模型的分辨率适配器,可以生成任意风格领域的图像,并且能够在不同的分辨率下保持图像的一致性和质量。 项目主页 GitHub 模型地址 简单来说,可以解决...新技术# ResAdapte# SD模型2年前09230
阿里推出高保真图像到视频生成框架AtomoVideo阿里旗下阿里妈妈研究人员推出高保真图像到视频生成框架AtomoVideo,它能够将输入的图像转化为高保真的视频。相较于现有的技术,它提供了更出色的运动强度和一致性,而且完美兼容各种个性化文生图模型,无...新技术# AI视频# AtomoVideo2年前07180
Stable Diffusion 3核心技术研究论文详解要点提炼: Stability AI发布了深入剖析Stable Diffusion 3核心技术的研究论文 基于人类偏好评估,Stable Diffusion 3在遵循提示内容及排版质量上超越了DALL...科普# MMDiT# Stability AI# Stable Diffusion 32年前01,3710
个性化图像生成RealCustom:理解你的描述,并生成符合你要求的个性化图像来自中科大、字节跳动的研究人员推出新型文本到图像定制方法RealCustom。这种方法的目标是为给定的主题生成受文本驱动的图像,这在内容创作领域具有革命性的意义。 项目主页 论文地址 想象一下,你想要...新技术# RealCustom# 个性化图像生成2年前05710
视觉变换器VisionLLaMA:基于LLaMA架构设计,用于处理图像任务来自美团、浙江大学、Moonshot AI的研究人员推出名为VisionLLaMA的新型视觉变换器(Vision Transformer),它是基于LLaMA(Large Language Model...新技术# VisionLLaMA# 视觉变换器2年前06060
【3月4日·SD早报】多款ComfyUI插件发布,欧美漫画风模型软件及插件更新汇总 1、FastSD CPU 1.0.0 beta 26发布 FastSD CPU是专为在CPU环境下运行Stable Diffusion模型设计的工具,它充分利用OpenVINO技术...早报# ComfyUI SUPIR# DeforumationQT# FastSD CPU2年前08650
独特视角SDXL Lora:Head POVHead POV是一个视角SDXL Lora,这一视角的独特之处在于,它是以动物的后脑勺为观察点。尽管初版模型训练数据相对较少,可能导致生成的图片并不完美,但作者已经计划扩充数据集,并对图像位置信息进...百科# Head POV# SDXL Lora# 视角2年前08130