创新框架UniAnimate:用于生成高质量、时间连贯的人类图像动画视频华中科技大学、 阿里巴巴和中国科学技术大学的研究人员推出创新框架UniAnimate,它专门用于生成高质量、时间连贯的人类图像动画视频。UniAnimate通过结合统一的视频扩散模型、统一的噪声输入和...新技术# UniAnimate# 视频扩散模型2年前08690
采样调节器AlignYouSteps:优化采样步骤,从而提高生成图像的细节和质量英伟达、多伦多大学和矢量研究所的研究人员推出新的采样调节器AlignYouSteps(调整步伐),用于优化采样步骤,从而提高生成图像的细节和质量。这是一种通用且原则性的方法,用于优化扩散模型的采样计划...新技术# AlignYouSteps# 英伟达# 采样调节器2年前08680
新型文生图风格迁移技术InstantStyle-Plus:在生成图像的同时保留原始图像的内容和风格InstantX团队推出新型文生图风格迁移技术InstantStyle-Plus,在生成图像的同时保留原始图像的内容和风格。这项技术特别适用于需要将一种图像的风格应用到另一种图像上,但又希望保留原始图...新技术# InstantStyle-Plus# 风格迁移1年前08660
图像转换方法img2img-turbo:在单个步骤中完成复杂的图像转换任务,同时不需要成对的训练数据,适用于多种应用场景来自卡内基梅隆大学和Adobe的研究人员推出新的图像转换方法img2img-turbo,它能够在单个步骤中将图像从源域转换到目标域,例如从白天的场景转换到夜晚,或者添加和移除天气效果如雾、雪和雨。这种...新技术# img2img-turbo# 图像转换2年前08660
开源人像生成器InstantID:只需一张人脸照片,快速生成不同风格的人物照片开源人像生成器InstantID今天在推特引发了热议,InstantID只需要一张人脸照片,就能快速生成多种风格的人物照片,无需复杂的训练或微调过程。InstantID还能与流行的图像扩散模型(如 S...新技术# controlnet# InstantID# LCM2年前08660
新型图像生成模型DiMR:通过多分辨率处理和时间依赖的层归一化技术,有效地提高了图像的质量和真实感,减少了失真字节跳动、约翰霍普金斯大学和威斯康星大学麦迪逊分校的研究人员推出新的图像生成模型DiMR(Distortion-reduced Multi-Resolution Diffusion Model),此模...新技术# DiMR# 图像生成1年前08600
Multi-LoRA Composition:不经过训练直接融合多个 Lora 不损失效果来自伊利诺伊大学香槟分校和微软公司的研究人员公开了多LoRA组合来生成图像的项目。简单来说,LoRA是一种可以让文本生成图像模型更准确地呈现特定元素(如独特的字符、风格或服装)的技术。论文探讨了如何更...新技术# Lora# Multi-LoRA Composition2年前08600
ControlNet++:通过显式优化生成图像与条件控制之间的像素级循环一致性,来改进可控生成过程中佛罗里达大学计算机视觉研究中心和字节跳动的研究人员推出ControlNet++,这是一种新方法,通过显式优化生成图像与条件控制之间的像素级循环一致性,来改进可控生成过程。具体来说,对于给定的条件控制...新技术# controlnet# 可控性# 文生图模型2年前08580
后训练压缩策略DiTFastAttn:压缩和加速DiT模型,缓解DiT的计算瓶颈问题来自清华大学、无问芯穹(Infinigence AI)、卡内基梅隆大学和上海交通大学的研究人员推出新技术DiTFastAttn,它专门用于压缩和加速一种称为Diffusion Transformers...新技术# DiTFastAttn# DiT模型1年前08570
新型视频生成框架MovieDreamer:专门用于制作长篇视频内容,比如电影浙江大学和阿里巴巴的研究人员推出新型视频生成框架MovieDreamer,专门用于制作长篇视频内容,比如电影。与传统的短时视频生成技术不同,MovieDreamer能够处理复杂的叙事结构和情节发展,同...新技术# MovieDreamer# 视频生成框架1年前08560
韩国团队提出文生图大模型KOALA:可在低端GPU电脑上运行韩国研究人员提出了一种高效的潜在扩散模型KOALA,该模型可以用于文本到图像的生成,研究人员构建了T2I模型KOALA-1B和KOALA-700M,减小了模型大小,降低了模型对硬件的需求,提高了模型运...新技术# KOALA# 文生图大模型# 韩国2年前08540
新型文生图模型的微调算法SPIN-DiffusionSPIN-Diffusion是一种新型文生图模型的微调算法。这个算法特别适用于那些只有单个图像与文本提示(prompt)相关联的数据集,它通过一种自我博弈(self-play)的机制,让模型不断地与自...新技术# SPIN-Diffusion# 文生图模型2年前08520