Luma AI推出新型生成模型框架IMM:实现仅 8 步 内生成高质量图像Luma AI和斯坦福大学的研究人员推出新型生成模型框架 Inductive Moment Matching (IMM) ,旨在解决扩散模型(Diffusion Models)和流匹配(Flow Ma...新技术# IMM# Luma AI# 图像生成模型1年前04290
基于扩散模型的图像处理系统PromptFix:能够根据人类的指令执行各种图像处理任务,如上色、提升照片亮度、去除水印、抠图、去雾和去模糊等扩散模型结合语言模型在图像生成任务中展现了卓越的可控性,能够根据人类指令进行图像处理。然而,由于缺乏多样化的指令遵循数据,模型在识别和执行用户定制指令方面仍面临挑战,尤其是在低级任务中。此外,扩散过程...新技术# PromptFix# 图像处理# 扩散模型1年前04290
视频插值方法ViBiDSampler:专门用于在两个关键帧之间生成平滑且逼真的中间帧,从而创建流畅的视频过渡效果韩国科学技术研究院推出视频插值方法ViBiDSampler,这种方法专门用于在两个关键帧之间生成平滑且逼真的中间帧,从而创建流畅的视频过渡效果。ViBiDSampler引入了一种新颖的双向采样策略,以...新技术# ViBiDSampler# 视频插值方法1年前04280
新型文本到图像的扩散模型优化方法迭代对象计数优化:准确地生成指定数量的对象特拉维夫大学和巴伊兰大学的研究人员推出一种新的文本到图像的扩散模型优化方法,这个方法被称为“迭代对象计数优化”(Iterative Object Count Optimization)。这个方法主要解...新技术# 迭代对象计数优化2年前04280
新型视频生成框架VideoGuide:改善视频生成模型在时间连续性方面的性能,同时保持甚至提高生成视频的图像质量韩国科学技术研究院推出新型框架VideoGuide,它能够改善视频生成模型在时间连续性方面的性能,同时保持甚至提高生成视频的图像质量。这就意味着,使用VideoGuide,可以让现有的视频生成模型在不...新技术# VideoGuide# 视频生成框架1年前04270
SimpleGVR:轻量高效视频超分辨率模型,让低清视频也能高清呈现由澳门大学智慧城市物联网国家重点实验室、中国科学院深圳先进技术研究院、清华大学、快手科技和深圳理工大学联合研究团队提出了一种新型视频超分辨率(Video Super-Resolution, VSR)模...新技术# SimpleGVR# 视频超分辨率模型9个月前04260
BLIP3-KALE:包含2.18亿个图像-文本对的数据集华盛顿大学、Salesforce Research、斯坦福大学和加州大学伯克利分校推出一个包含2.18亿个图像-文本对的数据集BLIP3-KALE,它弥合了描述性合成字幕和网络规模的事实性替代文本之间...新技术# BLIP3-KALE# 数据集1年前04260
新型图像生成技术“集合自回归模型”(SAR):通过改变图像生成的顺序和方式,使得生成图像的速度和灵活性都得到了极大的提升香港中文大学MMLab 、上海人工智能实验室和南京大学的研究人员推出一种新的图像生成技术“集合自回归模型”(Set AutoRegressive Modeling,简称SAR)。你可以把它想象成一个超...新技术# SAR# 图像生成# 集合自回归模型1年前04260
新型视频生成模型Factorized-Dreamer:用于将文本转换成高质量的视频字节跳动和香港理工大学的研究人员推出新型视频生成模型Factorized-Dreamer,它专门用于将文本转换成高质量的视频(Text-to-Video, T2V)。Factorized-Dreame...新技术# Factorized-Dreamer# 视频生成模型2年前04260
ColorfulShading:能够在复杂的环境中准确地分离出物体的颜色和光照效果加拿大西蒙弗雷泽大学的研究人员推出ColorfulShading,它能够将真实世界中的照片中的表面反射率(也就是物体本来的颜色)和照明效果(比如光线如何影响物体的外观)分离开来。简单来说,它可以将一张...新技术# ColorfulShading2年前04210
Long Volumetric Video:高效地表示和渲染长时间的体积视频浙江大学、斯坦福大学和香港科技大学的研究人员发布论文,主题是关于如何高效地表示和渲染长时间的体积视频(Long Volumetric Video)。体积视频是一种能够从多个视角捕捉动态场景并提供自由视...新技术# EasyVolcap# longvolcap# 体积视频1年前04200
Autodesk推出新型3D生成模型WaLa:基于多种输入条件(如文本描述、图像、点云等)生成参数化的3D CAD模型Autodesk推出新型3D生成模型“Wavelet Latent Diffusion (WaLa)”,它能够基于多种输入条件(如文本描述、图像、点云等)生成参数化的3D CAD模型。WaLa模型的核...新技术# 3D生成模型# Autodesk# WaLa1年前04180