新型视频生成方法TrackGo:根据用户的输入精确控制视频中对象的运动北京航空航天大学和爱诗科技的研究人员推出新型视频生成方法TrackGo,它能够根据用户的输入精确控制视频中对象的运动。这项技术允许用户通过自由形式的遮罩(masks)和箭头来指定目标对象或部分,以及它...新技术# TrackGo# 视频生成2年前04840
Meta推出个性化图像生成模型Imagine yourselfMeta推出个性化图像生成模型Imagine yourself,这个模型的特别之处在于,它不需要针对每个用户进行个性化调整或“调优”,就能够为所有用户提供服务。这就像是有一个智能的画家,无论谁来请求画...新技术# Imagine yourself# Meta# 个性化图像生成模型2年前05600
MegaFusion:将现有的扩散模型扩展到更高分辨率的图像生成,而无需额外的调整或适应上海交通大学、上海人工智能实验室和大连理工大学的研究人员推出MegaFusion,它能够将现有的扩散模型(diffusion models)扩展到更高分辨率的图像生成,而无需额外的调整或适应。具体而言...新技术# MegaFusion2年前07290
多模态模型Transfusion:能够同时处理离散数据(如文本)和连续数据(如图像)Meta、Waymo和南加州大学的研究人员推出多模态模型Transfusion,它能够同时处理离散数据(如文本)和连续数据(如图像)。Transfusion的核心思想是将语言模型的下一个词预测(nex...新技术# Transfusion# 多模态模型2年前07560
无需训练、基于轨迹的可控图像生成技术TraDiffusion:允许用户通过鼠标轨迹来轻松引导图像的生成,而无需进行额外的训练或微调厦门大学和中国科学院大学深圳先进技术研究院的研究人员推出新型图像生成技术TraDiffusion,这项技术的核心在于它允许用户通过鼠标轨迹来轻松引导图像的生成,而无需进行额外的训练或微调。简单来说,就...新技术# TraDiffusion# 图像生成2年前08280
DiPIR:将虚拟对象以逼真的方式插入到真实世界场景的图片或视频中英伟达、多伦多大学和矢量研究所的研究人员推出DiPIR技术,它能够将虚拟对象以逼真的方式插入到真实世界场景的图片或视频中。这项技术的核心在于理解和模拟场景的光照、几何形状和材质,以及图像形成过程,从而...新技术# DiPIR2年前06170
新型视频生成模型Factorized-Dreamer:用于将文本转换成高质量的视频字节跳动和香港理工大学的研究人员推出新型视频生成模型Factorized-Dreamer,它专门用于将文本转换成高质量的视频(Text-to-Video, T2V)。Factorized-Dreame...新技术# Factorized-Dreamer# 视频生成模型2年前04280
Adobe推出全新图像编辑方法TurboEdit:实现基于文本的即时图像编辑Adobe Research推出了一种全新的图像编辑方法TurboEdit,它能够实现基于文本的即时图像编辑,它利用了所谓的"少步骤扩散模型"(few-step diffusion models),在...新技术# TurboEdit# 图像编辑2年前05440
新型视频人脸超分辨率技术KEEP:让模糊不清的人脸视频变得清晰南洋理工大学 S-Lab推出一种新型视频人脸超分辨率技术KEEP,也就是让模糊不清的人脸视频变得清晰。例如,你手里有一些老旧电影的片段,或者监控摄像头拍到的模糊人脸,这项技术能够让这些人脸在视频中变得...新技术# KEEP# 视频人脸超分辨率2年前01,5760
基于扩散模型的无需反转的人像风格化框架ZePo:在无需任何模型微调的情况下,快速生成具有特定艺术风格的肖像图像上海科技大学信息科学技术学院和中国科学院自动化研究所的研究人员推出了一种基于扩散模型的无需反转的人像风格化框架ZePo,它能够在无需任何模型微调的情况下,仅需四个采样步骤就能实现内容和风格特征的融合...新技术# ZePo# 人像风格化2年前05510
创新框架Generative Photomontage:通过组合多个生成的图像来创建他们所需的图像卡内基梅隆大学和赖希曼大学的研究人员推出创新框架Generative Photomontage,它使用户能够通过组合多个生成的图像来创建他们所需的图像,这个过程就像是用不同的图像拼贴出一幅全新的画面...新技术# Generative Photomontage2年前05280
新型视频生成模型FancyVideo:根据文本提示生成动态丰富且时间上连贯的视频360 AI研究中心和中山大学的研究人员推出新型视频生成模型FancyVideo,它能够根据文本提示生成动态丰富且时间上连贯的视频。FancyVideo通过精心设计的跨帧文本引导模块(CTGM)改进了...新技术# FancyVideo2年前08660