高质量人类动作视频生成框架MimicMotion:依据任意运动指令生成高质感、任意长度的视频内容 腾讯和上海交通大学的研究人员推出高质量人类动作视频生成框架MimicMotion,依据任意运动指令生成高质感、任意长度的视频内容。简单来说,MimicMotion是一个可以制作出逼真人类动作视频的智能... 新技术# MimicMotion# 视频生成 8个月前04610
新型视频生成模型HPDM:通过分层处理和上下文融合技术,生成高分辨率视频 Snap、阿卜杜拉国王科技大学和特伦托大学的研究人员推出新型视频生成模型Hierarchical Patch Diffusion Models(HPDM,分层补丁扩散模型),这个模型专门设计用于高分辨... 新技术# HPDM# 分层补丁扩散模型# 视频生成 8个月前04320
无需预先训练框架MotionClone:通过复制参考视频中的动作来指挥文本导向的视频生成 中国科学技术大学、上海交通大学、香港中文大学和上海人工智能实验室的研究人员推出无需预先训练框架MotionClone,它能够实现一种无需训练的运动克隆,用于可控的视频生成。简单来说,这项技术可以让一个... 新技术# MotionClone# 视频生成 8个月前02830
字节跳动推出新型视频生成技术CamTrol:为现有的视频扩散模型增添摄像机运动操控功能 中国科学技术大学和字节跳动的研究人员推出新型视频生成技术CamTrol,这是一种无需训练的、强大的解决方案,可以为现有的视频扩散模型增添摄像机运动操控功能。简单来说,就是可以在不经过额外训练的情况下,... 新技术# CamTrol# 字节跳动# 视频生成 8个月前04540
新型视频生成技术“CVD(协作视频扩散)”:生成从多个不同摄像机轨迹视角下观察同一场景的一致性视频 斯坦福大学和香港中文大学的研究人员推出新型视频生成技术“协作视频扩散”(Collaborative Video Diffusion,简称CVD),这项技术的核心目标是能够生成从多个不同摄像机轨迹视角下... 新技术# CVD# 协作视频扩散# 视频生成 9个月前07250
图像和视频生成框架StoryDiffusion:能够生成一系列内容一致的图像和视频 来自南开大学和字节跳动的研究人员推出一种新的图像和视频生成框架StoryDiffusion,这项技术的核心在于它能够生成一系列内容一致的图像和视频,这对于讲述一个故事或者展示一个连贯的场景来说非常重要... 新技术# StoryDiffusion# 图像生成# 视频生成 10个月前05350
新型视频生成方法TRF:控制视频内容在给定的起始和结束帧之间进行生成 来自马克斯·普朗克智能系统研究所、Adobe和加州大学圣地亚哥分校的研究团队推出新型视频生成方法Time Reversal Fusion(时间反转融合,简称TRF),它能够控制视频内容在给定的起始... 新技术# TRF# 视频生成 11个月前03500
DragAnything:视频生成中任意对象的运动控制 来自快手、浙江大学和新加坡国立大学的研究团队推出DragAnything,它是一种用于视频生成和控制的方法,它利用实体表示法来实现对视频生成中任意对象的运动控制。 项目主页 GitHub 论文 例如,... 新技术# DragAnything# 视频生成# 运动控制 12个月前04580
视频生成通用世界模型WorldDreamer:可以完成自然场景和自动驾驶场景多种视频生成任务 来自清华和极佳科技的研究人员联手推出了全新的视频生成通用世界模型WorldDreamer。它可以完成自然场景和自动驾驶场景多种视频生成任务,例如文生视频、图生视频、视频编辑、动作序列生视频等。 项目主... 新技术# WorldDreamer# 视频生成 1年前03160
FreeNoise:通过噪声调度实现无需调参的长视频生成 来自腾讯人工智能实验室、南洋理工大学、香港科技大学的研究人员提出了一种利用预训练的视频扩散模型生成高质量长视频的方法FreeNoise,它能够使模型在生成更长时间视频时保持内容的一致性,无需对模型进行... 新技术# AI视频# FreeNoise# 噪声 1年前04250