新型视频生成框架Tora:基于DiT框架构建,专门用于生成受轨迹指导的视频内容阿里巴巴推出新型视频生成框架Tora,它基于DiT(Diffusion Transformer)框架构建,专门用于生成受轨迹指导的视频内容。简而言之,Tora能够根据文本、图像、轨迹或这些元素的组合来...新技术# Tora# 视频生成2年前05480
新型视频生成方法TRF:控制视频内容在给定的起始和结束帧之间进行生成来自马克斯·普朗克智能系统研究所、Adobe和加州大学圣地亚哥分校的研究团队推出新型视频生成方法Time Reversal Fusion(时间反转融合,简称TRF),它能够控制视频内容在给定的起始...新技术# TRF# 视频生成2年前05410
新型框架Uni3C:通过3D增强技术实现对视频生成中相机和人体运动的精确控制阿里达摩院、复旦大学和湖畔实验室的研究人员推出新型框架Uni3C,旨在通过3D增强技术实现对视频生成中相机和人体运动的精确控制。Uni3C通过将相机控制和人体运动控制统一到一个框架中,解决了现有方法中...新技术# Uni3C# 人体运动# 视频生成9个月前05360
ComfyUI原生支持视频生成模型Mochi,12G显存即可进行生成随着技术的不断进步,视频生成领域也在持续创新。近日,ComfyUI 在其最新的 v0.2.7 版本中加入了对 Mochi 模型的原生支持,这标志着 ComfyUI 社区迎来了一次重大升级,即便是使用消...工作流# ComfyUI# Mochi# 视频生成1年前05070
视频生成通用世界模型WorldDreamer:可以完成自然场景和自动驾驶场景多种视频生成任务来自清华和极佳科技的研究人员联手推出了全新的视频生成通用世界模型WorldDreamer。它可以完成自然场景和自动驾驶场景多种视频生成任务,例如文生视频、图生视频、视频编辑、动作序列生视频等。 项目主...新技术# WorldDreamer# 视频生成2年前04980
新型视频生成方法TrackGo:根据用户的输入精确控制视频中对象的运动北京航空航天大学和爱诗科技的研究人员推出新型视频生成方法TrackGo,它能够根据用户的输入精确控制视频中对象的运动。这项技术允许用户通过自由形式的遮罩(masks)和箭头来指定目标对象或部分,以及它...新技术# TrackGo# 视频生成1年前04800
字节跳动推出基于修正流Transformer 架构的新型图像和视频生成模型家族Goku香港大学和字节跳动的研究人员推出新型图像和视频生成模型家族Goku,它基于修正流Transformer 架构,实现了行业领先的图像和视频联合生成性能。Goku 的目标是通过高质量的视觉内容生成,推动媒...视频模型# Goku# 字节跳动# 视频生成12个月前04670
新型视频生成框架CustomCrafter:根据文本提示和主题参考图像生成高质量视频浙江大学、腾讯人工智能实验室和腾讯 PCG ARC 实验室的研究人员推出新型视频生成框架CustomCrafter,它可以根据文本提示和主题参考图像生成高质量视频。这项技术的目标是让用户能够自定义视频...新技术# CustomCrafter# 视频生成1年前04670
可控图像到视频生成框架SG-I2V:用于在图像到视频的生成过程中实现对象和相机运动的控制图像到视频生成技术已经取得了显著的进步,能够生成高度逼真的视频。然而,调整生成视频中的特定元素,如物体运动或相机移动,通常需要繁琐的试错过程,例如使用不同的随机种子重新生成视频。最近的技术通过微调预训...新技术# SG-I2V# 视频生成1年前04660
无需预先训练框架MotionClone:通过复制参考视频中的动作来指挥文本导向的视频生成中国科学技术大学、上海交通大学、香港中文大学和上海人工智能实验室的研究人员推出无需预先训练框架MotionClone,它能够实现一种无需训练的运动克隆,用于可控的视频生成。简单来说,这项技术可以让一个...新技术# MotionClone# 视频生成2年前04550
新型视频生成技术Dr. Mo:提高视频生成的效率,同时保持或提升视频质量新型视频生成技术Dr. Mo(Diffusion Reuse MOtion),这项技术的核心在于提高视频生成的效率,同时保持或提升视频质量。研究团队的关键发现是,在早期去噪步骤中的粗粒度噪声在连续视频...新技术# Dr. Mo# 视频生成1年前04470
视频生成框架ReCamMaster:能够根据新的相机轨迹重新渲染输入视频的动态场景浙江大学、快手科技、中国香港中文大学、华中科技大学的研究人员推出一种创新的视频生成框架ReCamMaster,能够根据新的相机轨迹重新渲染输入视频的动态场景。该技术的核心在于通过预训练的文本到视频(t...新技术# ReCamMaster# 动态场景# 视频生成11个月前04070