视频生成通用世界模型WorldDreamer:可以完成自然场景和自动驾驶场景多种视频生成任务 来自清华和极佳科技的研究人员联手推出了全新的视频生成通用世界模型WorldDreamer。它可以完成自然场景和自动驾驶场景多种视频生成任务,例如文生视频、图生视频、视频编辑、动作序列生视频等。 项目主... 新技术# WorldDreamer# 视频生成 1年前03170
新型视频生成框架CustomCrafter:根据文本提示和主题参考图像生成高质量视频 浙江大学、腾讯人工智能实验室和腾讯 PCG ARC 实验室的研究人员推出新型视频生成框架CustomCrafter,它可以根据文本提示和主题参考图像生成高质量视频。这项技术的目标是让用户能够自定义视频... 新技术# CustomCrafter# 视频生成 6个月前03040
新型视频生成方法TrackGo:根据用户的输入精确控制视频中对象的运动 北京航空航天大学和爱诗科技的研究人员推出新型视频生成方法TrackGo,它能够根据用户的输入精确控制视频中对象的运动。这项技术允许用户通过自由形式的遮罩(masks)和箭头来指定目标对象或部分,以及它... 新技术# TrackGo# 视频生成 6个月前02960
无需预先训练框架MotionClone:通过复制参考视频中的动作来指挥文本导向的视频生成 中国科学技术大学、上海交通大学、香港中文大学和上海人工智能实验室的研究人员推出无需预先训练框架MotionClone,它能够实现一种无需训练的运动克隆,用于可控的视频生成。简单来说,这项技术可以让一个... 新技术# MotionClone# 视频生成 8个月前02830
ComfyUI原生支持视频生成模型Mochi,12G显存即可进行生成 随着技术的不断进步,视频生成领域也在持续创新。近日,ComfyUI 在其最新的 v0.2.7 版本中加入了对 Mochi 模型的原生支持,这标志着 ComfyUI 社区迎来了一次重大升级,即便是使用消... 工作流# ComfyUI# Mochi# 视频生成 4个月前02580
无需训练的新策略FasterCache:加速高质量视频生成的视频生成模型的推理 视频生成是当前 AI 领域的一个热点研究方向,特别是基于扩散模型的方法。然而,这些模型的推理速度通常较慢,限制了它们在实际应用中的效率。香港大学、南洋理工大学 S-Lab 和上海人工智能实验室的研究人... 新技术# FasterCache# 视频生成 4个月前02530
新型视频生成技术Dr. Mo:提高视频生成的效率,同时保持或提升视频质量 新型视频生成技术Dr. Mo(Diffusion Reuse MOtion),这项技术的核心在于提高视频生成的效率,同时保持或提升视频质量。研究团队的关键发现是,在早期去噪步骤中的粗粒度噪声在连续视频... 新技术# Dr. Mo# 视频生成 5个月前02400
可控图像到视频生成框架SG-I2V:用于在图像到视频的生成过程中实现对象和相机运动的控制 图像到视频生成技术已经取得了显著的进步,能够生成高度逼真的视频。然而,调整生成视频中的特定元素,如物体运动或相机移动,通常需要繁琐的试错过程,例如使用不同的随机种子重新生成视频。最近的技术通过微调预训... 新技术# SG-I2V# 视频生成 4个月前01980
新型视频分词器LARP:专为自回归(AR)生成模型设计,用于提高视频生成任务的性能 马里兰大学学院公园分校的研究人员提出了一种名为LARP(Latent Aggregation and Refinement for Perception)的新型视频分词器,它专为自回归(AR)生成模型... 新技术# LARP# 视频分词器# 视频生成 4个月前01980
Meta推出创新方案AdaCache(自适应缓存):不进行额外训练的情况下加速视频生成 视频生成是AI研究的一个热点领域,特别是在生成时间上一致、高保真的视频方面。这一领域涉及创建在帧之间保持视觉连贯性并在时间上保留细节的视频序列。近年来,机器学习模型,尤其是扩散变换器(DiTs),已成... 新技术# AdaCache# Meta AI# 自适应缓存 4个月前01890
统一的控制视频生成方法AnimateAnything:实现对视频内容的精确和一致性的操控,包括相机轨迹、文本提示和用户运动注释等多种条件 视频生成是一个复杂而多样的任务,涉及多个条件的控制,如摄像机轨迹、文本提示和用户运动注释。现有的方法通常只能在特定条件下生成视频,缺乏灵活性和一致性。为了解决这些问题,浙江大学 CAD&CG ... 新技术# AnimateAnything# 视频生成 3个月前01600
新型故事视频生成框架DreamRunner:根据文本脚本生成长篇、多动作、多场景的视频,适用于CogVideoX模型 故事讲述视频生成(SVG)是一项旨在从文本脚本创建长时间、多动作、多场景视频的任务。这种技术在媒体和娱乐领域的内容创作中具有巨大潜力,但同时也面临着诸多挑战,包括但不限于: 物体需要展示一系列精细、复... 新技术# DreamRunner# 视频生成 3个月前01470