字节跳动推出统一的视频生成框架Phantom :通过跨模态对齐实现主体一致性的视频生成 字节跳动的研究人员推出一个统一的视频生成框架Phantom ,通过跨模态对齐实现主体一致性的视频生成(Subject-to-Video, S2V),用于单主体和多主体参考,构建在现有的文本到视频和图像... 新技术# Phantom# 字节跳动# 视频生成 3天前0110
Adobe 推出全新 Firefly 应用程序,扩展生成式 AI 产品线 Adobe发布了全新的Firefly 应用程序,这是一款集生成图像、矢量和视频于一体的全面创意工具。它不仅提供了无与伦比的创意控制能力,还与 Adobe Creative Cloud 应用程序深度集成... 早报# Adobe# Firefly# 视频生成 1周前0200
新型图生视频模型VidCRAFT3:能够同时控制相机运动、物体运动和光照方向 复旦大学、浙江大学、华为诺亚方舟实验室、西湖大学的研究人员推出新型高质量图像到视频生成模型VidCRAFT3 ,能够同时控制相机运动、物体运动和光照方向。它通过解耦这些视觉元素的控制,实现了对生成视频... 新技术# VidCRAFT3# 视频生成 1周前0200
新型视频生成技术Magic 1-For-1:通过优化内存消耗和推理延迟,快速生成高质量的视频内容 北京大学、Hedra和英伟达的研究人员推出新型视频生成技术Magic 1-For-1 ,通过将复杂的文本到视频(T2V)生成任务分解为两个更简单的子任务:文本到图像(T2I)生成和图像到视频( I2V... 视频模型# Magic 1-For-1# 视频生成 1周前0170
字节跳动推出基于修正流Transformer 架构的新型图像和视频生成模型家族Goku 香港大学和字节跳动的研究人员推出新型图像和视频生成模型家族Goku,它基于修正流Transformer 架构,实现了行业领先的图像和视频联合生成性能。Goku 的目标是通过高质量的视觉内容生成,推动媒... 视频模型# Goku# 字节跳动# 视频生成 2周前0570
字节跳动推出新型身份保持视频生成方法EchoVideo 字节跳动推出新型身份保持视频生成方法EchoVideo ,旨在通过多模态特征融合解决传统方法中存在的“复制粘贴”现象和身份相似度低的问题。该方法能够生成高质量、连贯且一致的视频内容,同时保持人物的身份... 新技术# EchoVideo# 视频生成 4周前0640
新型视频生成框架GS-DiT:通过伪4D高斯场实现对视频内容的精确4D控制 香港中文大学多媒体实验室、博智感知交互研究中心和Avolution AI的研究人员推出新型视频生成框架GS-DiT,旨在通过伪4D高斯场实现对视频内容的精确4D控制。GS-DiT通过构建伪4D高斯场并... 新技术# GS-DiT# 视频生成 1个月前0810
新型3D感知视频扩散方法DaS:实现对视频生成过程的多样化和精确控制 香港科技大学、浙江大学、香港大学、南洋理工大学、武汉大学和德克萨斯农工大学的研究人员推出新型3D感知视频扩散方法“Diffusion as Shader(DaS)”,旨在实现对视频生成过程的多样化和精... 新技术# DaS# 视频生成 1个月前0890
基于扩散模型的人类视频生成框架AnchorCrafter:用于创建高保真度的主播风格产品推广视频。 自动生成锚点风格的产品推广视频在在线商务、广告和消费者互动中展现出巨大的潜力。然而,尽管姿态引导的人类视频生成技术取得了显著进展,这一任务仍然充满挑战。特别是将人-物交互(Human-Object I... 新技术# AnchorCrafter# 视频生成 3个月前01030
Free^2Guide:无梯度框架提升文本到视频(T2V)生成中的文本对齐 扩散模型在文本到图像(T2I)和文本到视频(T2V)合成等生成任务中取得了显著成果。然而,在T2V生成中,实现准确的文本对齐仍然是一个具有挑战性的问题,尤其是在处理帧间复杂的时序依赖性时。现有的基于强... 新技术# Free^2Guide# 视频生成 3个月前01200
新型故事视频生成框架DreamRunner:根据文本脚本生成长篇、多动作、多场景的视频,适用于CogVideoX模型 故事讲述视频生成(SVG)是一项旨在从文本脚本创建长时间、多动作、多场景视频的任务。这种技术在媒体和娱乐领域的内容创作中具有巨大潜力,但同时也面临着诸多挑战,包括但不限于: 物体需要展示一系列精细、复... 新技术# DreamRunner# 视频生成 3个月前01470
统一的控制视频生成方法AnimateAnything:实现对视频内容的精确和一致性的操控,包括相机轨迹、文本提示和用户运动注释等多种条件 视频生成是一个复杂而多样的任务,涉及多个条件的控制,如摄像机轨迹、文本提示和用户运动注释。现有的方法通常只能在特定条件下生成视频,缺乏灵活性和一致性。为了解决这些问题,浙江大学 CAD&CG ... 新技术# AnimateAnything# 视频生成 3个月前01590