统一的控制视频生成方法AnimateAnything:实现对视频内容的精确和一致性的操控,包括相机轨迹、文本提示和用户运动注释等多种条件
视频生成是一个复杂而多样的任务,涉及多个条件的控制,如摄像机轨迹、文本提示和...
基于区域描述的精确布局组合文生图方法RAG:将复杂的场景分解为单独的区域,并为每个区域提供相应的文本描述,然后生成一张精确布局的图片
南京大学、InstantX、Liblib AI、香港科技大学与中国移动的研究团队共同提出了一种...
专注于二次元角色的动画方法MikuDance:将二次元角色根据 Open Pose 姿势生成对应动画
武汉大学、阶跃星辰和字节跳动的研究人员推出MikuDance,它是一个基于扩散的动画制...
ParaAttention:通过上下文并行注意力机制,使用多个GPU加速FLUX和Mochi模型的推理
ParaAttention是一种创新的上下文并行注意力机制,旨在通过多个GPU加速FLUX和Mochi...
Autodesk推出新型3D生成模型WaLa:基于多种输入条件(如文本描述、图像、点云等)生成参数化的3D CAD模型
Autodesk推出新型3D生成模型“Wavelet Latent Diffusion (WaLa)”,它能够基于多种输...