基于区域描述的精确布局组合文生图方法RAG:将复杂的场景分解为单独的区域,并为每个区域提供相应的文本描述,然后生成一张精确布局的图片
南京大学、InstantX、Liblib AI、香港科技大学与中国移动的研究团队共同提出了一种...
专注于二次元角色的动画方法MikuDance:将二次元角色根据 Open Pose 姿势生成对应动画
武汉大学、阶跃星辰和字节跳动的研究人员推出MikuDance,它是一个基于扩散的动画制...
ParaAttention:通过上下文并行注意力机制,使用多个GPU加速FLUX和Mochi模型的推理
ParaAttention是一种创新的上下文并行注意力机制,旨在通过多个GPU加速FLUX和Mochi...
Autodesk推出新型3D生成模型WaLa:基于多种输入条件(如文本描述、图像、点云等)生成参数化的3D CAD模型
Autodesk推出新型3D生成模型“Wavelet Latent Diffusion (WaLa)”,它能够基于多种输...
英伟达推出图像生成模型家族Edify Image:能够生成高保真度的图像内容,并且具有像素级完美准确性
英伟达推出图像生成模型家族Edify Image,它们能够生成高保真度的图像内容,并且具...