新型视频生成框架VideoGuide:改善视频生成模型在时间连续性方面的性能,同时保持甚至提高生成视频的图像质量
韩国科学技术研究院推出新型框架VideoGuide,它能够改善视频生成模型在时间连续性...
图像生成框架OmniBooth:根据用户的多模态指令(如文本提示或图像参考)来生成具有空间控制和实例级定制化的图像
香港科技大学和华为诺亚方舟实验室的研究人员推出图像生成框架OmniBooth,它可以根...
基于多模态token的新型基础模型MIO:能够以端到端、自回归的方式理解和生成语音、文本、图像和视频
北京航空航天大学、01.AI、香港理工大学、AIWaves、阿尔伯塔大学、滑铁卢大学、曼...
新颖的图生视频方法PhysGen:能够将一张静态图片转换成一段真实感强、物理上可信、时间上连贯的视频
伊利诺伊大学香槟分校推出一种新颖的图像到视频生成方法PhysGen,它能够将一张静态...