Magic Mirror框架:生成具有身份保持(ID-Preserved)和动态运动的高质量视频
香港中文大学、香港科技大学、思谋科技和卡内基梅隆大学的研究人员推出Magic Mirro...
新型视频超分辨率(VSR)框架STAR:通过整合文生视频模型,解决真实世界视频超分辨率中的空间细节和时间一致性问题
在处理真实世界视频超分辨率任务时,基于生成对抗网络(GAN)的方法常常面临过...
华中科技大学推出VA-VAE和LightningDiT框架:在不牺牲重建质量的前提下,显著提升生成性能
华中科技大学的研究团队聚焦于潜在扩散模型(latent diffusion models)中的优化困...
零样本视频对象插入框架VideoAnydoor:能够在视频中高精度地插入给定对象,并且允许用户精确控制对象的运动
由香港大学和阿里巴巴达摩院等机构的研究团队推出零样本视频对象插入框架VideoAnyd...
Stability AI 推出一种基于大规模 Transformer 架构的新型音频编码模型TAAE
在语音处理领域,标记化(tokenization)是生成或理解语音的关键步骤。传统的语音...