Controlnet作者lllyasviel新开源项目Omost:将大语言模型的编程能力转化为图像合成能力
Controlnet作者lllyasviel的新开源项目Omost,这是一个将大语言模型的编程能力转化...
人像视频生成框架V-Express:平衡不同控制信号(如文本、音频、参考图像、姿态、深度图等)的强弱,以便在生成视频中实现更协调和有效的控制
南京大学和腾讯人工智能实验室的研究人员推出人像视频生成框架V-Express,它用于生...
视频插帧新技术ZeroSmooth:提升预训练视频扩散模型生成高帧率视频的能力,而无需额外的训练数据和参数更新
中国科学院大学人工智能学院、中国科学院自动化研究所模式识别新实验室和腾讯AI实...
先进的视频深度估计方法ChronoDepth:通过结合视频生成模型的先验知识,有效地提高了深度估计的准确性和时间一致性
浙江大学、博洛尼亚大学、蚂蚁集团和Rock Universe的研究人员推出一种先进的视频深...
苹果推出新型图像生成模型Kaleido Diffusion:通过整合自回归的潜在先验来增强采样的图像多样性
苹果和弗吉尼亚理工大学的研究人员推出新型图像生成模型Kaleido Diffusion,此模型...