扩散模型中“幻觉”(hallucinations)现象:生成了一些在训练数据中从未出现过的样本
卡内基梅隆大学和DatalogyAI的研究人员发布论文探讨扩散模型(diffusion models)...
文生图模型偏好优化方法MaPO(边界感知偏好优化):让计算机在学习生成图像时,能够更好地符合人类的偏好
韩国科学技术研究院、Huggingface和高丽大学的研究人员推出一种新的文本到图像扩散...
新型文本到视频生成框架VideoTetris:专门设计来解决现有方法在处理复杂场景(如多对象或对象数量动态变化的长视频)生成时面临的挑战
来自北京大学和快手科技的研究人员推出新型文本到视频生成框架VideoTetris,此框架...
Follow-Your系列新框架Follow-Your-Pose v2:用于于角色图像动画的框架,可以根据一系列的动作信号(比如视频、深度图或姿势序列)生成动画视频
来自腾讯混元团队、中山大学、香港科技大学的研究人员推出Follow-Your系列新框架Fo...
Follow-Your系列新框架Follow-Your-Emoji:基于扩散模型的肖像动画框架,生成富有表现力的表情动画
来自香港科技大学、腾讯混元团队和清华大学的研究团队推出Follow-Your系列新框架Fo...