微信 AI 模式识别中心推出视觉语言模型POINTS1.5系列,旨在提升对真实世界应用的处...
2周前 54

浙江大学、快手科技、清华大学和香港中文大学的研究人员推出一种用于多视角视频生...
2周前 52

文本到图像(T2I)生成任务的目标是从文本提示生成逼真的图像。尽管扩散模型在这一...
2周前 42

图像到视频(I2V)生成任务的目标是从单张图像生成一段连贯的视频,通常涉及对目标...
2周前 48

三星和帕多瓦大学的研究人员推出一种用于主题-风格条件图像生成技术LoRA.rar,通过...
2周前 38

牛津大学、Snap和MBZUAI的研究人员介绍了一种名为DiTFlow的方法,它是一种专为DiT...
2周前 46

高通AI研究院推出一个专为移动设备优化的视频编辑模型MoViE,能够在手机上实现每秒...
2周前 50

高通AI研究院推出了一个为移动设备优化的视频生成模型Mobile Video Diffusion(Mob...
2周前 54

图像生成和编辑任务在计算机视觉领域中具有广泛的应用,如图像合成、风格迁移、图...
2周前 46

清华大学和字节跳动的研究人员推出ACDIT,它是一种介于自回归模型和扩散模型之间的...
2周前 50

故事可视化,即将文本描述转化为视觉叙事的任务,近年来随着文本到图像生成模型的...
2周前 54

苹果公司介绍了一个名为STIV(Scalable Text and Image Conditioned Video Generat...
2周前 50
没有账号?注册  忘记密码?