Meta Motivo 是一个创新的行为基础模型,旨在通过一种新的无监督强化学习(RL)算...
2周前 56

DeepSeek-VL2 是由深度求索(DeepSeek-AI)推出的一系列先进混合专家(MoE, Mixtur...
2周前 46

去年,在 AI Journey 2023 大会上,Sber AI 推出了两款引人注目的模型:用于图像生...
2周前 84

尽管带有蒸馏的校正流(ReFlows)为快速采样提供了一种有前景的方法,但其...
2周前 66

南洋理工大学(NTU)S-Lab提出了一种新的图像超分辨率(Super-Resolution, SR)技...
2周前 62

近年来,文本到图像定制技术的进步使得个性化图像的高保真、内容丰富的生成成为可...
2周前 52

可控的人体图像动画旨在使用驱动视频从参考图像生成视频。为了确保运动对齐,最近...
2周前 52

开发当代多模态大语言模型(MLLMs)的标准做法是将视觉编码器的特征输入到大型语言...
2周前 58

随着多模态大语言模型(MLLMs)的发展,扩展到单一领域之外的能力对于满足更通用和...
2周前 52

现有的文本到图像(T2I)扩散模型虽然在生成高质量图像方面表现出色,但面临着几个...
2周前 58

香港中文大学、上海AI实验室和南洋理工大学的研究人员推出新型框架Neural LightRig...
2周前 62

在个性化生成任务中,扩散模型(Diffusion Models)已经取得了显著的成就。传统的...
2周前 52
没有账号?注册  忘记密码?