苹果公司介绍了一个名为STIV(Scalable Text and Image Conditioned Video Generat...
1周前 44

大型生成模型(如大语言模型LLMs和文本到图像扩散模型T2Is)的能力不断增强,但其...
2024-11-08 100

苹果推出新预训练方法CLOC(对比定位语言-图像预训练),旨在提升图像和文本表示的...
2024-10-05 194

苹果推出一个用于零样本度量单目深度估计的基础模型Depth Pro,它用于提高单目深度...
2024-10-05 188

苹果和弗吉尼亚理工大学的研究人员推出新型图像生成模型Kaleido Diffusion,此模型...
2024-06-03 292

来自苹果的团队推出开源图像编辑模型MGIE(MLLM-Guided Image Editing),它旨在...
2024-02-05 290

谷歌的研究团队推出了新的文生图模型MobileDiffusion,它能够在手机上几乎瞬间(...
2024-02-02 397
没有账号?注册  忘记密码?