苹果公司介绍了一个名为STIV(Scalable Text and Image Conditioned Video Generat...
2024-12-13 88
大型生成模型(如大语言模型LLMs和文本到图像扩散模型T2Is)的能力不断增强,但其...
2024-11-08 146
苹果推出新预训练方法CLOC(对比定位语言-图像预训练),旨在提升图像和文本表示的...
2024-10-05 238
苹果推出一个用于零样本度量单目深度估计的基础模型Depth Pro,它用于提高单目深度...
2024-10-05 248
苹果和弗吉尼亚理工大学的研究人员推出新型图像生成模型Kaleido Diffusion,此模型...
2024-06-03 330
来自苹果的团队推出开源图像编辑模型MGIE(MLLM-Guided Image Editing),它旨在...
2024-02-05 342
谷歌的研究团队推出了新的文生图模型MobileDiffusion,它能够在手机上几乎瞬间(...
2024-02-02 443