Meta推出多模态基础模型家族Chameleon,它们是专为理解和生成图像与文本而设计,多...
2024-05-19 460

腾讯混元团队推出支持中英双语提示词的文生图模型Hunyuan-DiT,它特别擅长理解中文...
2024-05-15 456

IC-Light是Controlnet、Fooocus、Stable Diffusion WebUI Forge的开发者lllyasviel...
2024-05-13 620

清华大学与智谱AI的研究人员推出新型图像上采样模型Inf-DiT,它能够高效地对任何分...
2024-05-12 698

Google Research、Google DeepMind和华盛顿大学的研究团队推出新框架ImageInWords...
2024-05-12 392

来自MIT、浙江大学、清华大学、MIT-IBM Watson AI实验室的研究人员推出新型视觉模...
2024-05-12 396

作为一家AI 音乐初创企业Suno,去年就已经推出开源语音生成模型「Bark」引发热议,...
2024-05-06 1.12k

在《如何在本地安装及使用Ollama,轻松玩转本地大语言模型》这篇文章里,已经详细...
2024-05-06 1.03k

在《打造本地专属GPT!使用这些软件轻松运行开源大语言模型》这篇文章里,已经向大...
2024-05-05 818

在目前大语言模型方面最强的要数ChatGPT、Claude和Gemini,这些都是闭源模型,而且...
2024-05-05 1.05k

以其旗舰产品Photoshop闻名全球的Adobe,其实拥有一系列覆盖图像、视频、音频处理...
2024-05-05 918

字节跳动推出的图像和视频生成框架StoryDiffusion,它能够生成一系列内容一致的图...
2024-05-04 1.23k
没有账号?注册  忘记密码?