小马良 - SD百科 - 第67页

Meta推出多模态基础模型家族Chameleon：专为理解和生成图像与文本而设计

Meta推出多模态基础模型家族Chameleon：专为理解和生成图像与文本而设计

Meta推出多模态基础模型家族Chameleon，它们是专为理解和生成图像与文本而设计，多...

2024-05-19 460

腾讯混元团队推出支持中英双语提示词的文生图模型Hunyuan-DiT：能够根据上下文与用户进行多轮多模态对话，生成并优化图像

腾讯混元团队推出支持中英双语提示词的文生图模型Hunyuan-DiT：能够根据上下文与用户进行多轮多模态对话，生成并优化图像

腾讯混元团队推出支持中英双语提示词的文生图模型Hunyuan-DiT，它特别擅长理解中文...

2024-05-15 456

Controlnet作者新项目IC-Light：根据文本提示或参考背景图重新打光生成符合新背景环境光照的图片

Controlnet作者新项目IC-Light：根据文本提示或参考背景图重新打光生成符合新背景环境光照的图片

IC-Light是Controlnet、Fooocus、Stable Diffusion WebUI Forge的开发者lllyasviel...

2024-05-13 620

新型图像上采样模型Inf-DiT：高效地对任何分辨率的图像进行上采样，即提高图像的分辨率而不失细节

新型图像上采样模型Inf-DiT：高效地对任何分辨率的图像进行上采样，即提高图像的分辨率而不失细节

清华大学与智谱AI的研究人员推出新型图像上采样模型Inf-DiT，它能够高效地对任何分...

2024-05-12 698

谷歌推出新框架ImageInWords（IIW）：创建准确且细节丰富的图像描述，以提高视觉-语言模型的训练效果

谷歌推出新框架ImageInWords（IIW）：创建准确且细节丰富的图像描述，以提高视觉-语言模型的训练效果

Google Research、Google DeepMind和华盛顿大学的研究团队推出新框架ImageInWords...

2024-05-12 392

新型视觉模型EfficientViT：专门用于高分辨率的密集预测任务

新型视觉模型EfficientViT：专门用于高分辨率的密集预测任务

来自MIT、浙江大学、清华大学、MIT-IBM Watson AI实验室的研究人员推出新型视觉模...

2024-05-12 396

AI音乐创作神器Suno！只需一个提示即可快速创作歌曲

AI音乐创作神器Suno！只需一个提示即可快速创作歌曲

作为一家AI 音乐初创企业Suno，去年就已经推出开源语音生成模型「Bark」引发热议，...

2024-05-06 1.12k

如何从HuggingFace导入新模型到Ollama

如何从HuggingFace导入新模型到Ollama

在《如何在本地安装及使用Ollama，轻松玩转本地大语言模型》这篇文章里，已经详细...

2024-05-06 1.03k

如何在本地安装及使用Ollama，轻松玩转本地大语言模型

如何在本地安装及使用Ollama，轻松玩转本地大语言模型

在《打造本地专属GPT！使用这些软件轻松运行开源大语言模型》这篇文章里，已经向大...

2024-05-05 818

打造本地专属GPT！使用这些软件轻松运行开源大语言模型

打造本地专属GPT！使用这些软件轻松运行开源大语言模型

在目前大语言模型方面最强的要数ChatGPT、Claude和Gemini，这些都是闭源模型，而且...

2024-05-05 1.05k

Adobe Podcast：一键打造专业级播客音质，AI音频神器免费体验

Adobe Podcast：一键打造专业级播客音质，AI音频神器免费体验

以其旗舰产品Photoshop闻名全球的Adobe，其实拥有一系列覆盖图像、视频、音频处理...

2024-05-05 918

漫画生成框架StoryDiffusion：根据提示词生成短篇漫画，多种风格可选

漫画生成框架StoryDiffusion：根据提示词生成短篇漫画，多种风格可选

字节跳动推出的图像和视频生成框架StoryDiffusion，它能够生成一系列内容一致的图...

2024-05-04 1.23k

升级VIP
全屏浏览
夜间模式
返回顶部