小马良 - SD百科 - 第60页

基准测试CommonsensenT2I：用于评估文生图模型（T2I）生成符合现实生活常识的图像的能力

基准测试CommonsensenT2I：用于评估文生图模型（T2I）生成符合现实生活常识的图像的能力

宾夕法尼亚大学和加州大学圣塔芭芭拉分校的研究人员推出基准测试CommonsensenT2I，...

2024-06-17 282

Adobe推出Toffee：用于主题驱动的文本到图像生成的高效数据集构建方法

Adobe推出Toffee：用于主题驱动的文本到图像生成的高效数据集构建方法

Adobe Research和加州大学圣克鲁斯分校的研究人员推出Toffee系统，它是一个用于主...

2024-06-16 318

新型图像压缩技术CMC（模态压缩）：利用大型多模态模型来实现图像到文本再到图像的转换，从而在保持图像质量的同时，大幅度减小图像的大小

新型图像压缩技术CMC（模态压缩）：利用大型多模态模型来实现图像到文本再到图像的转换，从而在保持图像质量的同时，大幅度减小图像的大小

上海交通大学和南洋理工大学的研究人员推出一种新型的图像压缩技术“跨模态压缩”（C...

2024-06-16 418

扩散模型中“幻觉”（hallucinations）现象：生成了一些在训练数据中从未出现过的样本

扩散模型中“幻觉”（hallucinations）现象：生成了一些在训练数据中从未出现过的样本

卡内基梅隆大学和DatalogyAI的研究人员发布论文探讨扩散模型（diffusion models）...

2024-06-16 252

CFG改进版CFG++：帮助生成与文本描述相匹配的图像

CFG改进版CFG++：帮助生成与文本描述相匹配的图像

韩国科学技术院推出新型的图像生成和编辑技术CFG++，这是针对“分类器自由引导”（Cl...

2024-06-16 408

一致性角色工作流程Consistent Character：上传图片并填写提示词，就能让图像中的角色变换姿势和服装

一致性角色工作流程Consistent Character：上传图片并填写提示词，就能让图像中的角色变换姿势和服装

今天我们要介绍的是一个趣味的项目——Consistent Character，它在HuggingFace上提供...

2024-06-16 378

Stability AI释出Stable Diffusion 3 Medium模型，8G显存显卡即可使用

Stability AI释出Stable Diffusion 3 Medium模型，8G显存显卡即可使用

Stability AI终于在6月12日释出了万众期待的Stable Diffusion 3模型，不过此次释出...

2024-06-13 4.03k

文生图模型偏好优化方法MaPO（边界感知偏好优化）：让计算机在学习生成图像时，能够更好地符合人类的偏好

文生图模型偏好优化方法MaPO（边界感知偏好优化）：让计算机在学习生成图像时，能够更好地符合人类的偏好

韩国科学技术研究院、Huggingface和高丽大学的研究人员推出一种新的文本到图像扩散...

2024-06-12 392

OPPO推出多步潜在一致性模型MLCM：用于加速生成图像

OPPO推出多步潜在一致性模型MLCM：用于加速生成图像

OPPO推出多步潜在一致性模型MLCM，它用于加速生成图像的潜在扩散模型（LDMs）。简...

2024-06-12 270

建立在多模态大语言模型基础上的统一文本到图像生成和检索框架TIGeR

建立在多模态大语言模型基础上的统一文本到图像生成和检索框架TIGeR

来自新加坡国立大学 NExT++ 实验室、南洋理工大学、香港理工大学和哈尔滨工业大学...

2024-06-12 482

新型图像生成模型家族LlamaGen：将大语言模型（Llama）应用到视觉图像生成领域

新型图像生成模型家族LlamaGen：将大语言模型（Llama）应用到视觉图像生成领域

香港大学及字节跳动的研究人员推出新型图像生成模型家族LlamaGen，将大语言模型（L...

2024-06-12 384

开放评估平台GenAI Arena：用于评估不同的图像和视频生成模型，用户可以积极参与这些模型的评估过程

开放评估平台GenAI Arena：用于评估不同的图像和视频生成模型，用户可以积极参与这些模型的评估过程

滑铁卢大学的研究人员推出了一个开放评估平台GenAI Arena，用于评估不同的图像和视...

2024-06-11 438

升级VIP
全屏浏览
夜间模式
返回顶部