图像模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

SWITTI：用于文本到图像合成的新型规模感知变换器模型

Yandex Research、HSE 大学、MIPT 和 Skoltech 的研究人员提出了 Switti，这是一个专门设计用于文本到图像（T2I）生成的尺度变换器。Switti 从现有的下一尺度预...

图像模型 # SWITTI # 文生图模型

12个月前

02990

阿里通义发布Z-Image-Turbo：60 亿参数高效图像模型，支持中英双语文本渲染与亚秒级生成

在图像生成模型多依赖“大参数堆料”的行业趋势下，阿里通义MAX项目组推出的Z-Image，以60亿参数的轻量化体量实现了颠覆性突破。这款通过系统性优化打造的图像生成基础模型，不仅在照片级真实感生成、中...

图像模型 # Z-Image-Turbo

2个月前

02940

复旦等团队联合突破文生图模型生成瓶颈：Pref-GRPO解决奖励操控，UniGenBench补上评估短板

文本到图像（T2I）生成技术的进步，离不开强化学习方法的优化与基准测试的支撑。但当前领域存在两大核心问题：一是传统强化学习依赖“点式奖励模型”打分，易出现“分数涨而质量降”的奖励操控现象；二是现有基准...

图像模型 # Pref-GRPO # 文生图模型

5个月前

02940

新型图像编辑框架PhotoDoodle：通过文字提示在照片中添加艺术化装饰

新加坡国立大学、上海交通大学、北京邮电大学、字节跳动和Tiamat的研究人员推出新型图像编辑框架PhotoDoodle，通过少量样本学习艺术家的独特风格，将装饰元素（如手绘线条、装饰图案等）无缝叠加到...

图像模型 # PhotoDoodle # 图像编辑框架 # 照片涂鸦

11个月前

02900

新型多层透明图像生成方法ART：通过全局文本提示和匿名区域布局直接生成具有多个透明图层的图像

微软亚洲研究院、清华大学、北京大学和中国科学技术大学的研究人员推出新型多层透明图像生成方法Anonymous Region Transformer (ART) ，通过全局文本提示和匿名区域布局直接生成...

图像模型 # ART # 透明图像

11个月前

02900

上海AI实验室发布Lumina系列图像生成模型的最新成果—Lumina-Image 2.0

上海AI实验室正式发布了Lumina系列图像生成模型的最新成果——Lumina-Image 2.0。这一版本不仅提高了图像生成的效率，还通过其统一且透明的设计理念，为用户提供了更加流畅和便捷的使用体验...

图像模型 # Lumina-Image 2.0

12个月前

02860

Pattern Diffusion：专为无缝图案生成而生的扩散模型

由开发者 Alex Reid 推出的 Pattern Diffusion，是一个专为生成可平铺（tiling）表面图案而从零训练的扩散模型。它基于 Stable Diffusion 2-Base 架构...

图像模型 # Pattern Diffusion # 无缝图案

6个月前

02840

RouWei-Gemma：基于 Gemma-3-1b 的文本编码器适配器（用于 Rouwei 0.8）

RouWei-Gemma是一个为 Rouwei 0.8 开发的文本编码器适配器，基于 Gemma-3-1b 构建，用于替换 SDXL 中的 CLIP 文本编码器。它利用大语言模型（LLM）的强大语义理...

图像模型 # Gemma-3-1b # Rouwei 0.8 # RouWei-Gemma

7个月前

02830

PixNerd：无需 VAE，用神经场实现端到端像素级图像生成

在图像生成领域，扩散模型已成主流，但其典型架构依赖变分自编码器（VAE）将图像压缩至低维潜在空间，再在该空间进行生成。这种“两阶段”范式虽能降低计算负担，却也带来了解码伪影与信息损失等固有缺陷。为突...

图像模型 # PixNerd

6个月前

02800

DRA-Ctrl：利用视频生成模型实现可控图像生成的新范式

近年来，视频生成模型因其能够捕捉现实世界中的动态变化和复杂因果关系，被广泛视为一种“世界模拟器”。它们整合了视觉、时间、空间和语义等多个维度的信息，在建模长程依赖和多模态交互方面展现出强大潜力。那么...

图像模型 # DRA-Ctrl # HunyuanVideo-I2V # 知识迁移

7个月前

02800

基于FLUX模型的图像定制框架DreamO：支持多种图像定制任务，同时实现多种条件（如身份、主体、风格、背景等）的无缝集成

字节跳动和北京大学深圳研究生院的研究人员推出一个基于DiT模型的图像定制框架DreamO ，旨在支持多种图像定制任务，同时实现多种条件（如身份、主体、风格、背景等）的无缝集成。它通过引入特征路由约束和...

图像模型 # DreamO # 图像定制框架

9个月前

02800

EasyControl 框架：基于扩散变换器（DiT架构）的图像生成模型提供高效且灵活的条件控制能力

Tiamat AI、上海科技大学、新加坡国立大学和Liblib AI的研究人员推出 EasyControl 框架，为基于扩散变换器（DiT架构）的图像生成模型提供高效且灵活的条件控制能力。它通过一系列...

图像模型 # DiT架构 # EasyControl

10个月前

02790

加载更多

SWITTI：用于文本到图像合成的新型规模感知变换器模型

阿里通义发布Z-Image-Turbo：60 亿参数高效图像模型，支持中英双语文本渲染与亚秒级生成

复旦等团队联合突破文生图模型生成瓶颈：Pref-GRPO解决奖励操控，UniGenBench补上评估短板

新型图像编辑框架PhotoDoodle：通过文字提示在照片中添加艺术化装饰

新型多层透明图像生成方法ART：通过全局文本提示和匿名区域布局直接生成具有多个透明图层的图像

上海AI实验室发布Lumina系列图像生成模型的最新成果—Lumina-Image 2.0

Pattern Diffusion：专为无缝图案生成而生的扩散模型

RouWei-Gemma：基于 Gemma-3-1b 的文本编码器适配器（用于 Rouwei 0.8）

PixNerd：无需 VAE，用神经场实现端到端像素级图像生成

DRA-Ctrl：利用视频生成模型实现可控图像生成的新范式

基于FLUX模型的图像定制框架DreamO：支持多种图像定制任务，同时实现多种条件（如身份、主体、风格、背景等）的无缝集成

EasyControl 框架：基于扩散变换器（DiT架构）的图像生成模型提供高效且灵活的条件控制能力

新QoderWork

OpenClaw（Clawdbot/Moltbot）

Situation Monitor

Skills.sh

中国科技云数据胶囊

CutCut

图像模型

网址

新QoderWork

OpenClaw（Clawdbot/Moltbot）

Situation Monitor

Skills.sh

中国科技云数据胶囊

CutCut