图像模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

字节跳动提出的新一代多主体可控图像生成模型XVerse

在文本到图像生成领域，如何实现对多个主体身份和语义属性（如姿势、风格、照明）的细粒度控制，同时保持高质量和一致性，一直是一个极具挑战性的问题。传统方法往往存在以下问题：在多主体场景中容易引入视觉伪...

图像模型 # XVerse # 图像生成模型

7个月前

03630

JarvisArt：由AI驱动的照片修饰智能体，释放你的艺术创造力

来自厦门大学、香港科技大学（广州）、字节跳动、新加坡国立大学等机构的研究人员联合推出了一项令人瞩目的新成果 —— JarvisArt。这是一个由多模态大语言模型（MLLM）驱动的照片修饰智能体，能够理...

图像模型 # JarvisArt # 照片修饰智能体

7个月前

03700

黑森林实验室正式发布图像编辑模型FLUX.1 Kontext [dev]

截至今日，所有高性能的生成式图像编辑模型均为专有工具。今天，这一局面发生了改变。黑森林实验室（Black Forest Labs）发布了 FLUX.1 Kontext [dev]，这是 FLUX.1...

图像模型 # FLUX.1 Kontext [dev]# 图像编辑模型 # 黑森林实验室

7个月前

05890

Janus-4o：基于数据集 ShareGPT-4o-Image 的新型多模态图像生成模型

香港中文大学（深圳）的研究人员推出了一项重要的多模态研究成果 —— ShareGPT-4o-Image 数据集及其衍生的开源多模态大语言模型 Janus-4o。该研究旨在将 GPT-4o 在图像生...

图像模型 # Janus-4o # ShareGPT-4o-Image # 数据集

7个月前

03310

Neta Lumina 发布：专为二次元创作打造的高品质图像生成模型

由捏Ta实验室（Neta.art）训练的 Neta Lumina 是一款专注于二次元风格的高质量图像生成模型。此模型基于上海人工智能实验室 Alpha-VLLM 团队开源的 Lumina-Image...

图像模型 # Neta Lumina # 二次元

7个月前

09160

DRA-Ctrl：利用视频生成模型实现可控图像生成的新范式

近年来，视频生成模型因其能够捕捉现实世界中的动态变化和复杂因果关系，被广泛视为一种“世界模拟器”。它们整合了视觉、时间、空间和语义等多个维度的信息，在建模长程依赖和多模态交互方面展现出强大潜力。那么...

图像模型 # DRA-Ctrl # HunyuanVideo-I2V # 知识迁移

7个月前

02800

多模态框架Tar：通过统一的离散语义表示将视觉理解和生成任务整合到一个共享空间中

香港中文大学和字节跳动的研究人员推出多模态框架Tar，通过统一的离散语义表示将视觉理解和生成任务整合到一个共享空间中。该框架的核心是 Text-Aligned Tokenizer (TA-Tok)，它...

图像模型 # Tar # 多模态框架

7个月前

03570

北京人工智能研究院推出新一代统一多模态图像生成模型OmniGen2：视觉理解、文本到图像生成、指令驱动编辑和基于主体的上下文生成能力

在上一代模型 OmniGen 发布仅 7 个月后，北京人工智能研究院正式推出了其升级版——OmniGen2，一个集成了视觉理解、文本到图像生成、指令驱动编辑和基于主体的上下文生成能力的统一多模态模型...

图像模型 # OmniGen2 # 北京人工智能研究院 # 统一多模态图像生成

7个月前

03030

Soul AI推出新型推出新型图像生成模型 TransDiff ：将自回归（AR）Transformer 和扩散模型相结合，用于高质量的图像生成

Soul AI推出新型图像生成模型 TransDiff ，该模型将自回归（AR）Transformer 和扩散模型相结合，用于高质量的图像生成。TransDiff 通过将输入编码为高级语义特征，并利用...

图像模型 # TransDiff # 图像生成模型

7个月前

02420

Krea AI 正式发布首款图像模型 Krea 1：专治“AI味”画面！

今天，AI 创意工具平台 Krea AI 宣布推出其首款自研图像生成模型 —— Krea 1。这款模型专注于解决一个长期困扰创作者的问题： “AI 生成的画面，总感觉像 AI。” 而现在，Krea 1...

图像模型 # Krea 1 # Krea AI # 图像模型

8个月前

03680

MARBLE：基于 CLIP 空间的图像材质编辑新方法

在计算机视觉与图形学领域，图像中对象材质的编辑是一项具有挑战性的任务。传统方法往往依赖复杂的建模与渲染流程，而近年来，借助预训练扩散模型与语义嵌入空间（如CLIP）的技术逐渐成为研究热点。项目主页...

图像模型 # MARBLE # 图像材质编辑

8个月前

02770

字节跳动 Seed 团队正式发布 SeedEdit 3.0：支持 4K 图像编辑，编辑可用率显著提升

今日，字节跳动 Seed 团队正式发布了新一代图像编辑模型 SeedEdit 3.0。该模型基于文生图模型 Seedream 3.0，融合多样化的训练数据与奖励机制，在图像主体与背景一致性、指令理解能...

图像模型 # SeedEdit 3.0 # 字节跳动

8个月前

01920

加载更多

字节跳动提出的新一代多主体可控图像生成模型XVerse

JarvisArt：由AI驱动的照片修饰智能体，释放你的艺术创造力

黑森林实验室正式发布图像编辑模型FLUX.1 Kontext [dev]

Janus-4o：基于数据集 ShareGPT-4o-Image 的新型多模态图像生成模型

Neta Lumina 发布：专为二次元创作打造的高品质图像生成模型

DRA-Ctrl：利用视频生成模型实现可控图像生成的新范式

多模态框架Tar：通过统一的离散语义表示将视觉理解和生成任务整合到一个共享空间中

北京人工智能研究院推出新一代统一多模态图像生成模型OmniGen2：视觉理解、文本到图像生成、指令驱动编辑和基于主体的上下文生成能力

Soul AI推出新型推出新型图像生成模型 TransDiff ：将自回归（AR）Transformer 和扩散模型相结合，用于高质量的图像生成

Krea AI 正式发布首款图像模型 Krea 1：专治“AI味”画面！

MARBLE：基于 CLIP 空间的图像材质编辑新方法

字节跳动 Seed 团队正式发布 SeedEdit 3.0：支持 4K 图像编辑，编辑可用率显著提升

Clawdbot/Moltbot

新QoderWork

Situation Monitor

Higgsfield AI

CutCut

Fogsight (雾象)

图像模型

网址

Clawdbot/Moltbot

新QoderWork

Situation Monitor

Higgsfield AI

CutCut

Fogsight (雾象)