SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    图像模型

    共 249 篇文章
    用于文生图、图生图、图像编辑的模型
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型世界模型
    排序
    发布更新浏览点赞
    京东发布 JoyAI-Image:集图像理解、文生图及指令引导编辑于一体的统一多模态基础模型

    京东发布 JoyAI-Image:集图像理解、文生图及指令引导编辑于一体的统一多模态基础模型

    京东今日正式发布 JoyAI-Image,这是一款集图像理解、文生图(T2I)及指令引导编辑于一体的统一多模态基础模型。不同于传统模型将理解与生成割裂处理,JoyAI-Image 的核心理念是构建“理...
    图像模型# JoyAI-Image# 京东
    4天前
    0300
    阿里巴巴发布 Wan2.7-Image:集图像生成与编辑于一体的统一模型,人更真、字更稳、色更准

    阿里巴巴发布 Wan2.7-Image:集图像生成与编辑于一体的统一模型,人更真、字更稳、色更准

    阿里巴巴今日正式发布 Wan2.7-Image,一款集图像生成与编辑于一体的统一模型。专为对内容品质有极致要求的创作者打造,Wan2.7-Image 直击当前 AI 生图领域的三大痛点:人物同质化(A...
    图像模型# Wan2.7-Image# 阿里巴巴
    6天前
    0250
    Mugen:基于 Flux 2 VAE 的 SDXL 动漫模型新生,低成本实现高质量角色生成

    Mugen:基于 Flux 2 VAE 的 SDXL 动漫模型新生,低成本实现高质量角色生成

    Mugen 是开发者 Cabal Research 推出的最新动漫生成模型系列。作为从 SDXL 到 Flux 2 VAE 潜空间转换技术的延续,Mugen 不仅重命名以区别于原始的 NoobAI 模...
    图像模型# Mugen# SDXL# 动漫模型
    6天前
    0280
    See-through:一张静态动漫图,自动“透视”拆分为可动 2.5D 角色

    See-through:一张静态动漫图,自动“透视”拆分为可动 2.5D 角色

    在虚拟主播(VTuber)、游戏开发和视觉小说制作中,将静态插画转化为可互动的 Live2D 模型 是标准流程。然而,传统制作极其耗时:画师需要手动将图片切割成数十个图层,凭想象“脑补”被头发遮挡的脸...
    图像模型# Live2D 模型# See-through
    7天前
    0290
    PSDesigner:首个模拟人类设计师工作流的自动化图形设计系统,直接生成可编辑 PSD 文件

    PSDesigner:首个模拟人类设计师工作流的自动化图形设计系统,直接生成可编辑 PSD 文件

    在 AI 绘画领域,Midjourney 等模型已经能生成令人惊叹的图像,但它们有一个致命弱点:输出的是“死”的位图。图层被合并、文字无法修改、元素无法移动。对于需要反复迭代、精细调整的电商海报、广告...
    图像模型# PSDesigner# 图形设计
    1周前
    0310
    PixelSmile:复旦与StepFun联手打造,AI表情编辑迎来“微操”时代

    PixelSmile:复旦与StepFun联手打造,AI表情编辑迎来“微操”时代

    “笑得太假”、“愤怒变成了厌恶”、“改完表情不像本人了”——这些曾是AI人脸编辑难以逾越的鸿沟。如今,复旦大学与StepFun的研究团队共同推出了 PixelSmile,一款基于扩散模型的细粒度面部表...
    图像模型# PixelSmile# 面部表情编辑
    1周前
    0680
    RealRestorer:开源图像修复新标杆,九合一全能模型直逼闭源顶尖水平

    RealRestorer:开源图像修复新标杆,九合一全能模型直逼闭源顶尖水平

    在自动驾驶、安防监控、遥感分析乃至日常摄影中,图像质量往往决定了下游任务的成败。然而,真实世界中的图像退化(如模糊、噪点、雾霾、反光等)复杂多变,传统修复模型往往“水土不服”,而效果卓越的闭源大模型...
    图像模型# RealRestorer# 图像修复
    1周前
    0980
    Phota Labs 发布全新 AI 摄影工具:保留真实人像,实现个性化照片创作与编辑

    Phota Labs 发布全新 AI 摄影工具:保留真实人像,实现个性化照片创作与编辑

    在生成式 AI 席卷图像领域的今天,我们常常面临一个尴尬的困境:AI 生成的图片虽然精美,但里面的人“像我却不是我”。眼神不对、微笑的弧度陌生、甚至五官细节都发生了微妙的偏移。对于摄影而言,真实性与身...
    图像模型早报# Phota Labs
    2周前
    0800
    微软发布 MAI-Image-2:文生图跻身全球前三,逼真度与文字渲染全面升级

    微软发布 MAI-Image-2:文生图跻身全球前三,逼真度与文字渲染全面升级

    微软 AI 正式推出了其最新的图像生成模型 MAI-Image-2。这款专为创意专业人士打造的模型,凭借在自然光影、肤色还原及复杂场景构建上的卓越表现,迅速在权威榜单 Arena-AI 文生图排行榜 ...
    图像模型# MAI-Image-2# 微软
    3周前
    0350
    黑森林实验室发布 FLUX.2 [klein] 9B-KV:多参考图像编辑速度飙升 2.5 倍

    黑森林实验室发布 FLUX.2 [klein] 9B-KV:多参考图像编辑速度飙升 2.5 倍

    黑森林实验室(Black Forest Labs)今日正式推出 FLUX.2 [klein] 9B-KV,这是其备受赞誉的轻量级图像编辑模型 FLUX.2 [klein] 9B 的专用优化变体。新版本...
    图像模型# FLUX.2 [klein] 9B-KV# 黑森林实验室
    4周前
    01700
    Luma 发布统一推理图像模型UNI-1:终结“理解”与“生成”的割裂,首个统一推理视觉模型登场

    Luma 发布统一推理图像模型UNI-1:终结“理解”与“生成”的割裂,首个统一推理视觉模型登场

    “过去的 AI 是‘先看懂,再画出来’的两个步骤;现在的 UNI-1 是‘边想边画,画即是想’的一个过程。” Luma AI 今日正式推出 UNI-1,这是业界首个将视觉理解与图像生成深度融合的统一推...
    图像模型早报# Luma# UNI-1
    1个月前
    0550
    小红书开源FireRed-Image-Edit 1.1:引入智能体工作流,支持 10+ 元素融合与专业级人像精修

    小红书开源FireRed-Image-Edit 1.1:引入智能体工作流,支持 10+ 元素融合与专业级人像精修

    小红书智能创作基础技术团队正式推出 FireRed-Image-Edit-1.1。作为前代通用图像编辑模型的升级版,1.1 版本在保留强大编辑能力的基础上,重点攻克了身份一致性、多图像复杂控制及领域专...
    图像模型# FireRed-Image-Edit 1.1# 小红书
    1个月前
    0970
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    Flova

    新Flova

    Flova AI 最近宣布集成字节跳动最新的视频生成模型——Seedance 2.0。这不仅仅是一个新模型的上线,更意味着普通创作者现在也能轻松制作出长达 60 至 90 秒、角色稳定、剧情连贯的电影级短剧。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    即梦 CLI

    即梦 CLI

    即梦 CLI (Jimeng CLI) 是字节跳动官方推出的面向 AI Agent 的命令行工具包。它打破了图形界面的限制,让任何 AI 智能体(如基于 OpenClaw 的助手)都能直接调用即梦强大的 Seedance 2.0 旗舰模型,实现图片与视频的自动化生成。
    CoPaw

    CoPaw

    阿里云旗下阿里桌面 Agent 工具 CoPaw 正式开源,CoPaw 原生支持钉钉、飞书、QQ、Discord、iMessage 等聊天软件和平台,内置了多种 Skills,用户可一键本地部署也可通过阿里云计算巢和魔搭社区创空间实现一键云端部署,并调用千问系列等主流模型,是业界部署门槛最低的 Agent 工具之一。
    查看完整榜单