SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    图像模型

    共 240 篇文章
    用于文生图、图生图、图像编辑的模型
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型世界模型
    排序
    发布更新浏览点赞
    基于蒸馏的多功能图像生成模型DMM:通过蒸馏模型合并技术实现多功能图像生成

    基于蒸馏的多功能图像生成模型DMM:通过蒸馏模型合并技术实现多功能图像生成

    在文本到图像(Text-to-Image, T2I)生成领域,开发者通常会基于强大的基础模型(如Stable Diffusion 1.5)进行微调,以适应特定风格或场景的需求。例如,某些模型专注于生成...
    图像模型# DMM# 图像生成模型# 蒸馏模型
    11个月前
    02650
    对角蛇形扫描自回归图像生成框架DAR:用于生成高质量图像的新型自回归模型

    对角蛇形扫描自回归图像生成框架DAR:用于生成高质量图像的新型自回归模型

    传统的自回归图像生成方法(如VQGAN)通常按照光栅扫描(raster scan)顺序生成图像令牌。这种方式在行末换行时会导致相邻令牌之间的欧几里得距离过大,从而影响生成效果。例如,当生成一张256...
    图像模型# DAR# 自回归模型
    11个月前
    02720
    基于Flux模型的创新角色生成框架InstantCharacter:单张图像生成高质量角色图像

    基于Flux模型的创新角色生成框架InstantCharacter:单张图像生成高质量角色图像

    腾讯混元团队与InstantX团队近日联合推出了一种全新的角色定制方法——InstantCharacter。这一方法无需调优,仅通过单张图像即可实现高保真、文本可控且角色一致的图像生成,支持多种下游任...
    图像模型# FLUX模型# InstantCharacter# InstantX
    11个月前
    05900
    开源版GPT‑4o?新型多模态生成模型 Liquid,用一个模型搞定视觉与语言任务

    开源版GPT‑4o?新型多模态生成模型 Liquid,用一个模型搞定视觉与语言任务

    在OpenAI旗下GPT‑4o凭借原生生成及编辑图像功能,火爆网络后,大家都在期待有相对应的开源模型推出。而将视觉和语言任务高效整合一直是研究的热点。华中科技大学、字节跳动和香港大学的研究人员推出了新...
    图像模型# GPT‑4o# OpenAI# 多模态生成模型
    11个月前
    02670
    基于视觉语言模型的端到端多模态 SVG 生成框架OmniSVG:能够生成从简单图标到复杂动漫角色的高质量 SVG 图形

    基于视觉语言模型的端到端多模态 SVG 生成框架OmniSVG:能够生成从简单图标到复杂动漫角色的高质量 SVG 图形

    复旦大学和阶跃星辰的研究人员推出基于视觉语言模型(VLMs)的端到端多模态 SVG 生成框架OmniSVG,能够生成从简单图标到复杂动漫角色的高质量 SVG 图形,支持文本到 SVG、图像到 SVG ...
    图像模型# OmniSVG# SVG# 视觉语言模型
    8个月前
    02560
    基于像素空间流的图像生成模型PixelFlow:根据给定的文本描述生成高质量、语义一致的图像

    基于像素空间流的图像生成模型PixelFlow:根据给定的文本描述生成高质量、语义一致的图像

    香港大学和Adobe的研究人员推出基于像素空间流的图像生成模型PixelFlow,它直接在像素空间中进行操作,与传统的基于潜在空间(latent space)的模型不同。PixelFlow通过高效的级...
    图像模型# PixelFlow# 图像生成模型
    11个月前
    02000
    字节跳动推出基于Flux的通用框架UNO:支持虚拟试穿、风格化生成、产品设计等功能

    字节跳动推出基于Flux的通用框架UNO:支持虚拟试穿、风格化生成、产品设计等功能

    字节跳动近日推出了UNO,这是一个强大的通用框架,能够从单一主体到多主体进行定制化演进。UNO不仅展示了出色的泛化能力,还能将多样化的任务统一在一个模型之下,为图像生成领域带来了新的突破。 项目主页...
    图像模型# FLUX# UNO# 字节跳动
    11个月前
    06610
    智象未来开源全新的170 亿参数图像生成基础模型HiDream-I1

    智象未来开源全新的170 亿参数图像生成基础模型HiDream-I1

    北京智象未来科技开源了一款全新的图像生成基础模型HiDream-I1,其拥有 170 亿个参数,能够在几秒内实现顶尖的图像生成效果。这一模型提供了三种变体:Full、Dev 和 Fast,以满足不同用...
    图像模型# HiDream-I1# 图像生成模型# 智象未来
    11个月前
    05800
    新型图像编码器FlexTok:能够将二维图像重新采样为长度可变的一维离散标记(token)序列

    新型图像编码器FlexTok:能够将二维图像重新采样为长度可变的一维离散标记(token)序列

    苹果和瑞士洛桑联邦理工学院的研究人员推出新型图像编码器FlexTok,它能够将二维图像重新采样为长度可变的一维离散标记(token)序列。FlexTok 的核心思想是通过灵活的标记长度来适应图像的复杂...
    图像模型# FlexTok# 图像编码器
    11个月前
    04470
    HSMR:用于从单张图像中重建具有生物力学准确骨架的三维人体模型

    HSMR:用于从单张图像中重建具有生物力学准确骨架的三维人体模型

    德克萨斯大学奥斯汀分校和浙江大学的研究人员推出HSMR,用于从单张图像中重建具有生物力学准确骨架的三维人体模型。该方法通过训练一个基于 Transformer 的网络,估计生物力学模型 SKEL 的参...
    图像模型# HSMR# 三维人体模型# 骨架
    12个月前
    05210
    新型框架 EliGen:用于实现图像生成中的实体级控制

    新型框架 EliGen:用于实现图像生成中的实体级控制

    浙江大学控制科学与工程学院、阿里巴巴集团ModelScope团队和华东师范大学的研究人员推出新型框架 EliGen,用于实现图像生成中的实体级控制。EliGen 通过引入区域注意力(Regional ...
    图像模型# EliGen# 图像生成
    12个月前
    02310
    新型多模态生成模型UniDisc:基于离散扩散过程的统一生成模型,能够同时理解和生成文本和图像

    新型多模态生成模型UniDisc:基于离散扩散过程的统一生成模型,能够同时理解和生成文本和图像

    卡内基梅隆大学的研究人员推出新型多模态生成模型 UniDisc(Unified Multimodal Discrete Diffusion),UniDisc 是一个基于离散扩散过程的统一生成模型,能够...
    图像模型# UniDisc# 多模态生成模型
    12个月前
    04540
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Tavo

    Tavo

    Tavo 是一款专门为 AI 角色扮演玩家定制的聊天客户端,也是一个操作简单、功能强大且无限制的LLM前端。
    SkillHub

    SkillHub

    腾讯在推出多款 OpenClaw 衍生产品的同时,正式发布了 SkillHub —— 专为中国用户优化的国产版 Skills 社区。这不仅是一个下载加速器,更是 OpenClaw 生态本土化的重要里程碑。
    悟空

    新悟空

    阿里巴巴发布全球首个企业级AI原生工作平台——“悟空”,让每个团队、每家公司,都能拥有一支24h工作的“龙虾军团”。悟空是一款独立应用,即日起开启邀测,也将直接内置到超2000万企业组织的钉钉之中。
    查看完整榜单