SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    图像模型

    共 234 篇文章
    用于文生图、图生图、图像编辑的模型
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型世界模型
    排序
    发布更新浏览点赞
    Playground推出Playground v3:不仅在图形设计方面表现出色,还引入了一些新的能力,比如精确的RGB颜色控制和强大的多语言理解能力

    Playground推出Playground v3:不仅在图形设计方面表现出色,还引入了一些新的能力,比如精确的RGB颜色控制和强大的多语言理解能力

    Playground上线了Playground v3 beta版本,同时还发布了技术报告,与传统的依赖T5或CLIP文本编码器的预训练语言模型的文本到图像生成模型不同,Playground v3完全集...
    图像模型# Playground v3
    1年前
    04070
    基于Mamba架构的自回归(AR)图像生成模型AiM:实现高质量和高效率的图像生成,同时保持推理速度的优势

    基于Mamba架构的自回归(AR)图像生成模型AiM:实现高质量和高效率的图像生成,同时保持推理速度的优势

    北京邮电大学、中国科学院大学、香港理工大学和中国科学院自动化研究所的研究人员推出自回归(autoregressive, AR)图像生成模型AiM,它基于Mamba架构构建。AiM模型的目的是实现高质量...
    图像模型# AiM# Mamba架构
    1年前
    06960
    人像个性化框架UniPortrait:支持单人物(Single-ID)和多人物(Multi-ID)图像的定制化生成

    人像个性化框架UniPortrait:支持单人物(Single-ID)和多人物(Multi-ID)图像的定制化生成

    阿里巴巴集团智能计算研究院推出人像个性化框架UniPortrait,支持单人物(Single-ID)和多人物(Multi-ID)图像的定制化生成。简单来说,UniPortrait能够根据用户提供的文本...
    图像模型# UniPortrait# 人像个性化
    1年前
    07910
    强大且高效的图像和视频生成控制方法ControlNeXt:同时支持图像和视频,并能整合多种形式的控制信息

    强大且高效的图像和视频生成控制方法ControlNeXt:同时支持图像和视频,并能整合多种形式的控制信息

    香港中文大学和思谋科技的研究人员推出强大且高效的图像和视频生成控制方法ControlNeXt,它同时支持图像和视频,并能整合多种形式的控制信息。在这个项目中,我们提出了一种新方法,与 ControlN...
    图像模型# ControlNeXt
    1年前
    09330
    新型多模态自回归模型Lumina-mGPT:能够执行各种视觉和语言任务,尤其擅长根据文本描述生成逼真的图片

    新型多模态自回归模型Lumina-mGPT:能够执行各种视觉和语言任务,尤其擅长根据文本描述生成逼真的图片

    上海人工智能实验室和香港中文大学的研究人员推出新型多模态自回归模型Lumina-mGPT,它能够执行各种视觉和语言任务,尤其擅长根据文本描述生成逼真的图片。与现有的基于自回归的图像生成方法不同,Lum...
    图像模型# Lumina-mGPT# 多模态自回归模型
    1年前
    07160
    Meta推出图像和视频分割模型SAM 2:图像和视频中的可提示视觉分割

    Meta推出图像和视频分割模型SAM 2:图像和视频中的可提示视觉分割

    Meta在去年推出了图像分割模型Segment Anything,今年它们又推出了升级版Segment Anything Model 2 (SAM 2),这是一种用于图像和视频中可提示视觉分割的基础模...
    图像模型# Meta# SAM 2# 分割模型
    1年前
    05650
    Fal.ai平台推出了新一代GAN 图像放大工具AuraSR的第二版AuraSR-v2

    Fal.ai平台推出了新一代GAN 图像放大工具AuraSR的第二版AuraSR-v2

    Fal.ai平台推出了新一代GAN 图像放大工具AuraSR的第二版,上个月它们推出了AuraSR 第一版后,得到了开源社区积极回应,让他们立刻着手开发新版。AuraSR 以 Adobe 的 Giga...
    图像模型# AuraSR# AuraSR-v2# Fal.ai
    1年前
    07400
    日本团队推出浮世绘风格专用生成模型Evo-Ukiyoe和浮世绘上色模型Evo-Nishikie

    日本团队推出浮世绘风格专用生成模型Evo-Ukiyoe和浮世绘上色模型Evo-Nishikie

    日本AI团队Sakana AI发布了专门用于生成浮世绘风格的生成模型Evo-Ukiyoe和浮世绘上色模型Evo-Nishikie,此模型是是以转为日语打造的图像生成模型Evo-SDXL-JP为基础,通...
    图像模型# Evo-Nishikie# Evo-Ukiyoe# 浮世绘
    1年前
    07170
    以Stable Cascade为基础!新型超高分辨率图像生成方法UltraPixel:生成从1K至6K多种分辨率的高品质图像

    以Stable Cascade为基础!新型超高分辨率图像生成方法UltraPixel:生成从1K至6K多种分辨率的高品质图像

    香港科技大学(广州)、 华为诺亚方舟实验室、马克斯普朗克信息研究所和香港科技大学的研究人员推出一种新型超高分辨率图像生成方法UltraPixel,此方法是以Stability AI的模型Stable...
    图像模型# Stable Cascade# UltraPixel# 超高分辨率图像生成
    1年前
    07170
    Fal.ai平台推出新DiT模型AuraFlow:支持文字,百分百开源

    Fal.ai平台推出新DiT模型AuraFlow:支持文字,百分百开源

    Stability AI因为Stable Diffusion 3 Medium模型的许可证问题备受诟病,虽然后来更改了许可证,但此模型在人物尤其是躺倒后人物的糟糕表现还是不受开源社区待见。不少人开始转...
    图像模型# AuraFlow# DiT模型# Fal.ai
    1年前
    06420
    单目深度估算模型Depth Anything V2:通过分析单张图片来预测物体距离

    单目深度估算模型Depth Anything V2:通过分析单张图片来预测物体距离

    来自香港大学和TikTok的研究人员推出单目深度估算模型Depth Anything的升级版Depth Anything V2,让计算机通过分析单张图片来预测物体距离的技术,这在自动驾驶、3D建模和虚...
    图像模型# Depth Anything V2# 单目深度估算模型
    1年前
    01,2430
    Stability AI释出Stable Diffusion 3 Medium模型,8G显存显卡即可使用

    Stability AI释出Stable Diffusion 3 Medium模型,8G显存显卡即可使用

    Stability AI终于在6月12日释出了万众期待的Stable Diffusion 3模型,不过此次释出的仅是 20 亿个参数的Stable Diffusion 3 Medium 模型,该型号尺...
    图像模型# SD3模型# Stability AI# Stable Diffusion 3 Medium
    1年前
    05,0680
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    YouMind

    YouMind

    YouMind 是一款重新构想的 AI 写作工具,帮助每个人轻松开启创作之旅。捕捉灵感、收集素材、撰写草稿,并将其转化为精炼的文章、播客、视频等丰富内容。
    2233.ai

    2233.ai

    2233.ai提供了一个便捷、安全且经济实惠的解决方案,让用户能够体验到原生的ChatGPT Plus和Claude Pro服务。同时,通过合理选择网络工具和使用API等方式,也可以在一定程度上改善使用体验,避免常见的网络和账号问题。
    Video Ocean

    Video Ocean

    Video Ocean 是一个AI 视频生成平台,平台支持文本转视频、图像转视频和角色一致性视频生成,能够创建高达 20 秒的高清视频,强调视觉真实感、动态表现和多样化艺术风格。
    NOFX

    NOFX

    NOFX是一个基于 DeepSeek/Qwen AI 的加密货币期货自动交易系统,支持 Binance、Hyperliquid和Aster DEX交易所,多AI模型实盘竞赛,具备完整的市场分析、AI决策、自我学习机制和专业的Web监控界面。
    MimiClaw

    MimiClaw

    MimiClaw 把一块小小的 ESP32-S3 开发板变成你的私人 AI 助理。插上 USB 供电,连上 WiFi,通过 Telegram 跟它对话 — 它能处理你丢给它的任何任务,还会随时间积累本地记忆不断进化 — 全部跑在一颗拇指大小的芯片上。
    Luma Photon

    Luma Photon

    Luma AI于2024年12月推出了两款新的高级文本到图像模型——Photon 和 Photon Flash,这些模型可通过 Luma 官方网站访问,旨在为创意和设计师等专业人士提供更高质量的图像生成服务。
    查看完整榜单