SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    模型

    共 1081 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型世界模型
    排序
    发布更新浏览点赞
    智谱 AI 开源视频生成模型 CogVideoX-5B ,RTX 3060 显卡可运行

    智谱 AI 开源视频生成模型 CogVideoX-5B ,RTX 3060 显卡可运行

    之前已经给大家分享了《智谱AI推出视频生成模型CogVideoX:与“清影”同源,单张 4090 显卡可推理》,之前推出的是CogVideoX-2B模型,智谱 AI又开源了CogVideoX-5B,相...
    视频模型# CogVideoX-5B# 智谱 AI
    12个月前
    01,0990
    flux-ip-adapter-v2:基于FLUX.1-dev的风格迁移IP-Adapter 模型

    flux-ip-adapter-v2:基于FLUX.1-dev的风格迁移IP-Adapter 模型

    XLabs-AI推出了很多基于FLUX.1-dev 模型的ControlNet模型,近期XLabs-AI又推出了基于FLUX.1-dev的IP-Adapter 模型,支持支持 512 和 1024 分...
    Flux衍生插件# flux-ip-adapter-v2# FLUX.1-dev 模型# IP-Adapter 模型
    12个月前
    01,0810
    图像编辑框架ByteEdit:提升基于扩散模型的生成性图像编辑任务的性能

    图像编辑框架ByteEdit:提升基于扩散模型的生成性图像编辑任务的性能

    字节跳动推出图像编辑框架ByteEdit,这是一个精心设计的创新反馈学习框架,旨在增强生成图像编辑任务的效果、提升遵从度,并加速处理速度。它专门用于提升基于扩散模型的生成性图像编辑任务的性能。Byte...
    图像模型# ByteEdit# 图像编辑框架
    12个月前
    01,0790
    新型文生图模型CoMat:更好地理解和执行文本描述,提高了文本到图像生成的质量和准确性

    新型文生图模型CoMat:更好地理解和执行文本描述,提高了文本到图像生成的质量和准确性

    来自香港中文大学、商汤科技和上海人工智能实验室的研究人员推出新型文生图模型CoMat,这是一种具有图像到文本概念匹配机制的端到端扩散模型微调策略。开发团队借助图像字幕模型来评估图像与文本的对齐程度,并...
    图像模型# CoMat# 文生图模型
    12个月前
    01,0600
    StabilityAI推出全新视频生成模型Stable Video 4D(SV4D):可将单个视频转化为 8 个不同角度/视图的新视图视频

    StabilityAI推出全新视频生成模型Stable Video 4D(SV4D):可将单个视频转化为 8 个不同角度/视图的新视图视频

    StabilityAI在今天推出一个新的视频生成模型Stable Video 4D(SV4D),只需 40 秒就可将单个视频转化为 8 个不同角度/视图的新视图视频(5 帧/个视角),整个 4D 优化...
    视频模型# StabilityAI# Stable Video 4D# SV4D
    12个月前
    01,0510
    Chroma 模型家族正式发布:基于 FLUX.1-schnell,8.9亿参数开源无限制,4大分支适配不同需求

    Chroma 模型家族正式发布:基于 FLUX.1-schnell,8.9亿参数开源无限制,4大分支适配不同需求

    开发者 lodestones 近期宣布,基于 FLUX.1-schnell 构建的 8.9 亿参数生成模型 Chroma 已完成全部基础训练,正式开放供开发者与研究者使用。作为完全遵循 Apache ...
    图像模型# Chroma# FLUX.1 [schnell]
    5个月前
    01,0470
    多语言文本编码器Glyph-ByT5-v2:提高在图形设计图像中渲染多种语言文本的准确性和美观度

    多语言文本编码器Glyph-ByT5-v2:提高在图形设计图像中渲染多种语言文本的准确性和美观度

    来自微软亚洲研究院、清华大学、北京大学和利物浦大学的研究人员推出新型多语言视觉文本渲染技术Glyph-ByT5-v2,这是之前介绍的Glyph-ByT5升级版,此技术的目标是提高在图形设计图像中渲染多...
    大语言模型# Glyph-ByT5-v2# Glyph-SDXL-v2# 文本编码器
    12个月前
    01,0390
    Stable Diffusion 1.5

    Stable Diffusion 1.5

    Stable Diffusion 1.5 是由 Runway ML 开发,基于 Stable Diffusion 1.2 版本,于2022年10月发布,并进行了以下改进: 使用了更大的模型:Stabl...
    图像模型# Runway ML# Stable Diffusion 1.5# 模型
    12个月前
    01,0350
    阿里 WAN 项目组正式推出 Wan2.2:MoE 架构 + 高压缩设计,开源视频生成再进化

    阿里 WAN 项目组正式推出 Wan2.2:MoE 架构 + 高压缩设计,开源视频生成再进化

    阿里 WAN 项目组正式推出 Wan2.2,这是对 WAN 系列视频生成模型的一次重大升级。本次发布涵盖多个模型变体,全面支持文本到视频(T2V)、图像到视频(I2V)以及混合输入(TI2V)任务,在...
    视频模型# Wan2.2# 视频生成模型
    6个月前
    01,0330
    SDXL系列新模型SDXL Flash:高速且保证质量的SDXL模型

    SDXL系列新模型SDXL Flash:高速且保证质量的SDXL模型

    Stable Diffusion Community是一个非官方、非盈利性质的组织,它们主要目标是尽可能改进 SD 模型并让每个人都可以使用它们,近期它们推出了新的SDXL系列模型SDXL Flash...
    图像模型# SDXL Flash# sdxl-flash-mini# 高速模型
    12个月前
    01,0260
    华为PixArt系列最新模型—PIXART-Σ:基于DiT,可直接生成4K分辨率的图像

    华为PixArt系列最新模型—PIXART-Σ:基于DiT,可直接生成4K分辨率的图像

    来自华为诺亚方舟实验室、大连理工大学、香港大学的研究人员推出了最新的PixArt模型—PIXART-Σ,PixArt-Σ基于Diffusion Transformer架构 (DiT,与Sora、Sta...
    图像模型# DiT# PIXART-Σ# 文生图模型
    12个月前
    01,0180
     ToonComposer:通过生成式后关键帧(post-keyframing)阶段简化卡通制作流程

     ToonComposer:通过生成式后关键帧(post-keyframing)阶段简化卡通制作流程

    香港中文大学、腾讯PCG ARC Lab和北京大学的研究人员推出 ToonComposer ,通过生成式后关键帧(post-keyframing)阶段简化卡通制作流程。传统的卡通和动画制作涉及关键帧绘...
    视频模型# ToonComposer# 卡通制作
    6个月前
    01,0170
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Skills.sh

    Skills.sh

    Vercel 近日上线了一个名为 skills.sh 的新站点,专门用于发现、浏览和安装 AI 智能体的“技能”(Skills)。
    Situation Monitor

    Situation Monitor

    Situation Monitor 是由开发者 Reggie James 创建的一个免费、开源的全球风险监测平台。它通过一张交互式地图,实时整合并可视化全球范围内的关键地缘政治与安全信息,帮助用户快速掌握潜在冲突热点和战略动态。
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    Clawdbot/Moltbot

    Clawdbot/Moltbot

    Clawdbot 是一款可在您自己的设备上运行的个人 AI 助手。它在您已使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及扩展渠道(如 BlueBubbles、Matrix、Zalo 和 Zalo Personal)上为您提供应答。它可以在 macOS/iOS/Android 上进行语音交谈,并能渲染一个您可控制的实时画布。网关仅是控制平面——核心产品是助手本身。
    TapNow

    TapNow

    TapNow是一个面向创作者的专业级 AI 视觉内容平台,支持从脚本撰写、分镜头设计到高保真成片输出的完整流程,单人即可在 1–3 天内完成传统需 4–6 周的影视级项目。
    Awesome Clawdbot(Moltbot) Skills

    新Awesome Clawdbot(Moltbot) Skills

    社区维护了一份名为 Awesome Clawdbot (Moltbot) Skills 的精选技能集合。该列表收录了 565 项以上 来自 ClawdHub(Moltbot 官方公共技能注册表)的技能,并按功能类别组织,便于浏览与安装。
    查看完整榜单