SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    模型

    共 1083 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型世界模型
    排序
    发布更新浏览点赞
    字节跳动推出基于Flux的通用框架UNO:支持虚拟试穿、风格化生成、产品设计等功能

    字节跳动推出基于Flux的通用框架UNO:支持虚拟试穿、风格化生成、产品设计等功能

    字节跳动近日推出了UNO,这是一个强大的通用框架,能够从单一主体到多主体进行定制化演进。UNO不仅展示了出色的泛化能力,还能将多样化的任务统一在一个模型之下,为图像生成领域带来了新的突破。 项目主页...
    图像模型# FLUX# UNO# 字节跳动
    10个月前
    06420
    Llasa:基于LLaMA语言模型的先进文本转语音(TTS)系统

    Llasa:基于LLaMA语言模型的先进文本转语音(TTS)系统

    文本转语音(TTS)技术正成为人机交互领域的重要工具。随着娱乐、无障碍服务、客户服务和教育等行业对语音合成的需求不断增加,市场对逼真、情感丰富且支持多种语言的语音合成技术的需求也在迅速增长。然而,传统...
    语音模型# Llasa# TTS
    12个月前
    06420
    Stable Diffusion 原班人马新公司Black Forest Labs推出全新文生图模型Flux.1系列

    Stable Diffusion 原班人马新公司Black Forest Labs推出全新文生图模型Flux.1系列

    今年,随着Stability AI经历了一系列动荡,包括多位主要开发者离职及创始人退出,开源社区对其推出的Stable Diffusion 3 Medium模型也表示不满。在此背景下,Stable D...
    Flux衍生# Flux.1# Flux.1系列# Stable Diffusion
    12个月前
    06410
    IDAdapter:根据单张面部照片和文本提示,生成多种风格、角度和表情的个性化图像,而无需在推理阶段进行任何微调

    IDAdapter:根据单张面部照片和文本提示,生成多种风格、角度和表情的个性化图像,而无需在推理阶段进行任何微调

    来自北京大学、InsightFace和格灵深瞳推出IDAdapter,它能够根据单张面部照片和文本提示,生成多种风格、角度和表情的个性化图像,而无需在推理阶段进行任何微调。 论文 IDAdapter通...
    图像模型# IDAdapter# 个性化图像
    12个月前
    06410
    Fal.ai平台推出新DiT模型AuraFlow:支持文字,百分百开源

    Fal.ai平台推出新DiT模型AuraFlow:支持文字,百分百开源

    Stability AI因为Stable Diffusion 3 Medium模型的许可证问题备受诟病,虽然后来更改了许可证,但此模型在人物尤其是躺倒后人物的糟糕表现还是不受开源社区待见。不少人开始转...
    图像模型# AuraFlow# DiT模型# Fal.ai
    12个月前
    06400
    字节跳动推出AnimateDiff-Lightning模型:根据文本描述生成视频,还可以视频转视频

    字节跳动推出AnimateDiff-Lightning模型:根据文本描述生成视频,还可以视频转视频

    字节跳动推出了AnimateDiff-Lightning模型,能够更快地根据文本描述生成视频,比起原来的AnimateDiff模型,速度提升十倍以上。 模型地址:https://huggingface...
    视频模型# AnimateDiff-Lightning# 字节跳动
    12个月前
    06380
    蓝莓真身!Black Forest Labs推出FLUX1.1 [pro]和BFL API,生成质量更高速度更快

    蓝莓真身!Black Forest Labs推出FLUX1.1 [pro]和BFL API,生成质量更高速度更快

    由Stable Diffusion 原班人马组成的新公司Black Forest Labs于8月份推出全新文生图模型Flux.1系列后,就迅速取代Stability AI成为AI绘画领域最出色的开源公...
    Flux衍生# Black Forest Labs# FLUX1.1 [pro]
    12个月前
    06260
    新型图像抠图方法SEMat:能够在复杂的自然场景中实现更精确的前景对象抠图

    新型图像抠图方法SEMat:能够在复杂的自然场景中实现更精确的前景对象抠图

    近年来,交互式分割模型(如 SAM)在图像分割任务中取得了显著进展。然而,这些模型在应用于交互式抠图任务时面临挑战,尤其是在处理复杂和遮挡场景时。现有的方法通常在合成数据上训练模型,但这些模型难以泛化...
    图像模型# SEMat# 图像抠图
    12个月前
    06220
    线性注意力 + 恒定内存 KV 缓存!SANA-Video:高效生成分钟级高清视频的新一代文生视频模型

    线性注意力 + 恒定内存 KV 缓存!SANA-Video:高效生成分钟级高清视频的新一代文生视频模型

    在文本到视频(T2V)生成领域,高分辨率、长时长与低延迟三者往往难以兼得。现有大模型虽能生成高质量视频,但动辄数千秒的推理时间与高昂的训练成本严重限制了其落地应用。 为此,由英伟达、香港大学、麻省理工...
    视频模型# SANA-Video# 文生视频模型
    4个月前
    06170
    欧美漫画及插画风格SDXL模型:CHEYENNE

    欧美漫画及插画风格SDXL模型:CHEYENNE

    _CHEYENNE_是一款专门针对欧美漫画及插画风格生成的SDXL模型。不论你是专业插画家、漫画家,还是热衷于视觉艺术表达的爱好者,CHEYENNE都将为你的创意世界打开全新维度! 模型下载地址 CH...
    图像模型# CHEYENNE# SDXL模型# 插画
    12个月前
    06160
    告别旧版,迎接进化!阿里Qwen团队发布Qwen3-235B-A22B-Instruct-2507

    告别旧版,迎接进化!阿里Qwen团队发布Qwen3-235B-A22B-Instruct-2507

    在与社区深入交流并综合反馈后,阿里Qwen团队做出一项重要决策:停止使用混合“思维模式”(Thinking Mode)的训练方式,转而采用 Instruct 与 Thinking 模型分离训练 的新策...
    大语言模型# Qwen3-235B-A22B-Instruct-2507
    6个月前
    06140
    AnimePRO FLUX:基于 Flux.1 Shnell 的微调动漫模型

    AnimePRO FLUX:基于 Flux.1 Shnell 的微调动漫模型

    AnimePRO FLUX 是一款基于 Flux.1 Shnell 的微调动漫模型,专为生成高质量的动漫图像而设计。如果你希望使用 Flux 生成动漫艺术但不想受 DEV 版本的许可限制,AnimeP...
    Flux衍生# AnimePRO FLUX# Flux.1 Shnell# 动漫模型
    12个月前
    06120
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Clawdbot/Moltbot

    Clawdbot/Moltbot

    Clawdbot 是一款可在您自己的设备上运行的个人 AI 助手。它在您已使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及扩展渠道(如 BlueBubbles、Matrix、Zalo 和 Zalo Personal)上为您提供应答。它可以在 macOS/iOS/Android 上进行语音交谈,并能渲染一个您可控制的实时画布。网关仅是控制平面——核心产品是助手本身。
    Situation Monitor

    Situation Monitor

    Situation Monitor 是由开发者 Reggie James 创建的一个免费、开源的全球风险监测平台。它通过一张交互式地图,实时整合并可视化全球范围内的关键地缘政治与安全信息,帮助用户快速掌握潜在冲突热点和战略动态。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    QoderWork

    新QoderWork

    阿里发布旗下首个桌面Agent工具QoderWork,用户无需任何复杂部署工作,输入一句话,QoderWork就能按需调用授权的本地应用,完成文件整理、数据处理、文档生成等任务。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    查看完整榜单