SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    模型

    共 1055 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型
    排序
    发布更新浏览点赞
    虚拟服装试穿Magic Clothing:根据特定的服装和文本提示来生成穿着这些服装的定制化角色图像

    虚拟服装试穿Magic Clothing:根据特定的服装和文本提示来生成穿着这些服装的定制化角色图像

    小i研究院发布了OOTDiffusion的分支版本Magic Clothing,它能够根据特定的服装和文本提示来生成穿着这些服装的定制化角色图像。这项技术的核心在于高度的图像可控性,即在生成的图像中保...
    图像模型# Magic Clothing# 虚拟服装试穿
    11个月前
    01,1160
    高效且多功能的框架Ctrl-Adapter:在各种图像和视频生成模型中加入丰富的控制功能

    高效且多功能的框架Ctrl-Adapter:在各种图像和视频生成模型中加入丰富的控制功能

    北卡罗来纳大学教堂山分校的研究人员推出高效且多功能的框架CTRL-Adapter,它能够为任何图像或视频扩散模型添加多样的空间控制功能。它支持多种实用的应用,如视频控制、多条件视频控制、稀疏帧条件下的...
    图像模型# Ctrl-Adapter# 空间控制# 视频生成模型
    11个月前
    08380
    新型超分辨率技术APISR:专门针对动漫图像和视频的高质量增强

    新型超分辨率技术APISR:专门针对动漫图像和视频的高质量增强

    来自密歇根大学、耶鲁大学和浙江大学推出新型超分辨率技术APISR,专门针对动漫图像和视频的高质量增强。超分辨率技术(Super-Resolution, SR)是一种图像处理技术,旨在从低分辨率的图像中...
    图像模型# APISR# 动漫图像# 超分辨率技术
    11个月前
    08400
    统一框架UniFL:通过统一的反馈学习来提升稳定扩散模型(Stable Diffusion)的性能

    统一框架UniFL:通过统一的反馈学习来提升稳定扩散模型(Stable Diffusion)的性能

    来自字节跳动和中山大学的研究人员推出利用反馈学习机制来全面增强扩散模型的统一框架UniFL,它通过统一的反馈学习来提升稳定扩散模型(Stable Diffusion)的性能。UniFL作为一种通用、高...
    图像模型# Stable Diffusion# UniFL
    11个月前
    07480
    时间延时视频生成模型MagicTime:学习现实世界中的物理知识,并能够生成展示这些知识的时间延时视频

    时间延时视频生成模型MagicTime:学习现实世界中的物理知识,并能够生成展示这些知识的时间延时视频

    来自北京大学深圳研究生院、罗彻斯特大学、新加坡国立大学、广东工业大学和加州大学圣克鲁斯分校的研究人员推出新型时间延时视频生成模型MagicTime,这个模型的目标是学习现实世界中的物理知识,并能够生成...
    视频模型# MagicTime# 时间延时视频生成模型
    11个月前
    05570
    新型文生图架构Diffusion-RWKV:基于RWKV模型,为改进图像生成任务而设计

    新型文生图架构Diffusion-RWKV:基于RWKV模型,为改进图像生成任务而设计

    昆仑万维推出新型文生图架构Diffusion-RWKV,它是为了改进图像生成任务而设计的。这个架构是基于RWKV模型,这是一种在自然语言处理(NLP)领域中使用的模型,但经过了特别的修改,使其更适合处...
    图像模型# Diffusion-RWKV# RWKV模型# 文生图架构
    11个月前
    04880
    个性化视觉编辑框架SwapAnything:可以在保持上下文不变的情况下,用参考提供的个性化概念替换图像中的任何物体

    个性化视觉编辑框架SwapAnything:可以在保持上下文不变的情况下,用参考提供的个性化概念替换图像中的任何物体

    来自加州大学圣克鲁斯分校和Adob​​e的研究人员推出个性化视觉编辑框架SwapAnything,它可以在保持上下文不变的情况下,用参考提供的个性化概念替换图像中的任何物体。与现有的个性化主体替换方法...
    图像模型# SwapAnything# 个性化视觉编辑
    11个月前
    05160
    新型框架Diffusion-KTO:用于调整文生图模型,使其生成的图像更符合人类的偏好

    新型框架Diffusion-KTO:用于调整文生图模型,使其生成的图像更符合人类的偏好

    加州大学洛杉矶分校、松下人工智能研究中心和 Salesforce 人工智能研究中心的研究人员推出新型框架Diffusion-KTO,它专门用于调整文生图模型,使其生成的图像更符合人类的偏好。这个过程不...
    图像模型# Diffusion-KTO# 文生图模型
    11个月前
    06460
    创新图像生成框架BeyondScene:能够生成高分辨率(超过8K)、以人为中心的场景图像

    创新图像生成框架BeyondScene:能够生成高分辨率(超过8K)、以人为中心的场景图像

    来自韩国首尔国立大学的研究团队推出创新图像生成框架BeyondScene,它能够生成高分辨率(超过8K)、以人为中心的场景图像。这个框架特别擅长处理包含多个人物和复杂细节的场景,即使这些场景的描述超出...
    图像模型# BeyondScene# 图像生成框架# 高分辨率
    11个月前
    06590
    图像编辑框架ByteEdit:提升基于扩散模型的生成性图像编辑任务的性能

    图像编辑框架ByteEdit:提升基于扩散模型的生成性图像编辑任务的性能

    字节跳动推出图像编辑框架ByteEdit,这是一个精心设计的创新反馈学习框架,旨在增强生成图像编辑任务的效果、提升遵从度,并加速处理速度。它专门用于提升基于扩散模型的生成性图像编辑任务的性能。Byte...
    图像模型# ByteEdit# 图像编辑框架
    11个月前
    01,0700
    新型文生图模型YaART:利用人类反馈的强化学习与人类偏好进行对齐

    新型文生图模型YaART:利用人类反馈的强化学习与人类偏好进行对齐

    来自俄罗斯Yandex、斯科尔科沃科学技术学院、莫斯科国立大学和高等经济学院的研究团队推出新型的、适用于生产环境的文本到图像级联扩散模型YaART(Yet Another Art Rendering ...
    图像模型# YaART# 文生图模型
    11个月前
    05650
    新型图像生成模型MoMA:具有灵活的零样本能力,专注于主体驱动的个性化图像生成

    新型图像生成模型MoMA:具有灵活的零样本能力,专注于主体驱动的个性化图像生成

    来自字节跳动和罗格斯大学的研究人员推出新型图像生成模型MoMA(Multimodal LLM Adapter),这是一个开放词汇、无需训练的个性化图像模型,具有灵活的零样本能力,专注于主体驱动的个性化...
    图像模型# MoMA# 个性化图像生成# 文生图模型
    11个月前
    09410
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    OpenStock

    OpenStock

    OpenStock 是昂贵市场平台的开源替代品。追踪实时价格、设置个性化提醒并探索详细的公司洞察——公开构建,为所有人服务,永久免费。
    NotebookLM

    NotebookLM

    NotebookLM是谷歌推出的一款个性化AI协作工具,旨在帮助用户更高效地进行信息整理和笔记记录。利用强大的语言模型帮助用户更快地从各种文本、图像以及网页中提取主要信息。
    oLLM

    oLLM

    oLLM 是一个轻量级的 Python 库,用于大型上下文 LLM 推理,基于 Huggingface Transformers 和 PyTorch 构建。它使运行像 gpt-oss-20B、qwen3-next-80B 或 Llama-3.1-8B-Instruct 这样的模型在 100k 上下文下使用约 200 美元的消费级 GPU(8GB VRAM)成为可能。不使用量化——仅使用 fp16/bf16 精度。
    OpenAI Codex CLI

    OpenAI Codex CLI

    OpenAI推出的一款开源的本地编码代理Codex CLI,可将自然语言转化为可运行的代码。只需告诉 Codex CLI 您想构建、修复或解释的内容,即可见证它将您的想法变为现实。Codex CLI 支持所有 OpenAI 模型,包括 o3、o4-mini 和 GPT-4.1。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    CachyOS

    CachyOS

    CachyOS是基于Arch Linux的Linux发行。它专注于速度和安全改进:缺省的Linux内核使用BORE调度器进行了深度优化,而桌面软件包使用了LTO和x86-64-v3优化项、安全标记、性能提升项进行编译。可用的桌面环境及窗口管理器包括KDE Plasma、GNOME、Xfce、i3、bspwm、LXQt、Openbox、Wayfire、Cutefish。CachyOS还带有图形化及命令行的安装程序,提供基于Firefox的名为Cachy-Browser的浏览器,浏览器做了安装增强和性能优化。
    查看完整榜单