SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    模型

    共 995 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型
    排序
    发布更新浏览点赞
    StabilityAI推出全新视频生成模型Stable Video 4D(SV4D):可将单个视频转化为 8 个不同角度/视图的新视图视频

    StabilityAI推出全新视频生成模型Stable Video 4D(SV4D):可将单个视频转化为 8 个不同角度/视图的新视图视频

    StabilityAI在今天推出一个新的视频生成模型Stable Video 4D(SV4D),只需 40 秒就可将单个视频转化为 8 个不同角度/视图的新视图视频(5 帧/个视角),整个 4D 优化...
    视频模型# StabilityAI# Stable Video 4D# SV4D
    10个月前
    01,0360
    智谱 AI 开源视频生成模型 CogVideoX-5B ,RTX 3060 显卡可运行

    智谱 AI 开源视频生成模型 CogVideoX-5B ,RTX 3060 显卡可运行

    之前已经给大家分享了《智谱AI推出视频生成模型CogVideoX:与“清影”同源,单张 4090 显卡可推理》,之前推出的是CogVideoX-2B模型,智谱 AI又开源了CogVideoX-5B,相...
    视频模型# CogVideoX-5B# 智谱 AI
    10个月前
    01,0250
    flux-ip-adapter-v2:基于FLUX.1-dev的风格迁移IP-Adapter 模型

    flux-ip-adapter-v2:基于FLUX.1-dev的风格迁移IP-Adapter 模型

    XLabs-AI推出了很多基于FLUX.1-dev 模型的ControlNet模型,近期XLabs-AI又推出了基于FLUX.1-dev的IP-Adapter 模型,支持支持 512 和 1024 分...
    Flux衍生插件# flux-ip-adapter-v2# FLUX.1-dev 模型# IP-Adapter 模型
    10个月前
    01,0190
    Stable Diffusion 1.5

    Stable Diffusion 1.5

    Stable Diffusion 1.5 是由 Runway ML 开发,基于 Stable Diffusion 1.2 版本,于2022年10月发布,并进行了以下改进: 使用了更大的模型:Stabl...
    图像模型# Runway ML# Stable Diffusion 1.5# 模型
    10个月前
    01,0170
    SDXL系列新模型SDXL Flash:高速且保证质量的SDXL模型

    SDXL系列新模型SDXL Flash:高速且保证质量的SDXL模型

    Stable Diffusion Community是一个非官方、非盈利性质的组织,它们主要目标是尽可能改进 SD 模型并让每个人都可以使用它们,近期它们推出了新的SDXL系列模型SDXL Flash...
    图像模型# SDXL Flash# sdxl-flash-mini# 高速模型
    10个月前
    01,0160
    多语言文本编码器Glyph-ByT5-v2:提高在图形设计图像中渲染多种语言文本的准确性和美观度

    多语言文本编码器Glyph-ByT5-v2:提高在图形设计图像中渲染多种语言文本的准确性和美观度

    来自微软亚洲研究院、清华大学、北京大学和利物浦大学的研究人员推出新型多语言视觉文本渲染技术Glyph-ByT5-v2,这是之前介绍的Glyph-ByT5升级版,此技术的目标是提高在图形设计图像中渲染多...
    大语言模型# Glyph-ByT5-v2# Glyph-SDXL-v2# 文本编码器
    10个月前
    01,0010
    新型文生图模型CoMat:更好地理解和执行文本描述,提高了文本到图像生成的质量和准确性

    新型文生图模型CoMat:更好地理解和执行文本描述,提高了文本到图像生成的质量和准确性

    来自香港中文大学、商汤科技和上海人工智能实验室的研究人员推出新型文生图模型CoMat,这是一种具有图像到文本概念匹配机制的端到端扩散模型微调策略。开发团队借助图像字幕模型来评估图像与文本的对齐程度,并...
    图像模型# CoMat# 文生图模型
    10个月前
    09900
    文生图模型新架构MoA:根据用户的个性化需求生成包含特定人物的图像,同时保持原有模型的风格和多样性

    文生图模型新架构MoA:根据用户的个性化需求生成包含特定人物的图像,同时保持原有模型的风格和多样性

    Snap推出新架构注意力混合(Mixture-of-Attention,简称MoA),即在个性化图像生成中实现主体与上下文解耦的注意力混合模型(MoA),用于个性化文本到图像的扩散模型。简单来说,Mo...
    图像模型# MoA# 文生图模型
    10个月前
    09800
    华为PixArt系列最新模型—PIXART-Σ:基于DiT,可直接生成4K分辨率的图像

    华为PixArt系列最新模型—PIXART-Σ:基于DiT,可直接生成4K分辨率的图像

    来自华为诺亚方舟实验室、大连理工大学、香港大学的研究人员推出了最新的PixArt模型—PIXART-Σ,PixArt-Σ基于Diffusion Transformer架构 (DiT,与Sora、Sta...
    图像模型# DiT# PIXART-Σ# 文生图模型
    10个月前
    09790
    图像编辑框架ByteEdit:提升基于扩散模型的生成性图像编辑任务的性能

    图像编辑框架ByteEdit:提升基于扩散模型的生成性图像编辑任务的性能

    字节跳动推出图像编辑框架ByteEdit,这是一个精心设计的创新反馈学习框架,旨在增强生成图像编辑任务的效果、提升遵从度,并加速处理速度。它专门用于提升基于扩散模型的生成性图像编辑任务的性能。Byte...
    图像模型# ByteEdit# 图像编辑框架
    10个月前
    09780
    PixelWave Flux.1-Dev:基于FLUX.1-dev的微调FLUX模型,适合艺术和摄影风格

    PixelWave Flux.1-Dev:基于FLUX.1-dev的微调FLUX模型,适合艺术和摄影风格

    PixelWave Flux.1-Dev是一个基于FLUX.1-dev的微调FLUX模型,非常适合艺术和摄影风格,黑色和深色图像输出更可靠,手部问题更少。目前已经推出了第三版,开发者推出了多个版本(S...
    Flux衍生# FLUX.1-dev# PixelWave Flux.1-Dev
    10个月前
    09720
    卷积重建模型CRM:将一张普通的2D图片转换成一个带有纹理的3D模型

    卷积重建模型CRM:将一张普通的2D图片转换成一个带有纹理的3D模型

    清华大学、中国人民大学等团队研究人员推出卷积重建模型CRM。该模型可用于将单图像转换为3D纹理网格,可在短短10秒内就从图像中提供了高保真纹理网格,无需任何优化测试。 项目主页 GitHub Demo...
    3D模型# 3D模型# CRM# 重建模型
    10个月前
    09710
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Next AI Draw.io

    Next AI Draw.io

    Next AI Draw.io 是一个基于 Next.js 的 Web 应用,将大语言模型(LLM)与 draw.io 的强大图表能力深度集成。用户可通过自然语言指令创建、修改和增强专业图表,无需手动拖拽。
    MuMuAINovel

    MuMuAINovel

    MuMuAINovel 是一款开源的 AI 小说创作辅助工具,专为写作者设计。它不替代你的创意,而是帮你把想法快速转化为结构完整、设定一致、可扩展的长篇故事。
    OiiOii AI

    OiiOii AI

    OiiOii.ai 是一个基于多智能体架构的动画生成平台,其核心目标是将动画制作从线性协作流程,转变为端到端的自动化生成。用户只需上传一张图片或输入一段文字描述,系统即可自动完成剧本生成、分镜设计、角色建模、镜头调度、配乐合成与最终渲染,输出一段完整动画视频。
     Hitem3D 

     Hitem3D 

    Hitem3D由Math Magic开发,是一款基于专有高分辨率AI模型Sparc3D的3D生成工具。只需上传一张参考图像,即可即时生成行业领先品质的工作室级3D资产,极大降低了3D创作的门槛。这一突破性解决方案赋能游戏开发者、设计师和3D艺术家高效释放创意,加速从概念到部署的创作流程。
    AI 智能盲人眼镜系统

    AI 智能盲人眼镜系统

    AI 智能盲人眼镜系统是一个面向视障用户的智能辅助工具原型,整合了盲道导航、过马路辅助、物品识别和语音交互等核心功能。通过视频、音频、IMU(惯性测量单元)等多模态输入,系统可提供实时语音引导与环境感知能力,帮助用户更安全地感知周围环境。
    查看完整榜单