SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    模型

    共 1179 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型世界模型
    排序
    发布更新浏览点赞
    Anima:20亿参数动漫专属文生图模型,ComfyUI原生支持,专注插画艺术创作

    Anima:20亿参数动漫专属文生图模型,ComfyUI原生支持,专注插画艺术创作

    CircleStone Labs 与 Comfy Org 联合打造的Anima文生图模型正式推出预览版,这款拥有20亿参数(2B)的模型专为动漫艺术打造,聚焦动漫概念、角色与风格创作,同时可生成各类非...
    图像模型# Anima# ComfyUI# 动漫
    4天前
    02320
    上海AI实验室发布 Intern-S1-Pro:万亿参数 MoE 多模态科学推理模型

    上海AI实验室发布 Intern-S1-Pro:万亿参数 MoE 多模态科学推理模型

    上海AI实验室推出 Intern-S1-Pro —— 一款面向科学发现的万亿级混合专家(MoE)多模态大模型。该模型在保持强大通用能力的同时,专为 AI for Science(AI4Science...
    多模态模型# Intern-S1-Pro# 上海AI实验室# 书生科学多模态大模型
    1个月前
    0210
    面壁智能发布MiniCPM-o 4.5:9B参数端侧全双工多模态大模型,对标Gemini 2.5 Flash

    面壁智能发布MiniCPM-o 4.5:9B参数端侧全双工多模态大模型,对标Gemini 2.5 Flash

    面壁智能正式推出MiniCPM-o系列最新旗舰模型——MiniCPM-o 4.5。这款总参数量仅9B的端侧多模态大模型(MLLM),基于SigLip2、Whisper-medium、CosyVoice...
    多模态模型# MiniCPM-o 4.5# 面壁智能
    1个月前
    0670
    电信AI研究院提出TeleStyle:DiT架构下实现图像/视频内容保持式风格迁移SOTA

    电信AI研究院提出TeleStyle:DiT架构下实现图像/视频内容保持式风格迁移SOTA

    中国电信人工智能研究院(TeleAI)提出TeleStyle——一款轻量级且高效的图像与视频内容保持式风格迁移模型,核心基于Qwen-Image-Edit构建,针对性解决了扩散变换器(DiT)架构中内...
    图像模型# TeleStyle# 风格迁移
    1个月前
    0410
    ACE Studio×阶跃星辰推出ACE-Step v1.5:混合架构开源音乐模型,商用就绪且50+语言适配

    ACE Studio×阶跃星辰推出ACE-Step v1.5:混合架构开源音乐模型,商用就绪且50+语言适配

    ACE Studio联合阶跃星辰(StepFun)重磅发布ACE-Step v1.5,这是一款专为消费级硬件打造的高效开源音乐基础模型,首次将商业级音乐生成能力下沉到普通硬件环境。该模型不仅在核心评估...
    语音模型# ACE Studio# ACE-Step v1.5# 阶跃星辰
    1个月前
    0970
    InteractAvatar:文本驱动的可控说话化身框架,实现高保真场景化人-物交互

    InteractAvatar:文本驱动的可控说话化身框架,实现高保真场景化人-物交互

    清华大学联合腾讯混元项目组研发的InteractAvatar,是一款创新的双流DiT(扩散变换器)框架,首次让说话虚拟化身突破简单手势局限,实现基于静态场景的文本驱动可控人-物交互。该模型能从参考图像...
    视频模型# InteractAvatar# 数字人
    1个月前
    0460
    阿里Qwen3-Coder重磅发布:480B MoE模型拿下开源Agent编程SOTA,媲美Claude Sonnet4

    阿里Qwen3-Coder重磅发布:480B MoE模型拿下开源Agent编程SOTA,媲美Claude Sonnet4

    阿里Qwen项目组正式推出Qwen3-Coder系列代码模型,这是其迄今代理能力最强的代码模型版本,其中旗舰款Qwen3-Coder-480B-A35B-Instruct更是拉满配置——总参数量480...
    大语言模型# Claude Sonnet4# Qwen3-Coder# 阿里
    1个月前
    03770
    两个月再升级!HCompany推出2350亿参数Holo2-235B-A22B,刷新UI定位模型基准

    两个月再升级!HCompany推出2350亿参数Holo2-235B-A22B,刷新UI定位模型基准

    距离首款Holo2模型发布仅两个月,HCompany便推出迄今最大规模的UI定位模型Holo2-235B-A22B Preview,一举在ScreenSpot-Pro基准测试中创下78.5%的新纪录...
    多模态模型# HCompany# Holo2# Holo2-235B-A22B
    1个月前
    0250
    智谱AI开源GLM-OCR:0.9B参数拿下榜单第一,支持vLLM部署,一行命令就能用

    智谱AI开源GLM-OCR:0.9B参数拿下榜单第一,支持vLLM部署,一行命令就能用

    智谱AI又放出一款实用开源模型——GLM-OCR,这是一款专为复杂文档理解打造的多模态OCR模型,不仅在权威基准测试中拿下综合第一,还做到了轻量高效、易部署,关键是完全开源,个人和企业都能免费使用。 ...
    多模态模型# GLM-OCR# 智谱AI
    1个月前
    02340
    Apache 2.0 许可!Photoroom 推出轻量级 13 亿参数开源文生图模型 PRX

    Apache 2.0 许可!Photoroom 推出轻量级 13 亿参数开源文生图模型 PRX

    Photoroom 团队正式发布了其首个开源文生图模型 PRX (Photoroom Experimental)。这是一个拥有 13 亿参数、完全从头开始训练 的扩散变换器模型,并以宽松的 Apach...
    图像模型# Photoroom# PRX
    1个月前
    0360
    阶跃星辰推出Step 3.5 Flash:196B MoE 开源旗舰,推理与智能体性能对标闭源顶级模型

    阶跃星辰推出Step 3.5 Flash:196B MoE 开源旗舰,推理与智能体性能对标闭源顶级模型

    Step 3.5 Flash 是阶跃星辰推出的开源旗舰语言推理模型,定位为当前最强大的开源基座之一,专为极致效率、深度推理、智能体(Agent)执行而生。 GitHub:https://github...
    大语言模型# Step 3.5 Flash# 阶跃星辰
    1个月前
    0480
    优必选开源具身智能大模型Thinker:小参数、高性能,专为工业人形机器人打造

    优必选开源具身智能大模型Thinker:小参数、高性能,专为工业人形机器人打造

    过去一年,人形机器人在实验室环境中的“场景理解”与“任务规划”能力突飞猛进。然而,一旦进入真实的工业产线,它们便常常陷入“想得到但抓不准、算得出但跟不上”的困境。这背后,是长期存在的鸿沟:空间层面的度...
    多模态模型# Thinker# 优必选# 具身智能大模型
    1个月前
    0330
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    ArkClaw

    ArkClaw

    字节旗下火山引擎正式上线 ArkClaw, 开箱即用的云上 SaaS 版 OpenClaw。无需任何复杂配置,打开网页即可使用 7×24 小时在线的 AI 助手。
    JVSClaw

    JVSClaw

    里云正式推出基于该框架打造的下一代 AI 助理平台——JVSClaw。目前,该产品已开启内测,主打“开箱即用”与“自进化能力”,让普通用户和开发者都能轻松“快乐养虾”。
    360 安全龙虾

    新360 安全龙虾

    60安全龙虾目前已接入16家国内主流大模型,覆盖文本生成、编程开发、多模态创作等多种能力。同时内置100余个高频技能,可直接用于文档生成、数据分析、PPT制作、会议转写等常见办公场景。
    FLORA

    FLORA

    FLORA 是一款创意图像和视频创作工具,接入了顶级 AI 绘画和视频模型。它通过优雅的交互设计,帮助创意团队构建结构化、可扩展的工作流,提升创作速度和控制力,支持多人实时协作。
    Vidu

    Vidu

    Vidu 是一款由生数科技与清华大学合作开发的 AI 视频生成工具,2024 年推出,专注于从文本和图像生成高清视频。它支持文本转视频、图像转视频和参考转视频模式,适合社交媒体、广告和电影制作。
    查看完整榜单