SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    模型

    共 1136 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型世界模型
    排序
    发布更新浏览点赞
     OmniPart:用于生成具有明确部件结构的 3D 对象的框架

     OmniPart:用于生成具有明确部件结构的 3D 对象的框架

    香港大学、哈尔滨大学、VAST和浙江大学的研究人员推出 OmniPart,这是一个用于生成具有明确部件结构的 3D 对象的框架。OmniPart 通过将复杂的 3D 对象分解为可控制的部件,并在保持语...
    3D模型# OmniPart
    8个月前
    04360
    StreamDiT:实现实时流式文本到视频生成的新一代扩散模型

    StreamDiT:实现实时流式文本到视频生成的新一代扩散模型

    近年来,随着基于变换器(Transformer)的扩散模型向数十亿参数扩展,文本到视频(Text-to-Video, T2V)生成技术取得了显著进展。尽管当前模型已能生成高质量视频内容,但它们通常只能...
    视频模型# StreamDiT# 流式视频生成模型
    8个月前
    03390
    字节跳动 & 南大联合推出 CriticLean 框架:让 AI 更准确地翻译数学为代码

    字节跳动 & 南大联合推出 CriticLean 框架:让 AI 更准确地翻译数学为代码

    将自然语言数学语句自动转化为形式化代码(如 Lean 4)是计算数学中的核心挑战之一。尽管已有许多自动化工具尝试解决这一问题,但其准确性仍面临瓶颈,尤其是在需要深入理解语义的复杂场景中。 为此,字节跳...
    大语言模型# CriticLean# 字节跳动
    8个月前
    01740
    昆仑万维天工项目组推出多模态推理模型 Skywork-R1V3-38B

    昆仑万维天工项目组推出多模态推理模型 Skywork-R1V3-38B

    昆仑万维天工项目组近日发布了 Skywork-R1V3-38B,这是其开源视觉-语言模型(VLM)系列 Skywork-R1V 的最新迭代版本,也是目前该系列中性能最强的多模态推理模型。基于 Inte...
    多模态模型# Skywork-R1V3-38B# 多模态推理模型# 昆仑万维
    8个月前
    02270
    微软推出 NextCoder:基于 Qwen2.5-Coder 的高效代码编辑模型

    微软推出 NextCoder:基于 Qwen2.5-Coder 的高效代码编辑模型

    近年来,软件开发中的代码编辑需求日益增长,尤其是在维护和重构已有项目时。然而,现有的大语言模型在面对多样化的代码修改任务时,往往表现不佳。为了解决这一问题,微软联合相关研究团队提出了一套全新的方法,并...
    大语言模型# NextCoder# Qwen2.5-Coder# 代码编辑模型
    8个月前
    02350
    LTX Studio为其开源视频生成模型 LTX Video 推出三款全新 LoRA控制模型,为开源视频模型带来前所未有的控制力

    LTX Studio为其开源视频生成模型 LTX Video 推出三款全新 LoRA控制模型,为开源视频模型带来前所未有的控制力

    LTX Studio 为其开源视频生成模型 LTX Video 推出了三项全新的 LoRA 控制模块,让 AI 视频创作进入一个更具操控性与表现力的新阶段。 Depth Control: LTX-Vi...
    视频模型# LTX Studio# LTX Video
    8个月前
    01630
    Hugging Face发布SmolLM3:3B 级全能小模型,支持推理/非推理双模式与 128k 上下文

    Hugging Face发布SmolLM3:3B 级全能小模型,支持推理/非推理双模式与 128k 上下文

    随着边缘计算和本地部署需求的增长,小型语言模型(Small Language Model, SLM) 正在成为新一代 AI 应用的关键组成部分。近日,Hugging Face 推出了其最新力作 —— ...
    大语言模型# Hugging Face# SmolLM3# 小模型
    8个月前
    01010
    Katanemo Labs发布1.5B 路由模型Arch-Router-1.5B:实现 93% 准确率,无需昂贵微调

    Katanemo Labs发布1.5B 路由模型Arch-Router-1.5B:实现 93% 准确率,无需昂贵微调

    在 LLM(大语言模型)应用场景日益复杂的背景下,如何将用户查询智能路由到最合适的模型,成为提升效率和体验的关键挑战。 近日,Katanemo Labs 推出了一个创新的解决方案 —— Arch-Ro...
    大语言模型# Arch-Router-1.5B# 路由模型
    8个月前
    01490
    NovelAI 正式公开了其基于SD1.5的第二代图像生成模型 NovelAI Diffusion V2

    NovelAI 正式公开了其基于SD1.5的第二代图像生成模型 NovelAI Diffusion V2

    NovelAI 正式公开了其第二代图像生成模型 NovelAI Diffusion V2 的权重文件,供研究、个人使用及历史保存。这一举动意味着即使该模型在 NovelAI 官网停止服务后,用户仍可通...
    图像模型# NovelAI Diffusion V2# SD1.5
    8个月前
    03400
    DLoRAL:一种兼顾细节与时间一致性的视频超分辨率新方法

    DLoRAL:一种兼顾细节与时间一致性的视频超分辨率新方法

    在现实世界视频超分辨率(Real-VSR)任务中,如何从低质量(LQ)视频中恢复出既细节丰富又时间连贯的高质量(HQ)视频,是一个极具挑战性的问题。尤其是在使用预训练扩散模型(如 Stable Dif...
    视频模型# DLoRAL# 视频超分辨率
    8个月前
    03840
    阿里通义实验室开源 WebSailor,登顶 BrowseComp 榜单的网络智能体

    阿里通义实验室开源 WebSailor,登顶 BrowseComp 榜单的网络智能体

    近日,阿里云通义实验室正式开源了一款名为 WebSailor 的新型网络智能体(Web Agent),它具备强大的多步推理与信息检索能力,在高难度网页导航任务中表现出色。 GitHub:https...
    大语言模型# WebSailor# 网络智能体# 阿里通义实验室
    8个月前
    02480
    腾讯发布业界首个“美术级”AI 3D 生成模型Hunyuan3D-PolyGen

    腾讯发布业界首个“美术级”AI 3D 生成模型Hunyuan3D-PolyGen

    2025 年 7 月 7 日,腾讯正式发布全新升级的 Hunyuan3D-PolyGen,这是全球首个专为艺术级 3D 建模设计的人工智能生成模型。该模型不仅在几何精度和拓扑优化方面达到新高度,更首次...
    3D模型# Hunyuan3D-PolyGen# 腾讯
    8个月前
    01520
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    YouMind

    YouMind

    YouMind 是一款重新构想的 AI 写作工具,帮助每个人轻松开启创作之旅。捕捉灵感、收集素材、撰写草稿,并将其转化为精炼的文章、播客、视频等丰富内容。
    OpenClaw(Clawdbot/Moltbot)

    OpenClaw(Clawdbot/Moltbot)

    Clawdbot 是一款可在您自己的设备上运行的个人 AI 助手。它在您已使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及扩展渠道(如 BlueBubbles、Matrix、Zalo 和 Zalo Personal)上为您提供应答。它可以在 macOS/iOS/Android 上进行语音交谈,并能渲染一个您可控制的实时画布。网关仅是控制平面——核心产品是助手本身。
    Skills.sh

    Skills.sh

    Vercel 近日上线了一个名为 skills.sh 的新站点,专门用于发现、浏览和安装 AI 智能体的“技能”(Skills)。
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    nanobot

    nanobot

    nanobot 是一款受 OpenClaw 启发,却走向极简主义的个人 AI 助手。仅用约 4,000 行代码,nanobot 就实现了核心智能体功能,体积相比 OpenClaw 的 43 万行代码缩减了 99%,真正做到了“小到可以理解”。
    查看完整榜单