SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜
    • 网址提交

    模型

    共 1051 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型
    排序
    发布更新浏览点赞
    清华大学 & 字节跳动联合推出 HuMo:一个以人为中心的多模态视频生成框架

    清华大学 & 字节跳动联合推出 HuMo:一个以人为中心的多模态视频生成框架

    一段文字描述 + 一张人物照片 + 一段语音音频,能否生成一个口型同步、动作自然、形象一致的高质量人物视频? 现在,可以了。 清华大学与字节跳动智能创作团队合作推出 HuMo(Human-Centri...
    视频模型# HuMo# 字节跳动
    4个月前
    0940
    蚂蚁集团推出推理模型 Ring-mini-2.0

    蚂蚁集团推出推理模型 Ring-mini-2.0

    蚂蚁集团推出了一款紧凑而强大的推理模型 Ring-mini-2.0。该模型总参数量为 16B,但每个输入 token 仅激活 14 亿个参数(非嵌入参数部分为 7.89 亿)。尽管 Ring-mini...
    大语言模型# Ring-mini-2.0# 推理模型# 蚂蚁集团
    4个月前
    01050
    阿里Qwen团队发布Qwen3-Next-80B-A3B:用混合注意力 + 高稀疏MoE 实现极致性价比

    阿里Qwen团队发布Qwen3-Next-80B-A3B:用混合注意力 + 高稀疏MoE 实现极致性价比

    在大模型进入“长上下文”与“超大规模参数”竞争的新阶段,如何平衡性能、训练成本与推理效率,成为决定落地能力的关键。 为此,阿里通义千问(Qwen)项目组正式推出 Qwen3-Next ——一个全新设计...
    大语言模型# Qwen3-Next# Qwen3-Next-80B-A3B
    4个月前
    04670
    腾讯混元联合高校提出 Direct-Align:用“一步恢复”实现扩散模型的高效偏好对齐

    腾讯混元联合高校提出 Direct-Align:用“一步恢复”实现扩散模型的高效偏好对齐

    在文生图模型日益成熟的今天,提升生成质量已不再是唯一目标——如何让图像真正符合人类的审美偏好,成为更高阶的挑战。 现有方法通常依赖强化学习或可微奖励机制,将模型输出与人类偏好对齐。但这些方法普遍存在两...
    图像模型# Direct-Align# flux.1-dev-SRPO# 腾讯混元
    4个月前
    01710
    字节跳动开源UMO:统一多身份优化框架,让AI准确“认出”每个人

    字节跳动开源UMO:统一多身份优化框架,让AI准确“认出”每个人

    在图像定制领域,个性化生成已逐渐从“一个人一个风格”迈向“多人协同场景”的复杂需求。然而,当一张图中需要同时呈现多个真实人物时,模型常常出现“张冠李戴”——面部特征混淆、身份错位,导致输出失真。这不仅...
    图像模型# UMO# 字节跳动
    4个月前
    03060
    Stable Audio 2.5 发布:Stability AI 推出首款企业级音效制作专用音频模型

    Stable Audio 2.5 发布:Stability AI 推出首款企业级音效制作专用音频模型

    Stability AI 正式推出 Stable Audio 2.5——这是业内首款专为企业级音效制作设计的音频生成模型。该模型聚焦企业在规模化定制高质量音频时的核心需求,通过技术升级与生态合作,助力...
    语音模型# Stability AI# Stable Audio 2.5
    4个月前
    01630
    中国团队推出 Lumina-DiMOO:支持生成与理解的全能多模态模型

    中国团队推出 Lumina-DiMOO:支持生成与理解的全能多模态模型

    由上海人工智能实验室牵头,联合上海创智学院、上海交通大学、悉尼大学、南京大学、香港中文大学和清华大学的研究团队,共同推出 Lumina-DiMOO ——一个面向多模态生成与理解一体化的新型基础模型。 ...
    图像模型# Lumina-DiMOO# 多模态模型
    4个月前
    01970
    字节跳动 & 港大推出 Mini-o3:可扩展多轮推理的开源视觉智能体

    字节跳动 & 港大推出 Mini-o3:可扩展多轮推理的开源视觉智能体

    字节跳动与香港大学联合发布 Mini-o3 ——一个具备强大图像理解与长程多轮交互能力的开源多模态模型。该模型能够生成类似 OpenAI o3 风格的代理行为轨迹,在复杂视觉搜索任务中实现数十轮持续推...
    多模态模型# Mini-o3# 视觉智能体
    4个月前
    01930
    字节跳动发布 Seedream 4.0:首次支持多模态生图,同一模型实现 文生图、图像编辑、组图生成

    字节跳动发布 Seedream 4.0:首次支持多模态生图,同一模型实现 文生图、图像编辑、组图生成

    字节跳动正式推出 Seedream 4.0(即梦图片4.0),新一代图像创作模型。该模型在前代 Seedream 3.0 和 SeedEdit 3.0 的基础上,全面增强逻辑理解与多模态推理能力,首次...
    图像模型# Seedream 4.0# 即梦图片4.0# 字节跳动
    4个月前
    02700
    百度推出轻量级推理模型ERNIE-4.5-21B-A3B-Thinking:原生支持函数调用,可联网查天气、调数据库

    百度推出轻量级推理模型ERNIE-4.5-21B-A3B-Thinking:原生支持函数调用,可联网查天气、调数据库

    百度推出ERNIE-4.5-21B-A3B-Thinking,一款专为复杂推理任务优化的轻量级 MoE(Mixture of Experts)大模型。该模型在原有 ERNIE-4.5 基础上显著提升了...
    大语言模型# ERNIE-4.5-21B-A3B-Thinking# 百度
    4个月前
    01350
    腾讯混元开源 HunyuanImage 2.1:支持 2K 分辨率的高效文生图模型

    腾讯混元开源 HunyuanImage 2.1:支持 2K 分辨率的高效文生图模型

    腾讯混元项目组正式开源HunyuanImage 2.1,一款支持 2048×2048 超高分辨率(2K)生成的文生图模型。该模型在语义对齐、细节控制与推理效率方面实现显著提升,具备电影级构图能力,并原...
    图像模型# HunyuanImage 2.1# 文生图模型
    4个月前
    03100
    AnimaX:支持任意骨骼结构的高效 3D 动画生成框架

    AnimaX:支持任意骨骼结构的高效 3D 动画生成框架

    由北京航空航天大学软件学院、清华大学、香港大学与 VAST 联合提出的新框架 AnimaX,为 3D 角色动画生成带来了一种高效且通用的解决方案。 项目主页:https://anima-x.githu...
    3D模型# 3D 动画生成# AnimaX
    4个月前
    0820
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    CodeFlicker

    CodeFlicker

    CodeFlicker 是一个 AI 驱动的代码编辑器,通过自然语言理解您的代码库,帮助您完成代码理解、代码生成、缺陷解决和需求实现等任务。它帮助开发者提升编码效率,更有效地交付代码。
    NocoBase

    NocoBase

    NocoBase 不是“又一个低代码表单工具”。它用数据模型驱动 + 插件化架构 + AI 深度集成,重新定义了无代码平台的可能性——既能让业务人员快速构建应用,又能让技术团队灵活扩展,真正实现“完全掌控,无限扩展,AI 协同”。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    DeepAnalyze

    DeepAnalyze

    DeepAnalyze 是首个用于自主数据科学的智能体式 LLM,它能够在无需人工干预的情况下自主完成广泛的数据中心任务。其核心模型 DeepAnalyze-8B 仅用 80 亿参数,就在多项数据科学任务上超越了基于主流闭源大模型构建的预定义工作流智能体,标志着自主数据科学从“可能”走向“可行”。
    查看完整榜单