SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    模型

    共 1136 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型世界模型
    排序
    发布更新浏览点赞
    谷歌发布医学多模态开源模型MedGemma:支持图像与文本理解,支持X光CT分析

    谷歌发布医学多模态开源模型MedGemma:支持图像与文本理解,支持X光CT分析

    谷歌近日推出了一款面向医疗领域的开源模型系列 —— MedGemma,该模型基于 Gemma 3 构建,在医学图像识别与文本理解方面表现出色,标志着医疗 AI 在开源方向上的重要进展。 MedGemm...
    多模态模型# MedGemma# 医学多模态开源模型# 谷歌
    9个月前
    02030
    字节跳动推出全新视频生成框架 ATI:用“画轨迹”控制视频运动,对象、视角、局部变形一应俱全!

    字节跳动推出全新视频生成框架 ATI:用“画轨迹”控制视频运动,对象、视角、局部变形一应俱全!

    字节跳动 AI 实验室发布了一项令人眼前一亮的视频生成技术 —— ATI(Any Trajectory Instruction),它让普通人也能通过“画轨迹”的方式,精准控制视频中物体的运动、镜头的移...
    视频模型# ATI# ATI-Wan2.1 14B# 字节跳动
    9个月前
    03360
    蚂蚁集团开源全新统一多模态大模型 Ming-Lite-Omni:支持图像、文本、音频、视频

    蚂蚁集团开源全新统一多模态大模型 Ming-Lite-Omni:支持图像、文本、音频、视频

    近日,蚂蚁集团旗下的 百灵大模型(Ling)团队 正式宣布开源其最新推出的统一多模态大模型 —— Ming-Lite-Omni。这是一款基于 Ling 系列轻量模型构建的 MoE 架构全模态 AI 模...
    多模态模型# Ming-Lite-Omni# 多模态大模型# 蚂蚁集团
    9个月前
    03210
    Snowflake 开源两款 AI 工具Arctic-Text2SQL-R1 和 Arctic Inference,专治企业最头疼的两个难题!

    Snowflake 开源两款 AI 工具Arctic-Text2SQL-R1 和 Arctic Inference,专治企业最头疼的两个难题!

    生成式 AI 发展到今天,很多问题已经解决,但仍有两大“顽疾”困扰着企业用户: 文本转 SQL 的准确性问题:AI 写出来的 SQL 看起来像模像样,但在真实数据库上却执行失败; AI 推理的速度与成...
    大语言模型# Arctic Inference# Arctic-Text2SQL-R1# Snowflake
    9个月前
    04670
    DeepSeek R1 升级:推理能力逼近顶尖模型,小模型也迎来突破

    DeepSeek R1 升级:推理能力逼近顶尖模型,小模型也迎来突破

    DeepSeek 最新发布了其旗舰模型 DeepSeek R1 的升级版本 —— DeepSeek-R1-0528。这次更新不仅在推理深度上有了显著提升,还在幻觉控制、函数调用支持和代码生成体验等方面...
    大语言模型# DeepSeek-R1
    9个月前
    03720
    DeepSeek推出基于Qwen3-8B的小型推理模型:DeepSeek-R1-0528-Qwen3-8B

    DeepSeek推出基于Qwen3-8B的小型推理模型:DeepSeek-R1-0528-Qwen3-8B

    深度求索在本周对DeepSeek R1进行了升级,还开源了此版本模型DeepSeek-R1-0528,官方还推出了一个基于Qwen3-8B的小型推理模型:DeepSeek-R1-0528-Qwen3...
    大语言模型# DeepSeek# DeepSeek-R1-0528-Qwen3-8B# 深度求索
    9个月前
    02490
    Black Forest Labs 推出新一代上下文感知图像生成模型FLUX.1 Kontext,支持图像生成及编辑

    Black Forest Labs 推出新一代上下文感知图像生成模型FLUX.1 Kontext,支持图像生成及编辑

    继 FLUX.1 系列大获成功后,Black Forest Labs(黑森林实验室) 在今天正式发布其最新力作 —— FLUX.1 Kontext。 这是一套全新的上下文流匹配生成模型(Context...
    图像模型# Black Forest Labs# FLUX.1 Kontext# 黑森林实验室
    9个月前
    07070
    腾讯混元项目组推出数字人头像生成模型 HunyuanPortrait :用于高度可控且逼真的肖像动画生成

    腾讯混元项目组推出数字人头像生成模型 HunyuanPortrait :用于高度可控且逼真的肖像动画生成

    腾讯混元项目组推出基于扩散模型的条件控制方法 HunyuanPortrait ,用于高度可控且逼真的肖像动画生成。该方法通过隐式表示来控制肖像动画,能够利用单张肖像图像作为外观参考和视频片段作为驱动模...
    视频模型# HunyuanPortrait# 腾讯混元
    9个月前
    01900
    Resemble AI推出首个情感可控的开源TTS模型Chatterbox

    Resemble AI推出首个情感可控的开源TTS模型Chatterbox

    Resemble AI正式发布了其首个生产级开源TTS模型——Chatterbox。这是目前市面上少有的、具备高质量语音合成能力并支持情感控制的开源项目。目前仅支持英文。 GitHub:https...
    语音模型# Chatterbox# Resemble AI# TTS模型
    6个月前
    03550
    OmniConsistency:解决图像风格化中“一致性”难题的通用插件,提升了图像风格化的一致性与美学质量

    OmniConsistency:解决图像风格化中“一致性”难题的通用插件,提升了图像风格化的一致性与美学质量

    在图像风格化领域,扩散模型已经取得了显著进展。然而,两个核心问题始终困扰着研究者与开发者: 如何在复杂场景下保持一致的风格化效果? 尤其是在身份、构图和细节上的保留。 如何防止图像到图像(I2I)流水...
    图像模型# OmniConsistency# 图像风格化
    9个月前
    04210
    腾讯混元推出HunyuanVideo-Avatar:音频驱动、情感可控、支持多角色的虚拟人视频生成模型

    腾讯混元推出HunyuanVideo-Avatar:音频驱动、情感可控、支持多角色的虚拟人视频生成模型

    近年来,音频驱动人物动画(Audio-driven Avatar Animation)取得了显著进展,但仍有几个关键挑战尚未完全解决: 如何在保持角色一致性的前提下生成高度动态的视频; 实现角色与音频...
    视频模型# HunyuanVideo-Avatar# 腾讯混元# 视频生成模型
    9个月前
    03930
    别让好模型消失,这个 WAN2.1 LoRA 合集值得收藏”

    别让好模型消失,这个 WAN2.1 LoRA 合集值得收藏”

    近日,CivitAI 在 Visa 和 Mastercard 的压力下进一步收紧内容政策,导致平台上大量 模型被删除。这些模型中包含了许多创作者精心训练的作品,尤其是 NSFW类内容。 地址:http...
    视频模型# WAN2.1 LoRA
    9个月前
    09130
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    Protenix

    Protenix

    Protenix 是面向高精度生物分子结构预测构建的开源体系,也是字节跳动 Seed 团队在计算生物学领域,为推动开放、可复现、可扩展研究工具迈出的关键一步。Protenix-v1 是首个在严格对等条件下性能超越 AlphaFold 3 的全开源生物分子结构预测模型,支持蛋白质、核酸、配体等多类型分子的通用结构预测,不仅开放模型权重,同时完整开源训练数据 pipeline、MSA 处理流程与配套工具,让研究与工业界均可基于这套体系进行二次开发、标准化评估与规模化应用。
    InstaSD

    InstaSD

    InstaSD 是一个云平台,旨在让创意团队轻松管理并部署ComfyUI工作流,主要用于生成图像和视频。它的目标是让用户无需编码技能就能使用,特别适合非技术用户。
    stagewise

    stagewise

    Stagewise 是一个浏览器工具栏,能够将您的前端用户界面连接到代码编辑器中的AI代理。这意味着您可以直接在网页上选择元素,AI代理会根据您的操作提供实时的代码修改建议,真正做到“指哪改哪”。
     Hitem3D 

     Hitem3D 

    Hitem3D由Math Magic开发,是一款基于专有高分辨率AI模型Sparc3D的3D生成工具。只需上传一张参考图像,即可即时生成行业领先品质的工作室级3D资产,极大降低了3D创作的门槛。这一突破性解决方案赋能游戏开发者、设计师和3D艺术家高效释放创意,加速从概念到部署的创作流程。
    Situation Monitor

    Situation Monitor

    Situation Monitor 是由开发者 Reggie James 创建的一个免费、开源的全球风险监测平台。它通过一张交互式地图,实时整合并可视化全球范围内的关键地缘政治与安全信息,帮助用户快速掌握潜在冲突热点和战略动态。
    查看完整榜单