SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    模型

    共 1136 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型世界模型
    排序
    发布更新浏览点赞
    清华团队提出3D场景生成新框架ScenePainter:解决3D生成中的语义漂移难题

    清华团队提出3D场景生成新框架ScenePainter:解决3D生成中的语义漂移难题

    从一张街景照片出发,AI能否自动“走”过整条街道,生成沿途连续、风格统一的3D视图?这不仅是虚拟现实、自动驾驶仿真的基础需求,也是生成式AI在空间理解上的重要挑战。 然而,当前主流方法在生成长序列3D...
    3D模型# 3D生成# ScenePainter
    7个月前
    03070
    新型歌曲生成模型JAM:让歌词精准变成完整歌曲

    新型歌曲生成模型JAM:让歌词精准变成完整歌曲

    你有没有想过,输入一段歌词,再标上每个词该在什么时候唱,就能自动生成一首旋律自然、节奏准确、风格统一的完整歌曲? 这不是未来设想,而是已经实现的技术突破。 新加坡科技设计大学(SUTD)与 Lambd...
    语音模型# JAM# 歌曲生成模型
    7个月前
    01260
    智谱AI正式推出 GLM 系列最新旗舰大模型GLM-4.5 系列:统一推理、编码与代理的全能旗舰模型

    智谱AI正式推出 GLM 系列最新旗舰大模型GLM-4.5 系列:统一推理、编码与代理的全能旗舰模型

    智谱AI正式推出 GLM-4.5 与 GLM-4.5-Air —— GLM 系列最新旗舰大模型。这两款模型专为代理(Agent)导向应用设计,首次在单一架构中深度融合了复杂推理、高效编码与多工具协同能...
    大语言模型# GLM-4.5# GLM-4.5-Air# 智谱AI
    7个月前
    03950
    阿里 WAN 项目组正式推出 Wan2.2:MoE 架构 + 高压缩设计,开源视频生成再进化

    阿里 WAN 项目组正式推出 Wan2.2:MoE 架构 + 高压缩设计,开源视频生成再进化

    阿里 WAN 项目组正式推出 Wan2.2,这是对 WAN 系列视频生成模型的一次重大升级。本次发布涵盖多个模型变体,全面支持文本到视频(T2V)、图像到视频(I2V)以及混合输入(TI2V)任务,在...
    视频模型# Wan2.2# 视频生成模型
    7个月前
    01,0560
    上海交通大学发布SmallThinker 系列模型:专为设备端部署设计的原生混合专家(MoE)语言模型

    上海交通大学发布SmallThinker 系列模型:专为设备端部署设计的原生混合专家(MoE)语言模型

    由上海交通大学 IPADS 实验室、人工智能学院与 Zenergize AI 联合研发的 SmallThinker 系列模型,是一组专为设备端部署设计的原生混合专家(MoE)语言模型。其核心目标是在资...
    大语言模型# SmallThinker# 上海交通大学
    7个月前
    03230
    中国科学院发布“磐石”操作系统与 S1-Base 科学大模型:开启“AI for Science”新范式

    中国科学院发布“磐石”操作系统与 S1-Base 科学大模型:开启“AI for Science”新范式

    在AI加速推动科学研究变革的背景下,中国科学院正式推出 “磐石”(ScienceOne) —— 一个面向前沿科学发现与技术创新的“AI+科学”操作系统。作为其核心引擎,磐石科学基础大模型(S1-Bas...
    大语言模型# 中国科学院# 磐石科学基础大模型
    7个月前
    03250
    上海AI实验室发布书生 Intern-S1:专为科研打造的多模态AI助手

    上海AI实验室发布书生 Intern-S1:专为科研打造的多模态AI助手

    上海AI实验室正式推出 Intern-S1 —— 一款具备强大科学理解能力的开源多模态推理模型。它不仅在通用任务上表现卓越,更在化学、生物、数学、物理等多个科学领域达到最先进的性能水平,部分指标甚至超...
    多模态模型# Intern-S1# 上海AI实验室# 书生
    6个月前
    03070
    Anzhc 开源系列 YOLO 模型:专注细粒度图像分割与分类任务

    Anzhc 开源系列 YOLO 模型:专注细粒度图像分割与分类任务

    在图像检测与分割领域,高质量的专用模型往往能显著提升下游任务的表现。开发者 Anzhc 基于自建标注数据集,训练并开源了一系列面向特定视觉任务的 YOLO 模型,涵盖面部、眼部、头部、胸部等细粒度目标...
    图像模型# YOLO 模型# 图像分割
    7个月前
    05190
    腾讯开源3D世界生成模型HunyuanWorld 1.0:从文本或图像生成可漫游、可交互的三维世界

    腾讯开源3D世界生成模型HunyuanWorld 1.0:从文本或图像生成可漫游、可交互的三维世界

    如何让一段文字或一张图片,自动生成一个可以自由探索、具备空间一致性且支持后续编辑的三维场景?这是计算机视觉与图形学长期追求的目标。 当前主流方法面临两难: 基于视频或多视角图像生成的方法,虽然能产出视...
    3D模型# 3D世界生成模型# HunyuanWorld 1.0# 腾讯
    7个月前
    01290
    阶跃星辰发布 Step 3:开源最强多模态推理模型,推动“模芯”生态共建

    阶跃星辰发布 Step 3:开源最强多模态推理模型,推动“模芯”生态共建

    在2025世界人工智能大会(WAIC)开幕前夕,中国大模型企业阶跃星辰于今日在上海正式发布其新一代基础大模型——Step 3。该模型定位为“推理时代最适合应用的基座模型”,将于7月31日面向全球开源...
    大语言模型# Step 3# 多模态推理模型# 阶跃星辰
    7个月前
    01390
    阿里Qwen团队发布 Qwen3-235B-A22B-Thinking-2507:深度推理能力再升级

    阿里Qwen团队发布 Qwen3-235B-A22B-Thinking-2507:深度推理能力再升级

    在持续三个月的优化后,阿里Qwen团队正式推出 Qwen3-235B-A22B-Thinking-2507 版本。该模型在逻辑推理、数学、科学、编程及学术任务上的表现显著提升,进一步巩固了其在开源思维...
    大语言模型# Qwen3-235B-A22B-Thinking-2507# 推理模型
    7个月前
    02760
    蚂蚁集团发布Ming-lite-omni v1.5:全模态能力的全面升级

    蚂蚁集团发布Ming-lite-omni v1.5:全模态能力的全面升级

    由 蚂蚁集团旗下的 百灵大模型(Ling)团队研发的全模态大模型 Ming-lite-omni v1.5 正式发布。作为对初代模型的全面升级,v1.5 版本在图像、文本、视频、语音等多种模态的理解与生...
    多模态模型# Ming-lite-omni v1.5# 蚂蚁集团
    7个月前
    03110
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Skills.sh

    Skills.sh

    Vercel 近日上线了一个名为 skills.sh 的新站点,专门用于发现、浏览和安装 AI 智能体的“技能”(Skills)。
    OpenClaw(Clawdbot/Moltbot)

    OpenClaw(Clawdbot/Moltbot)

    Clawdbot 是一款可在您自己的设备上运行的个人 AI 助手。它在您已使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及扩展渠道(如 BlueBubbles、Matrix、Zalo 和 Zalo Personal)上为您提供应答。它可以在 macOS/iOS/Android 上进行语音交谈,并能渲染一个您可控制的实时画布。网关仅是控制平面——核心产品是助手本身。
    YouMind

    YouMind

    YouMind 是一款重新构想的 AI 写作工具,帮助每个人轻松开启创作之旅。捕捉灵感、收集素材、撰写草稿,并将其转化为精炼的文章、播客、视频等丰富内容。
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    文心一言

    文心一言

    文心一言是百度开发的一款AI聊天机器人,通过自然语言处理提供对话交互、回答问题和生成内容。它基于百度的文心大语言模型,文心一言于2023年3月正式发布。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    查看完整榜单