SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    模型

    共 1136 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型世界模型
    排序
    发布更新浏览点赞
    OpenAI 开源安全推理模型gpt-oss-safeguard:自定义策略+可解释推理,多策略准确率超越 GPT-5-thinking

    OpenAI 开源安全推理模型gpt-oss-safeguard:自定义策略+可解释推理,多策略准确率超越 GPT-5-thinking

    在AI内容安全领域,传统分类器“依赖标注样本、策略更新繁琐”的痛点长期困扰开发者。OpenAI 正式发布 gpt-oss-safeguard 研究预览版——一款开源权重的安全推理模型,以“自定义策略...
    大语言模型# gpt-oss-safeguard# OpenAI
    3个月前
    0150
    谷歌 DeepMind 发布 SIMA 2:AI智能体首次在虚拟世界中“自我改进”

    谷歌 DeepMind 发布 SIMA 2:AI智能体首次在虚拟世界中“自我改进”

    谷歌DeepMind发布通用AI智能体下一代产品SIMA 2的研究预览,通过深度整合大语言模型Gemini的语言与推理能力,实现从“单纯遵循指令”到“理解环境并互动”的核心突破。这款由Gemini 2...
    多模态模型# SIMA 2# 谷歌 DeepMind
    3个月前
    0370
    OpenAI 发布 GPT-5.1:8 种个性语调可选,Instant 更温暖、Thinking 更智能

    OpenAI 发布 GPT-5.1:8 种个性语调可选,Instant 更温暖、Thinking 更智能

    继8月GPT-5发布引发争议后,OpenAI今日正式推出旗舰模型更新版——GPT-5.1,通过双模型优化、8种个性语调预设、自适应推理等核心升级,旨在解决前代模型“体验平平”“缺乏个性化”的问题,让C...
    大语言模型# GPT-5.1# OpenAI
    3个月前
    01390
    百度开源ERNIE-4.5-VL-28B-A3B-Thinking:3B活跃参数实现大型模型级多模态推理

    百度开源ERNIE-4.5-VL-28B-A3B-Thinking:3B活跃参数实现大型模型级多模态推理

    百度正式开源 ERNIE-4.5-VL-28B-A3B-Thinking,一款专注于文档、图表与视频理解的多模态推理模型。尽管模型总参数达 约 30B,但通过稀疏激活机制,每次推理仅激活 3B 参数...
    多模态模型# ERNIE-4.5-VL-28B-A3B-Thinking# 多模态推理# 百度
    3个月前
    0340
    Maya1:开源 3B 语音模型,支持自然语言控制与情感标签的文本到语音生成

    Maya1:开源 3B 语音模型,支持自然语言控制与情感标签的文本到语音生成

    Maya Research 近期发布了一款突破性的开源文本到语音(TTS)模型——Maya1。这款仅3B参数的模型,不仅能将文本与自然语言描述转化为富有情感的24kHz高质量语音,还支持单GPU实时运...
    语音模型# Maya1# 语音模型
    3个月前
    0680
    Meta 开源 Omnilingual ASR:支持 1600+ 语言的语音识别系统

    Meta 开源 Omnilingual ASR:支持 1600+ 语言的语音识别系统

    Meta AI 近日发布了 Omnilingual ASR——一套开源、可扩展的多语言自动语音识别(ASR)系统,支持 1600 多种语言,并能通过零样本上下文学习泛化到 超过 5400 种语言,包括...
    语音模型# Meta# Omnilingual ASR# 语音识别
    3个月前
    0810
    商汤开源SenseNova-SI:面向空间智能的多模态模型

    商汤开源SenseNova-SI:面向空间智能的多模态模型

    当前主流多模态基础模型在文本、图像理解、推理和生成任务上已取得显著进展,但在空间智能(Spatial Intelligence)方面仍存在系统性短板。具体表现为: 对物体尺度、距离、比例的估计不准确 ...
    多模态模型# SenseNova-SI# 商汤# 空间智能
    3个月前
    01230
    阿里巴巴推出 SmartResume:一个能“读懂”复杂简历版式的智能解析系统

    阿里巴巴推出 SmartResume:一个能“读懂”复杂简历版式的智能解析系统

    在企业招聘中,自动化处理海量简历是刚需,但简历格式千奇百怪——多栏排版、图文混排、表格嵌套,传统文本提取工具常会打乱语义顺序,导致关键信息错位。 针对这一难题,阿里巴巴企业智能团队发布了 SmartR...
    多模态模型# SmartResume# 智能简历解析# 阿里巴巴
    3个月前
    01630
    阶跃星辰开源 Step-Audio-EditX:首个基于 LLM 的迭代式音频编辑模型

    阶跃星辰开源 Step-Audio-EditX:首个基于 LLM 的迭代式音频编辑模型

    阶跃星辰(Step AI)正式发布 Step-Audio-EditX —— 一款革命性的基于大语言模型(LLM)的音频编辑系统,首次实现对语音情感、说话风格与副语言特征的高精度、迭代式、零样本控制,并...
    语音模型# Step-Audio-EditX# 阶跃星辰# 音频编辑模型
    3个月前
    01530
    美团 LongCat 团队发布 LongCat-Video:高效长视频生成的开源新标杆

    美团 LongCat 团队发布 LongCat-Video:高效长视频生成的开源新标杆

    美团LongCat团队推出 LongCat-Video,这是一个基础视频生成模型,拥有 13.6B 参数,在文本到视频、图像到视频以及视频续接生成任务中表现出色。它特别擅长高效且高质量的长视频生成,标...
    视频模型# LongCat# LongCat-Video# 美团
    3个月前
    0290
    蚂蚁集团发布 Ling 2.0:基于“推理优先”原则的稀疏大模型家族

    蚂蚁集团发布 Ling 2.0:基于“推理优先”原则的稀疏大模型家族

    蚂蚁集团 百灵大模型团队近日发布 Ling 2.0 —— 一个系统性构建的 稀疏混合专家(MoE)语言模型系列,核心理念是:模型容量可无限扩展,但每个 token 的计算成本应保持恒定。该系列通过统一...
    大语言模型# Ling 2.0# 蚂蚁集团
    3个月前
    0440
    MiniMax 发布 MiniMax M2:面向编码与代理的高性能开源 MoE 模型

    MiniMax 发布 MiniMax M2:面向编码与代理的高性能开源 MoE 模型

    MiniMax 团队正式发布 MiniMax M2 —— 一款专为代码生成与 AI 代理工作流优化的混合专家(Mixture-of-Experts, MoE)模型。该模型以 MIT 开源许可 在 Hu...
    大语言模型# MiniMax M2
    3个月前
    0360
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    YouMind

    YouMind

    YouMind 是一款重新构想的 AI 写作工具,帮助每个人轻松开启创作之旅。捕捉灵感、收集素材、撰写草稿,并将其转化为精炼的文章、播客、视频等丰富内容。
    A股智能分析系统

    A股智能分析系统

    A股智能分析系统是基于 AI 大模型的 A 股自选股智能分析系统,每日自动分析并推送「决策仪表盘」到企业微信/飞书/Telegram/邮箱
    OpenClaw(Clawdbot/Moltbot)

    OpenClaw(Clawdbot/Moltbot)

    Clawdbot 是一款可在您自己的设备上运行的个人 AI 助手。它在您已使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及扩展渠道(如 BlueBubbles、Matrix、Zalo 和 Zalo Personal)上为您提供应答。它可以在 macOS/iOS/Android 上进行语音交谈,并能渲染一个您可控制的实时画布。网关仅是控制平面——核心产品是助手本身。
    OpenClaw

    OpenClaw

    OpenClaw 是一个个人 AI 助手,可在您自己的设备上运行。它通过您已经使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及 BlueBubbles、Matrix、Zalo 和 Zalo Personal 等扩展渠道与您交流。它可以在 macOS/iOS/Android 上说话和聆听,并能渲染一个您控制的实时画布。网关只是控制平面——产品本身才是助手。
    OpenCloud

    OpenCloud

    OpenCloud 是海因莱因集团的文件共享与协作解决方案。通过智能文件管理和强大的开源社区,文件将转变为宝贵的资源,被有效地组织和长期使用。借助灵活的数据空间和智能权限管理,团队可以随时随地无障碍地访问数据并协同工作,从而大幅提升生产力。
    OpenClaw汉化发行版

    OpenClaw汉化发行版

    OpenClaw汉化发行版已上线——不仅将CLI命令行、Dashboard网页控制台全部深度汉化,还能每小时自动同步OpenClaw官方更新,汉化版延迟低于1小时,既保留原版全部功能,又适配国内用户的使用习惯,3步即可完成安装部署,零基础也能快速上手。
    查看完整榜单