SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    大语言模型

    共 303 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型世界模型
    排序
    发布更新浏览点赞
    新型轨迹感知过程奖励模型(PRM) ReasonFlux-PRM:专门用于评估大型语言模型在长链推理中的轨迹-响应型推理痕迹

    新型轨迹感知过程奖励模型(PRM) ReasonFlux-PRM:专门用于评估大型语言模型在长链推理中的轨迹-响应型推理痕迹

    伊利诺伊大学厄巴纳-香槟分校、普林斯顿大学、康奈尔大学和字节跳动的研究人员推出新型轨迹感知过程奖励模型(PRM) ReasonFlux-PRM,专门用于评估大型语言模型(LLMs)在长链推理(Long...
    大语言模型# ReasonFlux-PRM# 轨迹感知过程奖励模型
    10个月前
    02500
    昆仑万维开源代码模型 Skywork-SWE-32B:用消费级显卡部署 AI 工程师的新可能

    昆仑万维开源代码模型 Skywork-SWE-32B:用消费级显卡部署 AI 工程师的新可能

    今天,昆仑万维正式宣布开源其最新推出的代码智能体 Skywork-SWE-32B,该模型专为软件工程(SWE)任务设计,在 SWE-bench Verified 基准测试中达到 38.0% 的 pas...
    大语言模型# Skywork-SWE-32B# 代码模型# 昆仑万维
    10个月前
    03650
    Mistral AI 发布 Mistral Small 3.2:小幅迭代,体验提升

    Mistral AI 发布 Mistral Small 3.2:小幅迭代,体验提升

    Mistral AI 推出了其中型模型系列的新版本——Mistral Small 3.2。这是对上一版 Mistral Small 3.1 的一次轻量级升级,在多个关键使用场景中带来了显著优化。 模型...
    大语言模型# Mistral AI# Mistral Small 3.2
    10个月前
    01330
    Jan-Nano:40亿参数的紧凑型研究专用语言模型正式上线

    Jan-Nano:40亿参数的紧凑型研究专用语言模型正式上线

    Menlo发布一款专为深度研究任务设计的小型语言模型 Jan-Nano 。该模型拥有 40亿参数规模,在保证轻量级部署的同时展现出强大的推理能力。此模型基于 Qwen3-4B 构建,并经过 DAPO ...
    大语言模型# Jan-Nano# 小型语言模型
    10个月前
    03720
    Multiverse:全球首个开源的非自回归并行推理框架,推理速度提升2倍

    Multiverse:全球首个开源的非自回归并行推理框架,推理速度提升2倍

    卡内基梅隆大学与英伟达联合推出了一项具有突破性的生成模型框架——Multiverse。这是全球首个开源的非自回归(Non-Autoregressive)并行推理框架,在保持与主流自回归模型(AR-LL...
    大语言模型# Multiverse# 推理框架
    10个月前
    02160
    MiniMax发布全球首款开源大规模混合注意力推理模型MiniMax-M1

    MiniMax发布全球首款开源大规模混合注意力推理模型MiniMax-M1

    近日,MiniMax 宣布推出全新大语言模型 MiniMax-M1,这是全球首款开源的大规模混合注意力推理模型,专为复杂任务和长上下文场景设计。 GitHub:https://github.com/M...
    大语言模型# MiniMax# MiniMax-M1
    10个月前
    02890
    月之暗面推出Kimi-Dev-72B:为软件工程任务打造的新一代开源编码大模型

    月之暗面推出Kimi-Dev-72B:为软件工程任务打造的新一代开源编码大模型

    月之暗面推出一款全新的开源编码大语言模型 Kimi-Dev-72B,专为软件工程任务设计。该模型基于 Qwen2.5-72B 微调而来,在 SWE-bench Verified 测试中取得了 60.4...
    大语言模型# Kimi-Dev-72B# 月之暗面
    10个月前
    03960
    微软与 OpenAI 支持,哈佛法学院发起:首个大规模公共 AI 图书数据集正式开源

    微软与 OpenAI 支持,哈佛法学院发起:首个大规模公共 AI 图书数据集正式开源

    上周,由微软与 OpenAI 联合资助、起源于哈佛大学法学院图书馆研究计划的 机构资料计划(Institutional Data Initiative,简称 IDI)宣布开源其首个大型 AI 数据集...
    大语言模型# OpenAI# 哈佛法学院# 微软
    10个月前
    02690
    Mistral发布首款推理模型Magistral,挑战Gemini 2.5 Pro与Claude Opus

    Mistral发布首款推理模型Magistral,挑战Gemini 2.5 Pro与Claude Opus

    法国AI实验室 Mistral AI 正式发布了其首个推理模型家族——Magistral,标志着这家以开源著称的AI公司正式进军高阶推理领域。 该系列包括两个版本: Magistral Small(2...
    大语言模型# Magistral# Mistral AI# 推理模型
    10个月前
    01520
    英伟达推出一款专为复杂推理任务设计的开源模型 — Nemotron-Research-Reasoning-Qwen-1.5B

    英伟达推出一款专为复杂推理任务设计的开源模型 — Nemotron-Research-Reasoning-Qwen-1.5B

    英伟达近日发布了一款专为复杂推理任务设计的开源模型 —— Nemotron-Research-Reasoning-Qwen-1.5B,该模型参数量为 1.5B,在数学、编程、科学问题和逻辑谜题等任务上...
    大语言模型# Nemotron-Research-Reasoning-Qwen-1.5B# 英伟达
    10个月前
    01350
    小红书 Hi Lab 发布 1420 亿参数 MoE 大模型 dots.llm1:推理仅激活 140 亿参数,性能媲美 Qwen2.5-72B

    小红书 Hi Lab 发布 1420 亿参数 MoE 大模型 dots.llm1:推理仅激活 140 亿参数,性能媲美 Qwen2.5-72B

    小红书 Hi Lab 团队近日正式开源了其自研大规模 MoE 文本大模型 dots.llm1,该模型总参数量高达 1420 亿(142B),但在每次推理时仅激活 140 亿(14B)参数,实现了高效能...
    大语言模型# dots.llm1# 小红书
    10个月前
    04020
    面壁智能发布 MiniCPM 4.0:端侧大模型效率再升级,极限提速 220 倍!

    面壁智能发布 MiniCPM 4.0:端侧大模型效率再升级,极限提速 220 倍!

    6 日晚,面壁智能正式发布了新一代高效端侧大语言模型 MiniCPM 4.0。该系列模型以极致轻量化和高效推理为核心目标,结合自研 CPM.cu 推理框架 和稀疏注意力机制,在端侧设备上实现了惊人的性...
    大语言模型# MiniCPM 4.0# 面壁智能
    10个月前
    04170
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    同事.skill

    同事.skill

    同事.skill 是一款创新工具。它不仅能提取离职同事的技术规范和工作经验,更能通过飞书消息、钉钉文档、微信聊天记录等“数字足迹”,还原其性格特质、沟通风格甚至“甩锅”技巧。
    Joker of Academics(小丑学术期刊 )

    Joker of Academics(小丑学术期刊 )

    Joker 🤡 of Academics(小丑学术期刊 ) 是一本完全经过同行评审的开放获取期刊,致力于严肃研究非严肃的学术成果。我们发表敢于风趣的严谨研究、不知何故居然行得通的荒诞主义方法论,以及应用于可能并不需要它的领域的批判理论。
    MaxClaw

    MaxClaw

    Minimax 正式宣布对其 AI 智能体平台进行重大升级,推出 探索专家(Expert) 2.0 与 MaxClaw 两大核心功能。此次更新不仅大幅降低了专业智能体的创建门槛,更通过云端化部署解决了 OpenClaw 长期存在的“落地难”问题,标志着 AI 智能体从“极客玩具”向“大众生产力工具”的跨越。
    Skills.sh

    Skills.sh

    Vercel 近日上线了一个名为 skills.sh 的新站点,专门用于发现、浏览和安装 AI 智能体的“技能”(Skills)。
    查看完整榜单