SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    大语言模型

    共 285 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型世界模型
    排序
    发布更新浏览点赞
    浙大×华为联合推出 DeepSeek-R1-Safe:基于昇腾的安全大模型

    浙大×华为联合推出 DeepSeek-R1-Safe:基于昇腾的安全大模型

    浙江大学网络空间安全学院与华为合作,发布了一款基于 DeepSeek 模型架构 的安全增强型大语言模型 —— DeepSeek-R1-Safe。该模型依托华为昇腾(Ascend)AI 芯片及 Mind...
    大语言模型# DeepSeek-R1-Safe# 华为
    6个月前
    02880
    FastMTP:通过增强多令牌预测提升大模型推理效率

    FastMTP:通过增强多令牌预测提升大模型推理效率

    在大语言模型(LLM)的实际应用中,推理速度是影响用户体验和部署成本的关键因素。尽管模型能力不断提升,但逐个生成 token 的方式带来了较高的延迟和计算开销。推测解码(Speculative Dec...
    大语言模型# FastMTP# 推理模型
    6个月前
    01910
    蚂蚁集团开源 Ring-flash-2.0:高效 MoE 架构下的高性能思考模型

    蚂蚁集团开源 Ring-flash-2.0:高效 MoE 架构下的高性能思考模型

    蚂蚁集团正式宣布开源 Ring-flash-2.0 ——一款基于 MoE(混合专家)架构的高性能“思考型”大语言模型。该模型总参数量达 100B,但在每次推理时仅激活 6.1B 参数(其中非嵌入部分约...
    大语言模型# Ring-flash-2.0# 蚂蚁集团
    6个月前
    02880
    通义 DeepResearch:首个全开源 Web Agent,性能对标 OpenAI 深度研究模型

    通义 DeepResearch:首个全开源 Web Agent,性能对标 OpenAI 深度研究模型

    阿里通义实验室正式发布 Tongyi DeepResearch —— 一个在性能上可与当前最先进闭源系统相媲美的全开源 Web Agent。 项目主页:https://tongyi-agent.git...
    大语言模型# Tongyi DeepResearch# 深度研究模型
    6个月前
    03630
    MACHINELEARNINGLM:过持续预训练提升大语言模型在多示例上下文学习能力

    MACHINELEARNINGLM:过持续预训练提升大语言模型在多示例上下文学习能力

    中科院大学、华南理工大学、斯坦福大学的研究人员推出一种名为 MACHINELEARNINGLM 的新型框架,旨在通过持续预训练(continued pretraining)提升大语言模型(LLMs)在...
    大语言模型# MACHINELEARNINGLM
    6个月前
    01270
    华为开源盘古 Embedded-7B-V1.1:支持“快慢思考”的高效大模型

    华为开源盘古 Embedded-7B-V1.1:支持“快慢思考”的高效大模型

    华为正式开源新一代高效大语言模型 —— openPangu-Embedded-7B-V1.1。该模型是基于昇腾 NPU 从零训练的 7B 级别密集架构模型(不含词表 Embedding),在通用能力...
    大语言模型# openPangu-Embedded-7B-V1.1# 华为# 盘古
    6个月前
    03180
    让语言模型“集体进化”:Gensyn推出去中心化强化学习新算法 SAPO

    让语言模型“集体进化”:Gensyn推出去中心化强化学习新算法 SAPO

    在提升语言模型推理能力的道路上,传统方法往往依赖大量人工标注数据进行监督微调(SFT),或集中式强化学习系统完成后训练。然而,这类方式成本高昂、扩展困难,且对硬件资源要求严苛。 最近,AI初创公司 G...
    大语言模型# SAPO# 强化学习
    6个月前
    01100
    Meta 发布MobileLLM-R1 系列模型:专为数学、编程(Python/C++)和科学推理任务设计

    Meta 发布MobileLLM-R1 系列模型:专为数学、编程(Python/C++)和科学推理任务设计

    Meta 正式发布 MobileLLM-R1 系列模型,包含 140M、360M 和 950M 三款尺寸,专为数学、编程(Python/C++)和科学推理任务设计。它不是通用聊天模型,而是一个经过精细...
    大语言模型# Meta# MobileLLM-R1
    6个月前
    02820
    蚂蚁集团推出推理模型 Ring-mini-2.0

    蚂蚁集团推出推理模型 Ring-mini-2.0

    蚂蚁集团推出了一款紧凑而强大的推理模型 Ring-mini-2.0。该模型总参数量为 16B,但每个输入 token 仅激活 14 亿个参数(非嵌入参数部分为 7.89 亿)。尽管 Ring-mini...
    大语言模型# Ring-mini-2.0# 推理模型# 蚂蚁集团
    6个月前
    01310
    阿里Qwen团队发布Qwen3-Next-80B-A3B:用混合注意力 + 高稀疏MoE 实现极致性价比

    阿里Qwen团队发布Qwen3-Next-80B-A3B:用混合注意力 + 高稀疏MoE 实现极致性价比

    在大模型进入“长上下文”与“超大规模参数”竞争的新阶段,如何平衡性能、训练成本与推理效率,成为决定落地能力的关键。 为此,阿里通义千问(Qwen)项目组正式推出 Qwen3-Next ——一个全新设计...
    大语言模型# Qwen3-Next# Qwen3-Next-80B-A3B
    6个月前
    05320
    百度推出轻量级推理模型ERNIE-4.5-21B-A3B-Thinking:原生支持函数调用,可联网查天气、调数据库

    百度推出轻量级推理模型ERNIE-4.5-21B-A3B-Thinking:原生支持函数调用,可联网查天气、调数据库

    百度推出ERNIE-4.5-21B-A3B-Thinking,一款专为复杂推理任务优化的轻量级 MoE(Mixture of Experts)大模型。该模型在原有 ERNIE-4.5 基础上显著提升了...
    大语言模型# ERNIE-4.5-21B-A3B-Thinking# 百度
    6个月前
    01490
    SGP-Gen :用强化学习提升大模型生成 SVG 图像的能力

    SGP-Gen :用强化学习提升大模型生成 SVG 图像的能力

    由香港中文大学、西湖大学、上海人工智能实验室与马克斯·普朗克智能系统研究所联合开展的研究团队,近日推出 SGP-Gen ——一项探索大语言模型(LLM)在符号图形编程(Symbolic Graphic...
    大语言模型# SGP-Gen# SVG 图像
    6个月前
    02750
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    悟空

    新悟空

    阿里巴巴发布全球首个企业级AI原生工作平台——“悟空”,让每个团队、每家公司,都能拥有一支24h工作的“龙虾军团”。悟空是一款独立应用,即日起开启邀测,也将直接内置到超2000万企业组织的钉钉之中。
    ArkClaw

    ArkClaw

    字节旗下火山引擎正式上线 ArkClaw, 开箱即用的云上 SaaS 版 OpenClaw。无需任何复杂配置,打开网页即可使用 7×24 小时在线的 AI 助手。
    Joker of Academics(小丑学术期刊 )

    Joker of Academics(小丑学术期刊 )

    Joker 🤡 of Academics(小丑学术期刊 ) 是一本完全经过同行评审的开放获取期刊,致力于严肃研究非严肃的学术成果。我们发表敢于风趣的严谨研究、不知何故居然行得通的荒诞主义方法论,以及应用于可能并不需要它的领域的批判理论。
    QClaw

    QClaw

    腾讯推出QClaw ,这是基于 OpenClaw 进行深度产品化封装的“官方一键安装包”。它的目标非常明确:让强大的 AI Agent 能力,像安装普通软件一样简单,并直接融入中国人的国民级应用——微信和 QQ。
    Loomy

    新Loomy

    科大讯飞正式发布基于AstronClaw打造的桌面AI助理Loomy。Loomy面向本地办公场景,支持文件整理、内容创作、数据分析、网页操作、邮件处理等多步骤任务自动执行。
    查看完整榜单