SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    大语言模型

    共 272 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型世界模型
    排序
    发布更新浏览点赞
    FastMTP:通过增强多令牌预测提升大模型推理效率

    FastMTP:通过增强多令牌预测提升大模型推理效率

    在大语言模型(LLM)的实际应用中,推理速度是影响用户体验和部署成本的关键因素。尽管模型能力不断提升,但逐个生成 token 的方式带来了较高的延迟和计算开销。推测解码(Speculative Dec...
    大语言模型# FastMTP# 推理模型
    5个月前
    01700
    蚂蚁集团开源 Ring-flash-2.0:高效 MoE 架构下的高性能思考模型

    蚂蚁集团开源 Ring-flash-2.0:高效 MoE 架构下的高性能思考模型

    蚂蚁集团正式宣布开源 Ring-flash-2.0 ——一款基于 MoE(混合专家)架构的高性能“思考型”大语言模型。该模型总参数量达 100B,但在每次推理时仅激活 6.1B 参数(其中非嵌入部分约...
    大语言模型# Ring-flash-2.0# 蚂蚁集团
    5个月前
    02710
    通义 DeepResearch:首个全开源 Web Agent,性能对标 OpenAI 深度研究模型

    通义 DeepResearch:首个全开源 Web Agent,性能对标 OpenAI 深度研究模型

    阿里通义实验室正式发布 Tongyi DeepResearch —— 一个在性能上可与当前最先进闭源系统相媲美的全开源 Web Agent。 项目主页:https://tongyi-agent.git...
    大语言模型# Tongyi DeepResearch# 深度研究模型
    5个月前
    03330
    MACHINELEARNINGLM:过持续预训练提升大语言模型在多示例上下文学习能力

    MACHINELEARNINGLM:过持续预训练提升大语言模型在多示例上下文学习能力

    中科院大学、华南理工大学、斯坦福大学的研究人员推出一种名为 MACHINELEARNINGLM 的新型框架,旨在通过持续预训练(continued pretraining)提升大语言模型(LLMs)在...
    大语言模型# MACHINELEARNINGLM
    5个月前
    01210
    华为开源盘古 Embedded-7B-V1.1:支持“快慢思考”的高效大模型

    华为开源盘古 Embedded-7B-V1.1:支持“快慢思考”的高效大模型

    华为正式开源新一代高效大语言模型 —— openPangu-Embedded-7B-V1.1。该模型是基于昇腾 NPU 从零训练的 7B 级别密集架构模型(不含词表 Embedding),在通用能力...
    大语言模型# openPangu-Embedded-7B-V1.1# 华为# 盘古
    5个月前
    03060
    让语言模型“集体进化”:Gensyn推出去中心化强化学习新算法 SAPO

    让语言模型“集体进化”:Gensyn推出去中心化强化学习新算法 SAPO

    在提升语言模型推理能力的道路上,传统方法往往依赖大量人工标注数据进行监督微调(SFT),或集中式强化学习系统完成后训练。然而,这类方式成本高昂、扩展困难,且对硬件资源要求严苛。 最近,AI初创公司 G...
    大语言模型# SAPO# 强化学习
    5个月前
    01090
    Meta 发布MobileLLM-R1 系列模型:专为数学、编程(Python/C++)和科学推理任务设计

    Meta 发布MobileLLM-R1 系列模型:专为数学、编程(Python/C++)和科学推理任务设计

    Meta 正式发布 MobileLLM-R1 系列模型,包含 140M、360M 和 950M 三款尺寸,专为数学、编程(Python/C++)和科学推理任务设计。它不是通用聊天模型,而是一个经过精细...
    大语言模型# Meta# MobileLLM-R1
    5个月前
    02670
    蚂蚁集团推出推理模型 Ring-mini-2.0

    蚂蚁集团推出推理模型 Ring-mini-2.0

    蚂蚁集团推出了一款紧凑而强大的推理模型 Ring-mini-2.0。该模型总参数量为 16B,但每个输入 token 仅激活 14 亿个参数(非嵌入参数部分为 7.89 亿)。尽管 Ring-mini...
    大语言模型# Ring-mini-2.0# 推理模型# 蚂蚁集团
    5个月前
    01200
    阿里Qwen团队发布Qwen3-Next-80B-A3B:用混合注意力 + 高稀疏MoE 实现极致性价比

    阿里Qwen团队发布Qwen3-Next-80B-A3B:用混合注意力 + 高稀疏MoE 实现极致性价比

    在大模型进入“长上下文”与“超大规模参数”竞争的新阶段,如何平衡性能、训练成本与推理效率,成为决定落地能力的关键。 为此,阿里通义千问(Qwen)项目组正式推出 Qwen3-Next ——一个全新设计...
    大语言模型# Qwen3-Next# Qwen3-Next-80B-A3B
    5个月前
    04970
    百度推出轻量级推理模型ERNIE-4.5-21B-A3B-Thinking:原生支持函数调用,可联网查天气、调数据库

    百度推出轻量级推理模型ERNIE-4.5-21B-A3B-Thinking:原生支持函数调用,可联网查天气、调数据库

    百度推出ERNIE-4.5-21B-A3B-Thinking,一款专为复杂推理任务优化的轻量级 MoE(Mixture of Experts)大模型。该模型在原有 ERNIE-4.5 基础上显著提升了...
    大语言模型# ERNIE-4.5-21B-A3B-Thinking# 百度
    5个月前
    01430
    SGP-Gen :用强化学习提升大模型生成 SVG 图像的能力

    SGP-Gen :用强化学习提升大模型生成 SVG 图像的能力

    由香港中文大学、西湖大学、上海人工智能实验室与马克斯·普朗克智能系统研究所联合开展的研究团队,近日推出 SGP-Gen ——一项探索大语言模型(LLM)在符号图形编程(Symbolic Graphic...
    大语言模型# SGP-Gen# SVG 图像
    5个月前
    02420
    阿里通义千问上线 Qwen-3-Max-Preview:当前系列最强语言模型

    阿里通义千问上线 Qwen-3-Max-Preview:当前系列最强语言模型

    阿里Qwen项目组近日在官网及 OpenRouter 平台正式推出 Qwen-3-Max-Preview,并将其定义为通义千问系列中当前最强大的语言模型。 该模型基于 Qwen3 架构进一步优化,在推...
    大语言模型# Qwen-3-Max-Preview# 阿里
    6个月前
    0820
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    OpenClaw

    OpenClaw

    OpenClaw 是一个个人 AI 助手,可在您自己的设备上运行。它通过您已经使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及 BlueBubbles、Matrix、Zalo 和 Zalo Personal 等扩展渠道与您交流。它可以在 macOS/iOS/Android 上说话和聆听,并能渲染一个您控制的实时画布。网关只是控制平面——产品本身才是助手。
    A股智能分析系统

    A股智能分析系统

    A股智能分析系统是基于 AI 大模型的 A 股自选股智能分析系统,每日自动分析并推送「决策仪表盘」到企业微信/飞书/Telegram/邮箱
    OpenClaw(Clawdbot/Moltbot)

    OpenClaw(Clawdbot/Moltbot)

    Clawdbot 是一款可在您自己的设备上运行的个人 AI 助手。它在您已使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及扩展渠道(如 BlueBubbles、Matrix、Zalo 和 Zalo Personal)上为您提供应答。它可以在 macOS/iOS/Android 上进行语音交谈,并能渲染一个您可控制的实时画布。网关仅是控制平面——核心产品是助手本身。
    Skills.sh

    Skills.sh

    Vercel 近日上线了一个名为 skills.sh 的新站点,专门用于发现、浏览和安装 AI 智能体的“技能”(Skills)。
    OpenClaw 一键部署工具

    OpenClaw 一键部署工具

    OpenClaw 一键部署工具是一款专为 AI 爱好者和开发者打造的私人 AI 助手一键部署工具,支持多模型、多消息渠道接入,提供图形界面与命令行两种部署方式,无需复杂的手动配置,就能快速搭建属于自己的跨平台 AI 助手,兼具灵活性与实用性。
    MimiClaw

    MimiClaw

    MimiClaw 把一块小小的 ESP32-S3 开发板变成你的私人 AI 助理。插上 USB 供电,连上 WiFi,通过 Telegram 跟它对话 — 它能处理你丢给它的任何任务,还会随时间积累本地记忆不断进化 — 全部跑在一颗拇指大小的芯片上。
    查看完整榜单