SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    大语言模型

    共 254 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型世界模型
    排序
    发布更新浏览点赞
    Meta推出基于 Llama 3.1 Instruct的大语言模型KernelLLM:专注于使用 Triton 编写高效GPU内核的任务

    Meta推出基于 Llama 3.1 Instruct的大语言模型KernelLLM:专注于使用 Triton 编写高效GPU内核的任务

    Meta推出了一款名为 KernelLLM 的大语言模型,该模型基于 Llama 3.1 Instruct,专注于使用 Triton 编写高效GPU内核的任务。KernelLLM的核心目标是通过自动化...
    大语言模型# KernelLLM# Llama 3.1 Instruct# Meta
    9个月前
    01350
    Falcon-Edge:一系列强大、通用、可微调的1.58位语言模型

    Falcon-Edge:一系列强大、通用、可微调的1.58位语言模型

    Falcon 团队正式发布了 Falcon-Edge 系列模型——一组基于 BitNet 架构设计的三值格式语言模型。这些模型不仅具备高性能,还支持灵活的微调能力,为边缘设备上的高效部署提供了全新可能...
    大语言模型# BitNet# Falcon-Edge
    9个月前
    03450
    A-M-team推出32B密集语言模型AM-Thinking-v1:专注增强推理能力

    A-M-team推出32B密集语言模型AM-Thinking-v1:专注增强推理能力

    A-M-team推出了AM-Thinking-v1,一款基于Qwen 2.5-32B-Base构建的32B密集语言模型,专注于提升推理能力。在推理基准测试中,AM-Thinking-v1表现出色,可媲...
    大语言模型# AM-Thinking-v1# 推理模型
    9个月前
    04330
    基于 Qwen3 的混合专家(MoE)模型Arcana Qwen3 2.4B A0.6B

    基于 Qwen3 的混合专家(MoE)模型Arcana Qwen3 2.4B A0.6B

    Arcana Qwen3 2.4B A0.6B 是一个基于 Qwen3 的混合专家(MoE)模型,总参数量为 24 亿,每个专家模型拥有 6 亿参数。该模型旨在提供更高的准确性、更高的效率和更低的内存...
    大语言模型# Arcana Qwen3 2.4B A0.6B# MoE模型# Qwen3
    9个月前
    02440
    INTELLECT-2 发布:首个通过全球分布式强化学习训练的 32B 参数模型

    INTELLECT-2 发布:首个通过全球分布式强化学习训练的 32B 参数模型

    Prime Intellect发布 INTELLECT-2,这是首个通过全球分布式强化学习训练的 32B 参数模型。与传统的集中式训练不同,INTELLECT-2 使用完全异步的强化学习(RL),在一...
    大语言模型# INTELLECT-2# 强化学习
    9个月前
    02680
    无损压缩框架DFloat11:可将大语言模型的规模缩小约 30%,同时保持与原始模型完全一致的逐位相同输出

    无损压缩框架DFloat11:可将大语言模型的规模缩小约 30%,同时保持与原始模型完全一致的逐位相同输出

    DFloat11 是一个无损压缩框架,可将大语言模型(LLM)的规模缩小约 30%,同时保持与原始模型完全一致的逐位相同输出。它支持在资源受限的硬件上进行高效的 GPU 推理,且不牺牲准确性。 Git...
    大语言模型# DFloat11# 无损压缩框架
    9个月前
    03100
    字节跳动推出Seed-Coder:轻量级开源代码大模型,性能媲美更大规模模型

    字节跳动推出Seed-Coder:轻量级开源代码大模型,性能媲美更大规模模型

    字节跳动近日发布了全新的开源代码大语言模型(LLM)系列——Seed-Coder,标志着其在开源大语言模型生态系统中的首次重要贡献。这一系列模型以轻量化和高性能为核心特点,包括基础模型、指令模型和推理...
    大语言模型# Seed-Coder# 代码大模型# 字节跳动
    9个月前
    03450
    阿里通义实验室推出强化学习框架ZEROSEARCH:通过模拟搜索引擎来提升大语言模型的信息检索能力

    阿里通义实验室推出强化学习框架ZEROSEARCH:通过模拟搜索引擎来提升大语言模型的信息检索能力

    阿里通义实验室推出一种创新的强化学习框架ZEROSEARCH,通过模拟搜索引擎来提升大语言模型(LLMs)的信息检索能力,而无需与真实搜索引擎进行交互。该框架通过轻量级的监督微调(SFT),将 LLM...
    大语言模型# ZEROSEARCH# 强化学习框架
    9个月前
    02050
    艾伦AI研究所发布10 亿参数的小模型Olmo 2 1B

    艾伦AI研究所发布10 亿参数的小模型Olmo 2 1B

    艾伦AI研究所(AI2)于周四发布了 Olmo 2 1B,这是一个拥有 10 亿参数的 AI 模型。AI2 宣称,该模型在多项基准测试中击败了谷歌、Meta 和阿里巴巴的同规模模型。尽管参数数量相对较...
    大语言模型# Olmo 2 1B# 艾伦AI研究所
    9个月前
    02360
    思科发布专为网络安全打造的开源模型 Foundation-sec-8b

    思科发布专为网络安全打造的开源模型 Foundation-sec-8b

    思科宣布其在AI领域的重大进展——推出首个由全新成立的Foundation AI团队开发的大语言模型(LLM):Llama-3.1-FoundationAI-SecurityLLM-base-8B(简...
    大语言模型# Foundation-sec-8b# 思科
    9个月前
    05140
    深度研究代理WebThinker:为大型推理模型提供深度研究能力

    深度研究代理WebThinker:为大型推理模型提供深度研究能力

    中国人民大学、智源研究院和华为的研究人员推出一个深度研究代理WebThinker,旨在为大型推理模型(Large Reasoning Models, LRMs)提供深度研究能力。WebThinker ...
    大语言模型# WebThinker# 推理模型# 深度研究代理
    9个月前
    02160
    微软推出Phi-4系列推理模型:Phi-4-reasoning、Phi-4-reasoning-plus和Phi-4-mini-reasoning

    微软推出Phi-4系列推理模型:Phi-4-reasoning、Phi-4-reasoning-plus和Phi-4-mini-reasoning

    一年前,微软推出了Phi-3,开启了小型语言模型(SLM)的新篇章。这些模型以其高效性和灵活性迅速吸引了广泛关注。如今,在 Phi 系列发布一周年之际,微软再次突破技术边界,推出了三款全新推理模型:P...
    大语言模型# Phi-4-mini-reasoning# Phi-4-reasoning# Phi-4-reasoning-plus
    9个月前
    02130
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    QoderWork

    新QoderWork

    阿里发布旗下首个桌面Agent工具QoderWork,用户无需任何复杂部署工作,输入一句话,QoderWork就能按需调用授权的本地应用,完成文件整理、数据处理、文档生成等任务。
    OpenClaw(Clawdbot/Moltbot)

    OpenClaw(Clawdbot/Moltbot)

    Clawdbot 是一款可在您自己的设备上运行的个人 AI 助手。它在您已使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及扩展渠道(如 BlueBubbles、Matrix、Zalo 和 Zalo Personal)上为您提供应答。它可以在 macOS/iOS/Android 上进行语音交谈,并能渲染一个您可控制的实时画布。网关仅是控制平面——核心产品是助手本身。
    Situation Monitor

    Situation Monitor

    Situation Monitor 是由开发者 Reggie James 创建的一个免费、开源的全球风险监测平台。它通过一张交互式地图,实时整合并可视化全球范围内的关键地缘政治与安全信息,帮助用户快速掌握潜在冲突热点和战略动态。
    Skills.sh

    Skills.sh

    Vercel 近日上线了一个名为 skills.sh 的新站点,专门用于发现、浏览和安装 AI 智能体的“技能”(Skills)。
    中国科技云数据胶囊

    中国科技云数据胶囊

    中国科学院旗下的 中国科技云数据胶囊(Data Capsule)提供 20GB 免费存储空间,支持 标准 S3 与 WebDAV 协议,无需手机号绑定,支持微信/QQ/GitHub 第三方登录,非常适合注重隐私、追求开源生态兼容性的科研用户或个人知识管理者。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    查看完整榜单