SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    大语言模型

    共 272 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型世界模型
    排序
    发布更新浏览点赞
    月之暗面推出开源思维模型Kimi K2 Thinking,多项能力达SOTA水平

    月之暗面推出开源思维模型Kimi K2 Thinking,多项能力达SOTA水平

    月之暗面正式发布旗下迄今能力最强的开源思考模型——Kimi K2 Thinking。这款基于“模型即Agent”理念训练的新一代Thinking Agent,最核心的突破在于原生掌握“边思考,边使用工...
    大语言模型# Kimi K2 Thinking# 月之暗面
    4个月前
    0540
    DeepAgent:一种支持动态工具发现与记忆管理的通用推理代理

    DeepAgent:一种支持动态工具发现与记忆管理的通用推理代理

    中国人民大学与小红书联合推出 DeepAgent——一种端到端的深度推理代理框架。它能够在单一、连贯的推理过程中,自主完成思考、工具发现与行动执行,摆脱了传统代理(如 ReAct 框架)中“Reaso...
    大语言模型# DeepAgent
    4个月前
    01480
    Cognition 发布 SWE-1.5:950 tok/s 高速编码模型,Windsurf 现已可用

    Cognition 发布 SWE-1.5:950 tok/s 高速编码模型,Windsurf 现已可用

    Cognition 正式推出软件工程专用模型家族新成员——SWE-1.5。作为一款拥有数千亿参数的前沿规模模型,它不仅实现了接近当前最佳水平(SOTA)的编程性能,更在速度上打破现有标准:通过与 Ce...
    大语言模型# Cognition# SWE-1.5# 编程模型
    4个月前
    01570
    快手开源 KAT-Dev-72B-Exp:72B 参数代码模型,SWE-Bench 准确率达 74.6%

    快手开源 KAT-Dev-72B-Exp:72B 参数代码模型,SWE-Bench 准确率达 74.6%

    快手 Kwaipilot 团队近日正式开源 KAT-Dev-72B-Exp ——一个专为软件工程任务设计的 720 亿参数开源大模型。该模型在权威代码修复基准 SWE-Bench Verified 上...
    大语言模型# KAT-Dev-72B-Exp# 快手
    4个月前
    0510
    自动化学术推广系统AutoPR:让学术推广自动化,精准触达目标受众

    自动化学术推广系统AutoPR:让学术推广自动化,精准触达目标受众

    学术研究的价值不仅在于成果本身,更在于被广泛知晓与合理应用。如今,同行评审研究数量持续激增,学者们愈发依赖社交平台发现前沿成果,而作者们也需投入大量精力推广研究,以维持学术可见度与引用率。 项目主页...
    大语言模型# AutoPR
    4个月前
    0480
    Anthropic发布Claude Haiku 4.5:三分之一成本+两倍速度,编码性能追平Sonnet 4

    Anthropic发布Claude Haiku 4.5:三分之一成本+两倍速度,编码性能追平Sonnet 4

    Anthropic正式推出轻量级模型Claude Haiku的最新版本——Claude Haiku 4.5。这款模型的核心亮点的是,在保持与Claude Sonnet 4相当编码性能的同时,将成本压缩...
    大语言模型# Anthropic# Claude Haiku 4.5
    4个月前
    01270
    AI21 发布Jamba Reasoning 3B:30亿参数模型实现25万Token上下文,可在笔记本运行

    AI21 发布Jamba Reasoning 3B:30亿参数模型实现25万Token上下文,可在笔记本运行

    在小型语言模型(SLM)加速落地的趋势下,以色列AI公司 AI21 Labs 推出其最新力作——Jamba Reasoning 3B。 模型:https://huggingface.co/ai21la...
    大语言模型# AI21# Jamba Reasoning 3B
    4个月前
    01340
    三星研究员发布 TRM:700万参数小模型,在特定推理任务上超越大模型

    三星研究员发布 TRM:700万参数小模型,在特定推理任务上超越大模型

    一个仅含 700万参数 的神经网络,如何在性能上匹敌甚至超过参数量高达其 10,000倍 的大语言模型? 这不是理论设想,而是现实。 三星先进技术研究院(SAIT)蒙特利尔分部的高级AI研究员 Ale...
    大语言模型# TRM# 三星# 小模型
    4个月前
    01680
    蚂蚁集团发布万亿参数大模型 Ling-1T:开源最强非思考模型,推理效率超越 Gemini

    蚂蚁集团发布万亿参数大模型 Ling-1T:开源最强非思考模型,推理效率超越 Gemini

    蚂蚁集团百灵大模型团队正式推出其新一代通用语言模型——Ling-1T。作为“百灵”Ling 2.0 系列的首款旗舰级非思考(non-thinking)模型,Ling-1T 拥有 总计1万亿参数,单次推...
    大语言模型# Ling-1T# 蚂蚁集团
    4个月前
    04040
    Apriel-1.5-15B-Thinker:用中期训练提升多模态推理效率

    Apriel-1.5-15B-Thinker:用中期训练提升多模态推理效率

    在大模型竞赛普遍追求参数规模和算力投入的背景下,一个名为 Apriel-1.5-15B-Thinker 的新开源模型带来了不同的思路:它不依赖强化学习或偏好优化,也不从零训练,而是通过精心设计的中期训...
    大语言模型# Apriel-1.5-15B-Thinker
    4个月前
    01350
    IBM 发布 Granite 4.0:基于 Mamba-2/Transformer 混合架构的新一代高效开源大模型

    IBM 发布 Granite 4.0:基于 Mamba-2/Transformer 混合架构的新一代高效开源大模型

    IBM 正式推出其最新开源语言模型系列 Granite 4.0,标志着企业在追求高性能与低推理成本之间的平衡上迈出关键一步。 这一代模型不再依赖传统的纯 Transformer 架构,而是采用创新的 ...
    大语言模型# Granite 4.0# IBM
    5个月前
    0670
    新加坡国立大学等提出 SparseD:让扩散语言模型在长上下文场景高效运行的稀疏注意力新方案

    新加坡国立大学等提出 SparseD:让扩散语言模型在长上下文场景高效运行的稀疏注意力新方案

    扩散语言模型(Diffusion Language Models, DLMs)因其支持并行生成文本的能力,被视为自回归模型(AR)之外的一条重要技术路径。然而,其高昂的推理延迟严重制约了实际应用,尤其...
    大语言模型# SparseD# 稀疏注意力# 长上下文场景
    5个月前
    02140
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    OpenClaw

    OpenClaw

    OpenClaw 是一个个人 AI 助手,可在您自己的设备上运行。它通过您已经使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及 BlueBubbles、Matrix、Zalo 和 Zalo Personal 等扩展渠道与您交流。它可以在 macOS/iOS/Android 上说话和聆听,并能渲染一个您控制的实时画布。网关只是控制平面——产品本身才是助手。
    OpenClaw(Clawdbot/Moltbot)

    OpenClaw(Clawdbot/Moltbot)

    Clawdbot 是一款可在您自己的设备上运行的个人 AI 助手。它在您已使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及扩展渠道(如 BlueBubbles、Matrix、Zalo 和 Zalo Personal)上为您提供应答。它可以在 macOS/iOS/Android 上进行语音交谈,并能渲染一个您可控制的实时画布。网关仅是控制平面——核心产品是助手本身。
    A股智能分析系统

    A股智能分析系统

    A股智能分析系统是基于 AI 大模型的 A 股自选股智能分析系统,每日自动分析并推送「决策仪表盘」到企业微信/飞书/Telegram/邮箱
    3D Arena

    3D Arena

    Hugging Face 推出的 3D Arena 是生成式 3D 领域的一项重要进展。它首次实现了大规模、结构化的人类偏好数据收集,并通过 ELO 排名系统提供可靠、可解释的模型评估结果。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Fireplexity

    Fireplexity

    Fireplexity v2 是一个基于 Next.js 构建的 AI 驱动搜索引擎,结合了网络爬取、新闻聚合和图像搜索功能,并提供对话式 AI 响应。系统通过多个外部 API 处理用户查询,并通过类似聊天的界面以实时流式传输方式呈现结果。
    查看完整榜单