SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    大语言模型

    共 303 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型世界模型
    排序
    发布更新浏览点赞
    Reka AI发布推理模型Reka Flash 3.1 :强化学习驱动的高效推理模型升级

    Reka AI发布推理模型Reka Flash 3.1 :强化学习驱动的高效推理模型升级

    Reka AI 正式发布了其推理模型 Reka Flash 3.1,这是其 21 亿参数模型 Reka Flash 3 的重要升级版本。该模型在代码生成、智能体任务微调等方面表现尤为突出,并作为 Re...
    大语言模型# Reka AI# Reka Flash 3.1# 推理模型
    9个月前
    01820
    Kimina-Prover:首个实现人类级形式推理的大型定理证明模型

    Kimina-Prover:首个实现人类级形式推理的大型定理证明模型

    由 Numina 与 Kimi 团队联合开发的 Kimina-Prover-72B 正式发布。这是目前在 Lean 4 形式化语言中,首个能够以接近人类方式推理并自动构建数学定理证明的大型神经定理证明...
    大语言模型# Kimina-Prover# 大型定理证明模型
    9个月前
    03440
    Sarvam AI 发布 Sarvam-Translate:支持印度22种语言的文档级翻译模型

    Sarvam AI 发布 Sarvam-Translate:支持印度22种语言的文档级翻译模型

    Sarvam AI 推出了其最新翻译模型 Sarvam-Translate,一款专注于支持印度 22 种官方语言的高质量、上下文感知翻译系统。该模型基于 Google 的 Gemma3-4B-IT 进...
    大语言模型# Sarvam AI# Sarvam-Translate# 翻译模型
    9个月前
    01630
    微软推出 Phi 模型家族的最新成员 — Phi-4-mini-flash-reasoning

    微软推出 Phi 模型家族的最新成员 — Phi-4-mini-flash-reasoning

    微软今天宣布推出 Phi 模型家族的最新成员 —— Phi-4-mini-flash-reasoning。这款模型专为计算、内存和延迟受限的场景设计,为边缘设备、移动应用等资源受限环境提供高效的推理能...
    大语言模型# Phi-4-mini-flash-reasoning# 微软
    9个月前
    01120
    T5Gemma:谷歌推出全新编码器-解码器 Gemma 模型系列

    T5Gemma:谷歌推出全新编码器-解码器 Gemma 模型系列

    在当前大语言模型(LLM)领域中,解码器独占架构凭借其强大的生成能力成为主流。然而,经典的编码器-解码器架构——如 T5(文本到文本转换变换器)——因其出色的推理效率、灵活的设计以及对输入语义的深度理...
    大语言模型# T5Gemma# 解码器# 谷歌
    9个月前
    05370
    字节跳动 & 南大联合推出 CriticLean 框架:让 AI 更准确地翻译数学为代码

    字节跳动 & 南大联合推出 CriticLean 框架:让 AI 更准确地翻译数学为代码

    将自然语言数学语句自动转化为形式化代码(如 Lean 4)是计算数学中的核心挑战之一。尽管已有许多自动化工具尝试解决这一问题,但其准确性仍面临瓶颈,尤其是在需要深入理解语义的复杂场景中。 为此,字节跳...
    大语言模型# CriticLean# 字节跳动
    9个月前
    02030
    微软推出 NextCoder:基于 Qwen2.5-Coder 的高效代码编辑模型

    微软推出 NextCoder:基于 Qwen2.5-Coder 的高效代码编辑模型

    近年来,软件开发中的代码编辑需求日益增长,尤其是在维护和重构已有项目时。然而,现有的大语言模型在面对多样化的代码修改任务时,往往表现不佳。为了解决这一问题,微软联合相关研究团队提出了一套全新的方法,并...
    大语言模型# NextCoder# Qwen2.5-Coder# 代码编辑模型
    9个月前
    02620
    Hugging Face发布SmolLM3:3B 级全能小模型,支持推理/非推理双模式与 128k 上下文

    Hugging Face发布SmolLM3:3B 级全能小模型,支持推理/非推理双模式与 128k 上下文

    随着边缘计算和本地部署需求的增长,小型语言模型(Small Language Model, SLM) 正在成为新一代 AI 应用的关键组成部分。近日,Hugging Face 推出了其最新力作 —— ...
    大语言模型# Hugging Face# SmolLM3# 小模型
    9个月前
    01040
    Katanemo Labs发布1.5B 路由模型Arch-Router-1.5B:实现 93% 准确率,无需昂贵微调

    Katanemo Labs发布1.5B 路由模型Arch-Router-1.5B:实现 93% 准确率,无需昂贵微调

    在 LLM(大语言模型)应用场景日益复杂的背景下,如何将用户查询智能路由到最合适的模型,成为提升效率和体验的关键挑战。 近日,Katanemo Labs 推出了一个创新的解决方案 —— Arch-Ro...
    大语言模型# Arch-Router-1.5B# 路由模型
    9个月前
    01880
    阿里通义实验室开源 WebSailor,登顶 BrowseComp 榜单的网络智能体

    阿里通义实验室开源 WebSailor,登顶 BrowseComp 榜单的网络智能体

    近日,阿里云通义实验室正式开源了一款名为 WebSailor 的新型网络智能体(Web Agent),它具备强大的多步推理与信息检索能力,在高难度网页导航任务中表现出色。 GitHub:https...
    大语言模型# WebSailor# 网络智能体# 阿里通义实验室
    9个月前
    03090
    MemOS:为大语言模型设计的长期记忆操作系统

    MemOS:为大语言模型设计的长期记忆操作系统

    MemOS 是由记忆张量科技联合上海交通大学、同济大学、浙江大学、北京大学等多所高校及研究机构联合开源的一项突破性研究成果——专为大语言模型(LLMs)设计的长期记忆操作系统。 项目主页:https...
    大语言模型# MemOS# 大语言模型
    9个月前
    05810
    华为正式开源盘古大模型与昇腾推理技术

    华为正式开源盘古大模型与昇腾推理技术

    周一,华为宣布一项重大举措:开源其盘古70亿参数(7B)密集模型和720亿参数(72B)Pro MoE混合专家模型,以及基于昇腾平台的高效推理技术。 这一动作被视为华为持续推进大型AI模型研究与产业应...
    大语言模型# 华为# 盘古大模型
    9个月前
    02020
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    同事.skill

    同事.skill

    同事.skill 是一款创新工具。它不仅能提取离职同事的技术规范和工作经验,更能通过飞书消息、钉钉文档、微信聊天记录等“数字足迹”,还原其性格特质、沟通风格甚至“甩锅”技巧。
    Joker of Academics(小丑学术期刊 )

    Joker of Academics(小丑学术期刊 )

    Joker 🤡 of Academics(小丑学术期刊 ) 是一本完全经过同行评审的开放获取期刊,致力于严肃研究非严肃的学术成果。我们发表敢于风趣的严谨研究、不知何故居然行得通的荒诞主义方法论,以及应用于可能并不需要它的领域的批判理论。
    MaxClaw

    MaxClaw

    Minimax 正式宣布对其 AI 智能体平台进行重大升级,推出 探索专家(Expert) 2.0 与 MaxClaw 两大核心功能。此次更新不仅大幅降低了专业智能体的创建门槛,更通过云端化部署解决了 OpenClaw 长期存在的“落地难”问题,标志着 AI 智能体从“极客玩具”向“大众生产力工具”的跨越。
    Claude Managed Agents

    新Claude Managed Agents

    Claude Managed Agents是一组可用于大规模构建和部署智能体程序的API。它预先配置好了所需的各项功能:原生MCP接口、各种工具集成方案、内存资源等。无论您是要创建单任务处理程序,还是构建复杂的多智能体系统,都能轻松实现快速开发与部署。
    查看完整榜单