SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    推理模型

    共 27 篇文章
    排序
    发布更新浏览点赞
    Mistral发布首款推理模型Magistral,挑战Gemini 2.5 Pro与Claude Opus

    Mistral发布首款推理模型Magistral,挑战Gemini 2.5 Pro与Claude Opus

    法国AI实验室 Mistral AI 正式发布了其首个推理模型家族——Magistral,标志着这家以开源著称的AI公司正式进军高阶推理领域。 该系列包括两个版本: Magistral Small(2...
    大语言模型# Magistral# Mistral AI# 推理模型
    10个月前
    01500
    Homunculus-12B:在消费级显卡上运行的高效推理模型

    Homunculus-12B:在消费级显卡上运行的高效推理模型

    随着大语言模型不断向轻量化和高性能方向演进,Arcee Homunculus-12B 成为一个值得关注的新成员。它是一款基于 Qwen3-235B 蒸馏而来、部署在 Mistral-Nemo 架构上的...
    大语言模型# Homunculus-12B# 推理模型
    10个月前
    03200
    2025 年第一季度 AI 领域六大趋势:推理模型主导智能飞跃,中国AI加速崛起

    2025 年第一季度 AI 领域六大趋势:推理模型主导智能飞跃,中国AI加速崛起

    近日,专注于 AI 模型与提供商分析的机构 Artificial Analysis 发布了《Artificial Analysis State of AI Q1 2025 Highlights Rep...
    早报# AI# 推理模型
    10个月前
    02250
    A-M-team推出32B密集语言模型AM-Thinking-v1:专注增强推理能力

    A-M-team推出32B密集语言模型AM-Thinking-v1:专注增强推理能力

    A-M-team推出了AM-Thinking-v1,一款基于Qwen 2.5-32B-Base构建的32B密集语言模型,专注于提升推理能力。在推理基准测试中,AM-Thinking-v1表现出色,可媲...
    大语言模型# AM-Thinking-v1# 推理模型
    11个月前
    05030
    深度研究代理WebThinker:为大型推理模型提供深度研究能力

    深度研究代理WebThinker:为大型推理模型提供深度研究能力

    中国人民大学、智源研究院和华为的研究人员推出一个深度研究代理WebThinker,旨在为大型推理模型(Large Reasoning Models, LRMs)提供深度研究能力。WebThinker ...
    大语言模型# WebThinker# 推理模型# 深度研究代理
    11个月前
    02380
    南加州大学推出一系列紧凑型推理模型Tina:利用LoRA技术实现低成本强化学习

    南加州大学推出一系列紧凑型推理模型Tina:利用LoRA技术实现低成本强化学习

    在语言模型(LLM)领域,尽管通用任务性能取得了显著进展,但实现强大的多步推理能力仍然是一个重大挑战。这种能力对于复杂问题解决场景(如科学研究和战略规划)至关重要。然而,传统方法如监督微调(SFT)虽...
    大语言模型# Tina# v# 推理模型
    11个月前
    03860
    MAI-DS-R1:微软团队基于DeepSeek-R1 推理模型进行后训练的版本

    MAI-DS-R1:微软团队基于DeepSeek-R1 推理模型进行后训练的版本

    MAI-DS-R1 是一个由微软 AI 团队对 DeepSeek-R1 推理模型进行后训练的版本,提升其对受限话题的响应能力并改善其风险状况,同时保持推理能力和竞争力。简单来说就是把欧美的偏见加进去...
    大语言模型# DeepSeek-R1# MAI-DS-R1# 微软
    12个月前
    03280
    OpenAI 推出o3 和 o4-mini:迄今最智能、最强大的模型,具备全面工具访问能力

    OpenAI 推出o3 和 o4-mini:迄今最智能、最强大的模型,具备全面工具访问能力

    今天,OpenAI发布 OpenAI o3 和 o4-mini,这是OpenAI o 系列模型的最新版本,经过训练能在回答前进行更长时间的思考。这些是OpenAI迄今发布的最智能模型,显著提升了 Ch...
    大语言模型# o3# o4-mini# OpenAI
    12个月前
    05750
    Tessa-T1:专为 React 前端开发打造的推理模型

    Tessa-T1:专为 React 前端开发打造的推理模型

    在前端开发领域,React 一直是构建现代 Web 应用的核心框架之一。然而,随着项目复杂度的增加,手动编写和优化 React 组件变得越来越耗时且容易出错。为了提升开发效率并简化前端工作流程,Tes...
    大语言模型# Qwen2.5-Coder# Tessa-T1# 推理模型
    1年前
    02630
    谷歌发布了新推理模型Gemini 2.5系列:其特色在于回答问题前会进行“思考”过程

    谷歌发布了新推理模型Gemini 2.5系列:其特色在于回答问题前会进行“思考”过程

    本周二(2025年3月25日),谷歌发布了新推理模型Gemini 2.5系列,其特色在于回答问题前会进行“思考”过程。为了启动这一系列,谷歌推出了Gemini 2.5 Pro Experimental...
    大语言模型# Gemini 2.5# 思考模型# 推理模型
    1年前
    01980
    LG开源推理模型EXAONE Deep,在数学与编程方面表现出色

    LG开源推理模型EXAONE Deep,在数学与编程方面表现出色

    LG AI Research正式开源了其最新研发的AI推理模型——EXAONE Deep。这款模型分为2.4B、7.8B和32B三个版本,在多个关键领域展现出卓越性能。据官方称,EXAONE Deep...
    大语言模型# EXAONE Deep# LG# 推理模型
    1年前
    02100
    卡内基梅隆大学推出 L1-1.5B:用强化学习优化 AI 推理过程,精准控制“思考”时长

    卡内基梅隆大学推出 L1-1.5B:用强化学习优化 AI 推理过程,精准控制“思考”时长

    推理语言模型通过生成更长的思维链序列来提升性能,但目前无法控制推理长度,导致计算资源分配低效。模型可能生成过长输出浪费资源,或过早停止导致性能不佳。传统方法(如使用“等待”或“最终答案”标记)会降低性...
    大语言模型# L1-1.5B# 卡内基梅隆大学# 推理模型
    1年前
    03010
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    OpenMAIC

    OpenMAIC

    OpenMAIC是一个开源的 AI 互动课堂平台,能够将任何主题或文档转化为丰富的互动学习体验。基于多智能体协作引擎,它可以自动生成演示幻灯片、测验、交互式模拟实验和项目制学习活动——由 AI 教师和 AI 同学进行语音讲解、白板绘图,并与你展开实时讨论。内置 OpenClaw 集成,你还可以直接在飞书、Slack、Telegram 等聊天应用中生成课堂。
    Alaya Code

    Alaya Code

    九章云极正式推出AI编码平台Alaya Code,为企业及开发者提供一站式AI编程与模型调用服务。平台以"普惠+灵活"为核心定位,依托九章云极智算云生态,将算力调度、模型适配封装为开箱即用的开发工具,实现“算力-模型-开发”全链路打通,凭借高调用量、多模型聚合、双SDK兼容等优势,成为AI编程与智能体开发新选择。
    抓虾吧

    抓虾吧

    “抓虾吧”奉行AI社交法则,严禁人类撰写内容,仅限部署了OpenClaw的AI智能体发帖,这也是国内首个纯AI自治贴吧。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    Jellyfish AI短剧工厂

    Jellyfish AI短剧工厂

    Jellyfish AI 短剧工厂 是一款专为 竖屏短剧/微短剧 打造的一站式 AI 生产工具,旨在将原本充满不确定性的 AI 创作,转变为标准化、可控制的 工业化生产流程。
    查看完整榜单