SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    大语言模型

    共 238 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型
    排序
    发布更新浏览点赞
    通义 DeepResearch:首个全开源 Web Agent,性能对标 OpenAI 深度研究模型

    通义 DeepResearch:首个全开源 Web Agent,性能对标 OpenAI 深度研究模型

    阿里通义实验室正式发布 Tongyi DeepResearch —— 一个在性能上可与当前最先进闭源系统相媲美的全开源 Web Agent。 项目主页:https://tongyi-agent.git...
    大语言模型# Tongyi DeepResearch# 深度研究模型
    3个月前
    02330
    深度求索发布 DeepSeek-V3.1:混合思考模式 + 128K 上下文,API 同步升级并支持 Anthropic 格式

    深度求索发布 DeepSeek-V3.1:混合思考模式 + 128K 上下文,API 同步升级并支持 Anthropic 格式

    深度求索(DeepSeek)正式推出 DeepSeek-V3.1 —— 一个在架构设计、推理效率和智能体能力上全面升级的新版本模型。此次更新不仅提升了性能,更引入了混合思考模式,让同一个模型可灵活适应...
    大语言模型# DeepSeek-V3.1# 深度求索
    4个月前
    02320
    月之暗面推出Kimi-Dev-72B:为软件工程任务打造的新一代开源编码大模型

    月之暗面推出Kimi-Dev-72B:为软件工程任务打造的新一代开源编码大模型

    月之暗面推出一款全新的开源编码大语言模型 Kimi-Dev-72B,专为软件工程任务设计。该模型基于 Qwen2.5-72B 微调而来,在 SWE-bench Verified 测试中取得了 60.4...
    大语言模型# Kimi-Dev-72B# 月之暗面
    6个月前
    02310
    新型检索器ReasonIR-8B:专门针对需要推理的复杂任务进行优化

    新型检索器ReasonIR-8B:专门针对需要推理的复杂任务进行优化

    Meta、华盛顿大学、新加坡国立大学、艾伦人工智能研究所、斯坦福大学、麻省理工学院和加州大学伯克利分校的研究人员推出一种名为 ReasonIR-8B 的新型检索器,专门针对需要推理的复杂任务进行优化...
    大语言模型# ReasonIR-8B# 检索器
    8个月前
    02310
    谷歌推出Gemini 2.5 Flash:更强大的推理能力与灵活的成本控制

    谷歌推出Gemini 2.5 Flash:更强大的推理能力与灵活的成本控制

    谷歌于今日通过Google AI Studio和Vertex AI的Gemini API,发布了Gemini 2.5 Flash的早期预览版。这一新版本在广受欢迎的2.0 Flash基础上进行了重大升...
    大语言模型# Gemini 2.5 Flash# 谷歌
    8个月前
    02290
    清华、蚂蚁等联合发布ASearcher:开源大规模强化学习搜索代理

    清华、蚂蚁等联合发布ASearcher:开源大规模强化学习搜索代理

    由清华大学交叉信息研究院、蚂蚁研究院、强化学习实验室与华盛顿大学的研究团队联合推出 ASearcher —— 一个面向大规模在线强化学习(Reinforcement Learning, RL)的开源搜...
    大语言模型# ASearcher# inclusionAI
    4个月前
    02280
    DeepSeek推出基于Qwen3-8B的小型推理模型:DeepSeek-R1-0528-Qwen3-8B

    DeepSeek推出基于Qwen3-8B的小型推理模型:DeepSeek-R1-0528-Qwen3-8B

    深度求索在本周对DeepSeek R1进行了升级,还开源了此版本模型DeepSeek-R1-0528,官方还推出了一个基于Qwen3-8B的小型推理模型:DeepSeek-R1-0528-Qwen3...
    大语言模型# DeepSeek# DeepSeek-R1-0528-Qwen3-8B# 深度求索
    7个月前
    02270
    谷歌推了个能装进手机的大模型Gemma 3n,速度快、内存低、还能听会说

    谷歌推了个能装进手机的大模型Gemma 3n,速度快、内存低、还能听会说

    谷歌宣布推出其最新开源模型 Gemma 3n 的预览版,这是继 Gemma 3 和 Gemma 3 QAT 后,谷歌在轻量级大模型领域的又一重要进展。 Gemma 3n 专为手机、平板和笔记本电脑等设...
    大语言模型# Gemma 3n# 谷歌
    7个月前
    02270
    新型轨迹感知过程奖励模型(PRM) ReasonFlux-PRM:专门用于评估大型语言模型在长链推理中的轨迹-响应型推理痕迹

    新型轨迹感知过程奖励模型(PRM) ReasonFlux-PRM:专门用于评估大型语言模型在长链推理中的轨迹-响应型推理痕迹

    伊利诺伊大学厄巴纳-香槟分校、普林斯顿大学、康奈尔大学和字节跳动的研究人员推出新型轨迹感知过程奖励模型(PRM) ReasonFlux-PRM,专门用于评估大型语言模型(LLMs)在长链推理(Long...
    大语言模型# ReasonFlux-PRM# 轨迹感知过程奖励模型
    6个月前
    02240
    Meta发布Web-SSL系列模型:无语言也能学视觉,探索纯视觉自监督学习的潜力

    Meta发布Web-SSL系列模型:无语言也能学视觉,探索纯视觉自监督学习的潜力

    近年来,对比语言-图像模型(如CLIP)在多模态任务中表现出色,成为学习视觉表征的主流选择。这些模型通过大规模的图像-文本对进行训练,利用语言监督来融入语义信息,广泛应用于视觉问答(VQA)、文档理解...
    大语言模型# Meta# Web-SSL
    8个月前
    02240
    Tessa-T1:专为 React 前端开发打造的推理模型

    Tessa-T1:专为 React 前端开发打造的推理模型

    在前端开发领域,React 一直是构建现代 Web 应用的核心框架之一。然而,随着项目复杂度的增加,手动编写和优化 React 组件变得越来越耗时且容易出错。为了提升开发效率并简化前端工作流程,Tes...
    大语言模型# Qwen2.5-Coder# Tessa-T1# 推理模型
    8个月前
    02240
    基于 Qwen3 的混合专家(MoE)模型Arcana Qwen3 2.4B A0.6B

    基于 Qwen3 的混合专家(MoE)模型Arcana Qwen3 2.4B A0.6B

    Arcana Qwen3 2.4B A0.6B 是一个基于 Qwen3 的混合专家(MoE)模型,总参数量为 24 亿,每个专家模型拥有 6 亿参数。该模型旨在提供更高的准确性、更高的效率和更低的内存...
    大语言模型# Arcana Qwen3 2.4B A0.6B# MoE模型# Qwen3
    7个月前
    02230
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Grok

    Grok

    Grok是一款先进的对话式人工智能。Grok 旨在提供高效、准确且自然的对话交互体验,适用于多种应用场景,包括客户服务、虚拟助手、教育辅导等。
    ElevenLabs

    ElevenLabs

    ElevenLabs 成立于 2022 年,总部位于英国和波兰,致力于利用 AI 技术生成自然、富有表现力的语音。它的平台支持从文本到语音的转换、语音克隆和多语言配音,服务于各种需求。
    录咖

    录咖

    录咖以其强大的 AI 技术和丰富的功能,为音视频创作和处理带来了前所未有的便捷体验。无论你是创作者、教育工作者还是普通用户,录咖都能成为你得力的助手。
    PDF Parsers Playground

    PDF Parsers Playground

    “PDF Parsers Playground”是 Hugging Face Spaces 上发布的一个PDF应用,专为快速实验各种开源 PDF 解析器而设计。有了它,你可以轻松地对 PDF 文件进行解析、分析和比较,找到最适合你的解析器。
    查看完整榜单