SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜
    • 网址提交

    DeepSeek

    共 27 篇文章
    排序
    发布更新浏览点赞
    DeepSeek发布mHC技术论文:流形约束超连接让大模型训练更稳更省成本,已验证270亿参数量

    DeepSeek发布mHC技术论文:流形约束超连接让大模型训练更稳更省成本,已验证270亿参数量

    2026年初,中国AI初创公司DeepSeek发布了一篇重磅技术论文,由创始人梁文锋合著。论文提出对基础AI模型训练的核心架构进行重新设计,推出全新技术“流形约束超连接(mHC)”,旨在以更低成本训练...
    新技术# DeepSeek# mHC
    6天前
    0140
    别再只会说 “总结一下”:7 种高价值提示词,让 AI 真正为你所用

    别再只会说 “总结一下”:7 种高价值提示词,让 AI 真正为你所用

    很多人用 ChatGPT、DeepSeek等AI工具时,习惯性输入“总结一下这篇文章”或“帮我概括这段内容”。这类指令看似省事,实则浪费了 AI 的潜力——低质量的提示,只会带来低质量的输出。 AI ...
    提示词# ChatGPT# DeepSeek# 提示词
    1个月前
    0350
    685B参数DeepSeekMath-V2开源!IMO/CMO金牌+Putnam近满分,颠覆数学推理范式

    685B参数DeepSeekMath-V2开源!IMO/CMO金牌+Putnam近满分,颠覆数学推理范式

    数学推理领域迎来里程碑式突破!DeepSeek AI 正式发布开源数学模型 DeepSeekMath-V2,这款基于 685B 参数专家混合(MoE)架构的模型,不仅在 IMO 2025、CMO 20...
    大语言模型# DeepSeek# DeepSeekMath-V2# 深度求索
    1个月前
    0230
    Databricks 联合创始人:美国必须拥抱开源,才能在 AI 上击败中国

    Databricks 联合创始人:美国必须拥抱开源,才能在 AI 上击败中国

    在近期举行的 Cerebral Valley AI 峰会上,Databricks 联合创始人、风投机构 Laude 创始人 Andy Konwinski 提出一个明确观点:美国若想在人工智能领域维持领...
    早报# Databricks# DeepSeek# 开源
    2个月前
    0200
    DeepSeek 开源DeepSeek-OCR :用视觉模态压缩文本,3B 小模型撬动长上下文新思路

    DeepSeek 开源DeepSeek-OCR :用视觉模态压缩文本,3B 小模型撬动长上下文新思路

    DeepSeek 开源了 DeepSeek-OCR,一个仅 30 亿参数的视觉语言模型(VLM),却在 OCR 与文本压缩领域展现出令人瞩目的创新力。其核心并非追求更大参数量,而是提出一种“光学压缩...
    多模态模型# DeepSeek# DeepSeek-OCR
    2个月前
    01160
    DeepSeek 发布DeepSeek-V3.2-Exp:首次引入细粒度稀疏注意力,API 成本直降 50%+

    DeepSeek 发布DeepSeek-V3.2-Exp:首次引入细粒度稀疏注意力,API 成本直降 50%+

    在国庆节假期前夕,DeepSeek 正式推出 DeepSeek-V3.2-Exp ——一个面向未来架构演进的实验性(Experimental)版本。该模型并非最终发布版,而是通向新一代高效架构的关键中...
    大语言模型# DeepSeek# DeepSeek-V3.2-Exp
    3个月前
    01600
    DeepSeek推出基于Qwen3-8B的小型推理模型:DeepSeek-R1-0528-Qwen3-8B

    DeepSeek推出基于Qwen3-8B的小型推理模型:DeepSeek-R1-0528-Qwen3-8B

    深度求索在本周对DeepSeek R1进行了升级,还开源了此版本模型DeepSeek-R1-0528,官方还推出了一个基于Qwen3-8B的小型推理模型:DeepSeek-R1-0528-Qwen3...
    大语言模型# DeepSeek# DeepSeek-R1-0528-Qwen3-8B# 深度求索
    7个月前
    02360
    微软禁止员工使用DeepSeek应用,数据安全与宣传风险成主因

    微软禁止员工使用DeepSeek应用,数据安全与宣传风险成主因

    近日,微软副董事长兼总裁布拉德·史密斯(Brad Smith)在美国参议院听证会上公开表示,由于数据安全和潜在宣传问题,微软已禁止员工使用DeepSeek应用。这一决定标志着微软首次公开对一款AI工具...
    百科# DeepSeek# 微软
    8个月前
    01920
    DeepSeek 推出 DeepSeek-Prover-V2:为 Lean 4 形式化定理证明设计的开源大语言模型

    DeepSeek 推出 DeepSeek-Prover-V2:为 Lean 4 形式化定理证明设计的开源大语言模型

    DeepSeek于4月30日发布了 DeepSeek-Prover-V2,这是一个专门用于 Lean 4 形式化定理证明的开源大语言模型。该模型的设计目标是将非形式化的数学推理与形式化的证明构建整合到...
    大语言模型# DeepSeek# DeepSeek-Prover-V2# DeepSeek-Prover-V2-671B
    8个月前
    02230
    DeepSeek发布DeepSeek-Prover-V2-671B:6710亿参数的数学AI模型,推动定理证明自动化

    DeepSeek发布DeepSeek-Prover-V2-671B:6710亿参数的数学AI模型,推动定理证明自动化

    DeepSeek在今天悄悄地升级了其专注于数学定理证明和推理的 AI 模型DeepSeek-Prover。最新版本 DeepSeek-Prover-V2-671B已于今天在Hugging Face 上...
    早报# DeepSeek# DeepSeek-Prover-V2-671B
    8个月前
    02510
    通过推理计算来提高通用奖励建模(RM)的推理时间可扩展性

    通过推理计算来提高通用奖励建模(RM)的推理时间可扩展性

    强化学习(RL)在大语言模型(LLM)的后续训练中已被广泛应用,尤其是在提升模型的推理能力方面。然而,如何在各种领域中为LLM获得准确的奖励信号,仍然是一个关键挑战。 论文:https://arxiv...
    新技术# DeepSeek# 奖励建模# 清华大学
    9个月前
    03020
    DeepSeek低调发布DeepSeek-V3-0324,性能超过Claude Sonnet 3.5,可在消费级硬件部署

    DeepSeek低调发布DeepSeek-V3-0324,性能超过Claude Sonnet 3.5,可在消费级硬件部署

    DeepSeek在昨晚悄悄地发布了一款新的大语言模型——DeepSeek-V3-0324。这款模型不仅因其出色的能力在AI行业掀起波澜,更因其独特的部署方式引发了广泛关注。该模型已经在Hugging ...
    早报# DeepSeek# Deepseek V3# DeepSeek-V3-0324
    10个月前
    01990
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    人生 K 线

    人生 K 线

    人生 K 线(Life Destiny K-Line)是一个结合传统八字命理与现代大语言模型(LLM)的轻量级可视化工具。它将一个人从 1 岁到 100 岁的运势走势,以类似股票 K 线图的形式呈现,试图用数据可视化的方式“翻译”命理推演结果。
    Planning with Files

    新Planning with Files

    Planning with Files 是一个轻量但极具启发性的实践——它不依赖新模型,而是用老技术(文件系统)解决新问题(AI 健忘)。对于追求效率与可控性的开发者、研究者和知识工作者而言,值得一试。
    NotebookLM

    NotebookLM

    NotebookLM是谷歌推出的一款个性化AI协作工具,旨在帮助用户更高效地进行信息整理和笔记记录。利用强大的语言模型帮助用户更快地从各种文本、图像以及网页中提取主要信息。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    Grok

    Grok

    Grok是一款先进的对话式人工智能。Grok 旨在提供高效、准确且自然的对话交互体验,适用于多种应用场景,包括客户服务、虚拟助手、教育辅导等。
    查看完整榜单