DeepSeek

排序

发布更新浏览点赞

DeepSeek 联手清北发布 DualPath：破解 AI 智能体长上下文推理的存储带宽瓶颈，吞吐量提升 87%

来自北京大学、清华大学和DeepSeek的研究团队发布论文，研究的是AI智能体（Agent）推理时的存储瓶颈问题。背景是这样的：现在的AI不再只是简单的一问一答，而是变成了能自主规划、调用工具、多轮...

新技术 # DeepSeek # DualPath

1个月前

0300

告别 GPU 算力浪费！DeepSeek 条件记忆技术：让大模型检索静态知识更高效

当企业级大语言模型（LLM）在回答“iPhone 15 的电池容量是多少？”或“标准 NDA 条款包含哪些内容？”这类问题时，它正在动用为复杂推理设计的昂贵 GPU 计算资源——仅仅为了检索一段静态信...

新技术 # DeepSeek # Engram # 条件记忆

3个月前

0490

DeepSeek发布mHC技术论文：流形约束超连接让大模型训练更稳更省成本，已验证270亿参数量

2026年初，中国AI初创公司DeepSeek发布了一篇重磅技术论文，由创始人梁文锋合著。论文提出对基础AI模型训练的核心架构进行重新设计，推出全新技术“流形约束超连接（mHC）”，旨在以更低成本训练...

新技术 # DeepSeek # mHC

3个月前

0410

别再只会说 “总结一下”：7 种高价值提示词，让 AI 真正为你所用

很多人用 ChatGPT、DeepSeek等AI工具时，习惯性输入“总结一下这篇文章”或“帮我概括这段内容”。这类指令看似省事，实则浪费了 AI 的潜力——低质量的提示，只会带来低质量的输出。 AI ...

提示词 # ChatGPT # DeepSeek # 提示词

4个月前

0470

685B参数DeepSeekMath-V2开源！IMO/CMO金牌+Putnam近满分，颠覆数学推理范式

数学推理领域迎来里程碑式突破！DeepSeek AI 正式发布开源数学模型 DeepSeekMath-V2，这款基于 685B 参数专家混合（MoE）架构的模型，不仅在 IMO 2025、CMO 20...

大语言模型 # DeepSeek # DeepSeekMath-V2 # 深度求索

4个月前

0310

Databricks 联合创始人：美国必须拥抱开源，才能在 AI 上击败中国

在近期举行的 Cerebral Valley AI 峰会上，Databricks 联合创始人、风投机构 Laude 创始人 Andy Konwinski 提出一个明确观点：美国若想在人工智能领域维持领...

早报 # Databricks # DeepSeek # 开源

5个月前

0290

DeepSeek 开源DeepSeek-OCR ：用视觉模态压缩文本，3B 小模型撬动长上下文新思路

DeepSeek 开源了 DeepSeek-OCR，一个仅 30 亿参数的视觉语言模型（VLM），却在 OCR 与文本压缩领域展现出令人瞩目的创新力。其核心并非追求更大参数量，而是提出一种“光学压缩...

多模态模型 # DeepSeek # DeepSeek-OCR

5个月前

01830

DeepSeek 发布DeepSeek-V3.2-Exp：首次引入细粒度稀疏注意力，API 成本直降 50%+

在国庆节假期前夕，DeepSeek 正式推出 DeepSeek-V3.2-Exp ——一个面向未来架构演进的实验性（Experimental）版本。该模型并非最终发布版，而是通向新一代高效架构的关键中...

大语言模型 # DeepSeek # DeepSeek-V3.2-Exp

6个月前

02010

DeepSeek推出基于Qwen3-8B的小型推理模型：DeepSeek-R1-0528-Qwen3-8B

深度求索在本周对DeepSeek R1进行了升级，还开源了此版本模型DeepSeek-R1-0528，官方还推出了一个基于Qwen3-8B的小型推理模型：DeepSeek-R1-0528-Qwen3...

大语言模型 # DeepSeek # DeepSeek-R1-0528-Qwen3-8B # 深度求索

10个月前

02690

微软禁止员工使用DeepSeek应用，数据安全与宣传风险成主因

近日，微软副董事长兼总裁布拉德·史密斯（Brad Smith）在美国参议院听证会上公开表示，由于数据安全和潜在宣传问题，微软已禁止员工使用DeepSeek应用。这一决定标志着微软首次公开对一款AI工具...

百科 # DeepSeek # 微软

11个月前

02000

DeepSeek 推出 DeepSeek-Prover-V2：为 Lean 4 形式化定理证明设计的开源大语言模型

DeepSeek于4月30日发布了 DeepSeek-Prover-V2，这是一个专门用于 Lean 4 形式化定理证明的开源大语言模型。该模型的设计目标是将非形式化的数学推理与形式化的证明构建整合到...

大语言模型 # DeepSeek # DeepSeek-Prover-V2 # DeepSeek-Prover-V2-671B

11个月前

02590

DeepSeek发布DeepSeek-Prover-V2-671B：6710亿参数的数学AI模型，推动定理证明自动化

DeepSeek在今天悄悄地升级了其专注于数学定理证明和推理的 AI 模型DeepSeek-Prover。最新版本 DeepSeek-Prover-V2-671B已于今天在Hugging Face 上...

早报 # DeepSeek # DeepSeek-Prover-V2-671B

11个月前

02770

加载更多

DeepSeek 联手清北发布 DualPath：破解 AI 智能体长上下文推理的存储带宽瓶颈，吞吐量提升 87%

告别 GPU 算力浪费！DeepSeek 条件记忆技术：让大模型检索静态知识更高效

DeepSeek发布mHC技术论文：流形约束超连接让大模型训练更稳更省成本，已验证270亿参数量

别再只会说 “总结一下”：7 种高价值提示词，让 AI 真正为你所用

685B参数DeepSeekMath-V2开源！IMO/CMO金牌+Putnam近满分，颠覆数学推理范式

Databricks 联合创始人：美国必须拥抱开源，才能在 AI 上击败中国

DeepSeek 开源DeepSeek-OCR ：用视觉模态压缩文本，3B 小模型撬动长上下文新思路

DeepSeek 发布DeepSeek-V3.2-Exp：首次引入细粒度稀疏注意力，API 成本直降 50%+

DeepSeek推出基于Qwen3-8B的小型推理模型：DeepSeek-R1-0528-Qwen3-8B

微软禁止员工使用DeepSeek应用，数据安全与宣传风险成主因

DeepSeek 推出 DeepSeek-Prover-V2：为 Lean 4 形式化定理证明设计的开源大语言模型

DeepSeek发布DeepSeek-Prover-V2-671B：6710亿参数的数学AI模型，推动定理证明自动化

ITELLOU

OpenMAIC

S.H.I.T

新即梦 CLI

TapNow

Tripo

DeepSeek

网址

ITELLOU

OpenMAIC

S.H.I.T

新即梦 CLI

TapNow

Tripo