深度求索发布开源推理大语言模型DeepSeek-R1,性能对标 OpenAI o1 正式版 幻方量化旗下的AI公司深度求索(DeepSeek)今日正式发布了其最新的大语言模型DeepSeek-R1,并同步开源了模型权重。这一举措旨在通过提供高性能的开源解决方案,推动人工智能领域的发展。 地址... 大语言模型# DeepSeek# DeepSeek-R1# 深度求索 1个月前01550
韩国阻止从本地应用商店下载 DeepSeek 应用 韩国官员于上周六暂时限制了中国AI应用DeepSeek在该国应用商店的下载,原因是对该公司如何处理用户数据存在担忧。此举引发了对隐私保护和数据安全问题的关注。 事件背景 韩国个人信息保护委员会(PIP... 早报# DeepSeek# 韩国 3周前0460
深度求索开源第三弹DeepGEMM:专为高效 FP8 矩阵乘法设计的库 在开源周的第三天,DeepSeek 推出了一个名为 DeepGEMM 的新库,专为高效、简洁的 FP8 通用矩阵乘法(GEMM)而设计。这一工具旨在解决现代 AI 计算中矩阵乘法的效率和精度问题,特别... 新技术# DeepGEMM# DeepSeek# 深度求索 2周前0450
DeepSeek 在暂停三周后重新开放 API充值,并推出夜间错峰优惠 在因容量限制暂停服务近三周后,DeepSeek(深渡求索)于今日宣布重新开放其 API 充值,并推出夜间错峰优惠活动,以满足用户需求并优化服务体验。 暂停与恢复背景 DeepSeek 在此前因容量限制... 早报# API# DeepSeek# 深渡求索 2周前0440
DeepSeek开源周第五弹:高性能分布式文件系统 3FS和Smallpond 数据处理框架 在开源周的第五天,DeepSeek 正式发布了 3FS(Fire-Flyer File System)。这是一个专为现代 SSD 和 RDMA 网络设计的并行文件系统,旨在为深度学习等数据密集型应用提... 新技术# 3FS# DeepSeek# Smallpond 2周前0390
深度求索开源第二弹DeepEP:一款专为MoE模型和专家并行(EP)设计的开源通信库 在大语言模型领域,专家混合(MoE)架构因其能在不显著增加计算量的情况下提升模型容量而受到青睐。但MoE模型在GPU间通信方面面临挑战,传统的全对全通信方法可能成为瓶颈。为此,深度求索开源第二弹Dee... 新技术# DeepEP# DeepSeek# 深度求索 2周前0380
英伟达 CEO 黄仁勋表示市场对 DeepSeek 的影响理解错误 英伟达创始人兼首席执行官黄仁勋在最近的一次采访中表示,市场对 DeepSeek 技术进步及其对英伟达业务潜在负面影响的理解存在偏差。他强调,DeepSeek 的开源推理模型 R1 并不会削弱对计算资源... 早报# DeepSeek# 英伟达# 黄仁勋 3周前0360
DeepSeek开源高效解码内核FlashMLA:从英伟达Hopper GPU中榨取最大性能 随着全球对高性能计算需求的不断增长,AI模型训练和推理对硬件资源的需求也在快速攀升。然而,由于美国出口限制等原因,中国市场更多依赖于英伟达的“缩减版”H800 GPU(相较于H100功能有所削减)。这... 新技术# DeepSeek# FlashMLA# H800 2周前0330
摩尔线程宣布已经成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe 在 DeepSeek 开源周的第四天,摩尔线程宣布了一项重要的技术进展:成功支持 DeepSeek 的开源通信库 DeepEP 和并行算法 DualPipe,并发布了相关的开源代码仓库 MT-Deep... 早报# DeepEP# DeepSeek# DualPipe 2周前0320
DeepSeek 宣布将于下周开源五个经过实战检验的代码库 昨晚,DeepSeek 宣布了一项令人瞩目的计划:下周将陆续开源五个代码库,这些代码库已经在生产环境中经过了测试、部署和实战检验。DeepSeek 表示,这些开源项目将“毫无保留地分享我们微小但真诚的... 早报# DeepSeek 3周前0300
DeepSeek 开源周第四弹:DualPipe 和 EPLB 的发布 今天是 DeepSeek 开源周的第四天。与前三天相比,今天的开源项目公布稍晚一些,让关注者们等待得略显焦急,不过等待的结果总是值得的!DeepSeek 今日公布了两项重要的开源内容:DualPipe... 新技术# DeepSeek# DualPipe# EPLB 2周前0280
亚马逊计划推出「推理模型」,挑战 OpenAI 和 DeepSeek 据 Business Insider 报道,亚马逊正在开发自己的推理模型,以在 AI 市场中与 OpenAI、Anthropic 和 DeepSeek 等公司展开竞争。这一新模型将通过亚马逊的 AWS... 早报# DeepSeek# OpenAI# 亚马逊 1周前0260