DeepSeek低调发布DeepSeek-V3-0324,性能超过Claude Sonnet 3.5,可在消费级硬件部署DeepSeek在昨晚悄悄地发布了一款新的大语言模型——DeepSeek-V3-0324。这款模型不仅因其出色的能力在AI行业掀起波澜,更因其独特的部署方式引发了广泛关注。该模型已经在Hugging ...早报# DeepSeek# Deepseek V3# DeepSeek-V3-03246天前0200
清华大学与清程极智开源大模型推理引擎“赤兔 Chitu”,实现 DeepSeek 推理成本降低一半、性能翻番清华大学高性能计算研究所翟季冬教授团队与清华系科创企业清程极智联合宣布,大模型推理引擎“赤兔 Chitu”现已正式开源。该引擎首次实现了在非英伟达 Hopper 架构 GPU 及各类国产芯片上原生运行...新技术# Chitu# DeepSeek# 大模型推理引擎2周前0440
Manus 可能并非中国的第二个“DeepSeek 时刻”科技媒体 TechCrunch报道:上周,一个名为Manus的“代理式”AI平台以预览形式发布,引发了巨大的关注和炒作。Hugging Face的产品负责人称Manus为“我尝试过的最令人印象深刻的A...早报# DeepSeek# Manus3周前0370
亚马逊计划推出「推理模型」,挑战 OpenAI 和 DeepSeek据 Business Insider 报道,亚马逊正在开发自己的推理模型,以在 AI 市场中与 OpenAI、Anthropic 和 DeepSeek 等公司展开竞争。这一新模型将通过亚马逊的 AWS...早报# DeepSeek# OpenAI# 亚马逊4周前0460
DeepSeek开源周第五弹:高性能分布式文件系统 3FS和Smallpond 数据处理框架在开源周的第五天,DeepSeek 正式发布了 3FS(Fire-Flyer File System)。这是一个专为现代 SSD 和 RDMA 网络设计的并行文件系统,旨在为深度学习等数据密集型应用提...新技术# 3FS# DeepSeek# Smallpond1个月前0590
百度宣布文心大模型4.5将于3月16日发布,支持深度思考和原生多模态百度宣布,其最新的文心大模型4.5将于2025年3月16日正式上线。根据官方介绍,文心大模型4.5在基础模型能力上实现了显著提升,并具备原生多模态和深度思考等先进特性。此外,百度还计划从2025年6月...早报# DeepSeek# 文心大模型4.5# 李彦宏1个月前0510
摩尔线程宣布已经成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe在 DeepSeek 开源周的第四天,摩尔线程宣布了一项重要的技术进展:成功支持 DeepSeek 的开源通信库 DeepEP 和并行算法 DualPipe,并发布了相关的开源代码仓库 MT-Deep...早报# DeepEP# DeepSeek# DualPipe1个月前0550
DeepSeek 开源周第四弹:DualPipe 和 EPLB 的发布今天是 DeepSeek 开源周的第四天。与前三天相比,今天的开源项目公布稍晚一些,让关注者们等待得略显焦急,不过等待的结果总是值得的!DeepSeek 今日公布了两项重要的开源内容:DualPipe...新技术# DeepSeek# DualPipe# EPLB1个月前0440
深度求索开源第三弹DeepGEMM:专为高效 FP8 矩阵乘法设计的库在开源周的第三天,DeepSeek 推出了一个名为 DeepGEMM 的新库,专为高效、简洁的 FP8 通用矩阵乘法(GEMM)而设计。这一工具旨在解决现代 AI 计算中矩阵乘法的效率和精度问题,特别...新技术# DeepGEMM# DeepSeek# 深度求索1个月前0620
DeepSeek 在暂停三周后重新开放 API充值,并推出夜间错峰优惠在因容量限制暂停服务近三周后,DeepSeek(深渡求索)于今日宣布重新开放其 API 充值,并推出夜间错峰优惠活动,以满足用户需求并优化服务体验。 暂停与恢复背景 DeepSeek 在此前因容量限制...早报# API# DeepSeek# 深渡求索1个月前0640
深度求索开源第二弹DeepEP:一款专为MoE模型和专家并行(EP)设计的开源通信库在大语言模型领域,专家混合(MoE)架构因其能在不显著增加计算量的情况下提升模型容量而受到青睐。但MoE模型在GPU间通信方面面临挑战,传统的全对全通信方法可能成为瓶颈。为此,深度求索开源第二弹Dee...新技术# DeepEP# DeepSeek# 深度求索1个月前0630
DeepSeek开源高效解码内核FlashMLA:从英伟达Hopper GPU中榨取最大性能随着全球对高性能计算需求的不断增长,AI模型训练和推理对硬件资源的需求也在快速攀升。然而,由于美国出口限制等原因,中国市场更多依赖于英伟达的“缩减版”H800 GPU(相较于H100功能有所削减)。这...新技术# DeepSeek# FlashMLA# H8001个月前0500