英伟达发布 KVTC 新技术:无需改模型即可将 LLM 内存占用缩小 20 倍,首字延迟降低 8 倍在大语言模型(LLM)的推理过程中,有一个长期存在的痛点:随着对话变长,显存占用呈线性甚至指数级增长。这就是著名的 KV 缓存(Key-Value Cache) 瓶颈。 现在,英伟达(NVIDIA)的...新技术# KVTC# 英伟达1周前0210
Meta 与英伟达达成新协议,采购数百万块 AI 芯片Meta 已与英伟达达成一项多年合作协议,计划采购数百万块英伟达 AI 芯片,用于扩展自身数据中心。 此同时,英伟达也首次开启 AI CPU 对外销售,此次协议中涉及的 Grace 和 Vera 两款...早报# Meta# 英伟达1个月前0210
美国撤销争议AI硬件出口规则:取消“对等投资”要求,新规仍在制定美国商务部已正式撤销一项争议性AI硬件出口规则草案,该草案曾要求海外大型AI集群运营商必须投资美国AI基础设施才能采购英伟达、AMD等厂商的高端AI加速器。目前,针对AI硬件的新出口框架仍在制定中。 ...早报# AI硬件# AMD# 美国2周前0200
DLSS 5 遭遇口碑滑铁卢:玩家痛斥“生成式 AI”毁掉游戏艺术风格英伟达预告了下一代帧生成技术 DLSS 5,原本期待中的技术飞跃却意外引发了游戏界的强烈反弹。与以往专注于提升分辨率和帧率的超采样技术不同,DLSS 5 引入了生成式 AI来实时重构光照和纹理。 然而...早报# DLSS 5# 英伟达2周前0180
英伟达拟20–30亿美元收购AI21,核心目标是其200人AI团队据以色列媒体 Calcalist 独家报道,英伟达正就收购以色列大语言模型公司 AI21 Labs 进行深入谈判,交易估值预计在 20 至 30 亿美元 之间,显著高于其 2023 年融资时约 14 ...早报# AI21 Labs# 英伟达3个月前0180
英伟达再创纪录:季度营收 680 亿美元,黄仁勋称“全球 GPU 库存耗尽,Token 需求指数级爆发”全球市值最高的公司 英伟达 (NVIDIA) 再次交出了一份令人咋舌的成绩单。周三公布的最新财报显示,受益于全球对 AI 算力的狂热需求,英伟达单季度营收高达 680 亿美元,同比增长 73%,刷新历...早报# 英伟达1个月前0160
英特尔与英伟达联手:至强6 搭载DGX Rubin,提速大规模AI推理在2026英伟达GTC大会上,英特尔正式宣布:全新至强6处理器将作为英伟达DGX Rubin NVL8系统的主机CPU,双方通过CPU与AI平台深度协同,进一步提升大规模AI推理与集群整体效率。 这并...硬件# 至强6# 英伟达# 英特尔2周前0100