新技术

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

英伟达发布 KVTC 新技术：无需改模型即可将 LLM 内存占用缩小 20 倍，首字延迟降低 8 倍

在大语言模型（LLM）的推理过程中，有一个长期存在的痛点：随着对话变长，显存占用呈线性甚至指数级增长。这就是著名的 KV 缓存（Key-Value Cache）瓶颈。现在，英伟达（NVIDIA）的...

新技术 # KVTC # 英伟达

3周前

0240

开源架构 Mamba-3 正式发布：推理速度超越 Transformer，同性能下显存占用减半，Apache 2.0 许可商用免费

生成式 AI 的基石——Transformer 架构，自 2017 年诞生以来统治了行业近十年。然而，其高昂的计算成本和线性增长的内存需求，让大规模推理变得极其昂贵。现在，挑战者来了。由卡内基梅隆...

新技术 # Mamba-3 # Transformer

3周前

0290

GreenBoost：Linux 下的“显存无限”魔法，让 12GB 显卡跑 32GB 大模型

你是否拥有一张消费级显卡（如 RTX 4070/5070 12GB），却眼馋那些需要 24GB 甚至 48GB 显存才能运行的超大语言模型（如 GLM-4-Flash, Llama-3-70B）？传...

新技术 # GreenBoost # 大语言模型

4周前

02130

FastVideo 里程碑：单卡 4.5 秒生成 1080p 视频，AI 视频创作进入“实时交互”时代

“灵感稍纵即逝，但生成却要等几分钟。” 这是当前 AI 视频创作者最大的痛点。当生成速度慢于构思速度时，创意的反馈循环就被彻底打破了。 FastVideo 团队宣布了一项突破性进展：他们成功将开源模型...

新技术 # FastVideo # LTX-2.3

4周前

0880

麻省理工突破：Attention Matching 技术让 LLM 内存需求骤降 50 倍，精度无损

在企业级 AI 应用中，长上下文处理一直是个昂贵的痛点。分析数百页的法律合同、维护跨天的客户对话、或运行自主编码智能体时，KV 缓存（Key-Value Cache）的内存占用往往成为瓶颈，单个请求即...

新技术 # Attention Matching # 麻省理工学院

4周前

0400

Black Forest Labs 发布 Self-Flow：训练效率提升 2.8 倍，终结多模态 AI 的“教师依赖”时代

在生成式 AI 领域，扩散模型（如 Stable Diffusion、FLUX）长期面临一个结构性瓶颈：它们自身缺乏深层的语义理解能力，必须依赖外部“教师”模型（如 CLIP、DINOv2）来提供指导...

新技术 # Black Forest Labs # Self-Flow # 黑森林实验室

4周前

0220

WILDACTOR：告别 AI 视频“变脸”噩梦，港科大团队实现任意视角下的全身身份严格一致

“现在的 AI 视频生成越来越逼真，但往往‘见光死’：镜头一转，主角换了张脸；动作一大，身体变了模样。这种‘身份漂移’让 AI 视频难以真正用于影视制作。” “WILDACTOR 的出现，就是为了让数...

新技术 # WILDACTOR # 身份一致

1个月前

0500

Databricks 推出 FlashOptim：显存占用直砍 50%，70 亿参数模型训练门槛从 112GB 骤降至 35GB

在 AI 模型参数规模迈向万亿级的今天，“显存焦虑”已成为制约创新的最大瓶颈。训练一个 70 亿参数的语言模型，仅参数和优化器状态就需要 112GB 显存，这让拥有 24GB 消费级显卡的绝大多数开发...

新技术 # FlashOptim # 显存优化

1个月前

0330

CUDA Agent：字节与清华联手打造，AI 首次超越工业级编译器，自动编写高性能 GPU 内核

在现代人工智能的基石——GPU 加速计算领域，编写高性能 CUDA 内核一直是一项只有少数人类专家才能掌握的“黑魔法”。尽管大语言模型在普通编程上表现优异，但在涉及底层硬件架构、内存管理和并行计算的...

新技术 # CUDA Agent # CUDA 内核

1个月前

0500

微软发布 OPCD 新框架：告别冗长系统提示，将企业知识“烧录”进模型参数，推理速度倍增

在构建企业级大语言模型应用时，开发者们往往面临一个两难困境：为了让模型懂业务、守规矩，必须编写长达数千字的系统提示（System Prompt），注入公司政策、领域知识和安全约束；但这些冗长的上下文不...

新技术 # OPCD # 微软

1个月前

0210

DeepSeek 联手清北发布 DualPath：破解 AI 智能体长上下文推理的存储带宽瓶颈，吞吐量提升 87%

来自北京大学、清华大学和DeepSeek的研究团队发布论文，研究的是AI智能体（Agent）推理时的存储瓶颈问题。背景是这样的：现在的AI不再只是简单的一问一答，而是变成了能自主规划、调用工具、多轮...

新技术 # DeepSeek # DualPath

1个月前

0300

SeaCache：利用“光谱演化”原理重构扩散模型缓存，实现推理速度与画质的双重突破

扩散模型（Diffusion Models）无疑是当前视觉生成的基石，但其固有的顺序去噪过程导致推理速度缓慢，成为大规模应用的瓶颈。现有的加速方法多采用“缓存策略”，即重用相邻时间步的中间输出。然而...

新技术 # SeaCache

1个月前

0350

加载更多

英伟达发布 KVTC 新技术：无需改模型即可将 LLM 内存占用缩小 20 倍，首字延迟降低 8 倍

开源架构 Mamba-3 正式发布：推理速度超越 Transformer，同性能下显存占用减半，Apache 2.0 许可商用免费

GreenBoost：Linux 下的“显存无限”魔法，让 12GB 显卡跑 32GB 大模型

FastVideo 里程碑：单卡 4.5 秒生成 1080p 视频，AI 视频创作进入“实时交互”时代

麻省理工突破：Attention Matching 技术让 LLM 内存需求骤降 50 倍，精度无损

Black Forest Labs 发布 Self-Flow：训练效率提升 2.8 倍，终结多模态 AI 的“教师依赖”时代

WILDACTOR：告别 AI 视频“变脸”噩梦，港科大团队实现任意视角下的全身身份严格一致

Databricks 推出 FlashOptim：显存占用直砍 50%，70 亿参数模型训练门槛从 112GB 骤降至 35GB

CUDA Agent：字节与清华联手打造，AI 首次超越工业级编译器，自动编写高性能 GPU 内核

微软发布 OPCD 新框架：告别冗长系统提示，将企业知识“烧录”进模型参数，推理速度倍增

DeepSeek 联手清北发布 DualPath：破解 AI 智能体长上下文推理的存储带宽瓶颈，吞吐量提升 87%

SeaCache：利用“光谱演化”原理重构扩散模型缓存，实现推理速度与画质的双重突破

S.H.I.T

ITELLOU

Tripo

MaxClaw

waoo

Joker of Academics（小丑学术期刊）

新技术

网址

S.H.I.T

ITELLOU

Tripo

MaxClaw

waoo

Joker of Academics（小丑学术期刊 ）

Joker of Academics（小丑学术期刊）