SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 972 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    英伟达发布 KVTC 新技术:无需改模型即可将 LLM 内存占用缩小 20 倍,首字延迟降低 8 倍

    英伟达发布 KVTC 新技术:无需改模型即可将 LLM 内存占用缩小 20 倍,首字延迟降低 8 倍

    在大语言模型(LLM)的推理过程中,有一个长期存在的痛点:随着对话变长,显存占用呈线性甚至指数级增长。这就是著名的 KV 缓存(Key-Value Cache) 瓶颈。 现在,英伟达(NVIDIA)的...
    新技术# KVTC# 英伟达
    3周前
    0240
    开源架构 Mamba-3 正式发布:推理速度超越 Transformer,同性能下显存占用减半,Apache 2.0 许可商用免费

    开源架构 Mamba-3 正式发布:推理速度超越 Transformer,同性能下显存占用减半,Apache 2.0 许可商用免费

    生成式 AI 的基石——Transformer 架构,自 2017 年诞生以来统治了行业近十年。然而,其高昂的计算成本和线性增长的内存需求,让大规模推理变得极其昂贵。 现在,挑战者来了。 由卡内基梅隆...
    新技术# Mamba-3# Transformer
    3周前
    0290
    GreenBoost:Linux 下的“显存无限”魔法,让 12GB 显卡跑 32GB 大模型

    GreenBoost:Linux 下的“显存无限”魔法,让 12GB 显卡跑 32GB 大模型

    你是否拥有一张消费级显卡(如 RTX 4070/5070 12GB),却眼馋那些需要 24GB 甚至 48GB 显存才能运行的超大语言模型(如 GLM-4-Flash, Llama-3-70B)? 传...
    新技术# GreenBoost# 大语言模型
    4周前
    02130
    FastVideo 里程碑:单卡 4.5 秒生成 1080p 视频,AI 视频创作进入“实时交互”时代

    FastVideo 里程碑:单卡 4.5 秒生成 1080p 视频,AI 视频创作进入“实时交互”时代

    “灵感稍纵即逝,但生成却要等几分钟。” 这是当前 AI 视频创作者最大的痛点。当生成速度慢于构思速度时,创意的反馈循环就被彻底打破了。 FastVideo 团队宣布了一项突破性进展:他们成功将开源模型...
    新技术# FastVideo# LTX-2.3
    4周前
    0880
    麻省理工突破:Attention Matching 技术让 LLM 内存需求骤降 50 倍,精度无损

    麻省理工突破:Attention Matching 技术让 LLM 内存需求骤降 50 倍,精度无损

    在企业级 AI 应用中,长上下文处理一直是个昂贵的痛点。分析数百页的法律合同、维护跨天的客户对话、或运行自主编码智能体时,KV 缓存(Key-Value Cache)的内存占用往往成为瓶颈,单个请求即...
    新技术# Attention Matching# 麻省理工学院
    4周前
    0400
    Black Forest Labs 发布 Self-Flow:训练效率提升 2.8 倍,终结多模态 AI 的“教师依赖”时代

    Black Forest Labs 发布 Self-Flow:训练效率提升 2.8 倍,终结多模态 AI 的“教师依赖”时代

    在生成式 AI 领域,扩散模型(如 Stable Diffusion、FLUX)长期面临一个结构性瓶颈:它们自身缺乏深层的语义理解能力,必须依赖外部“教师”模型(如 CLIP、DINOv2)来提供指导...
    新技术# Black Forest Labs# Self-Flow# 黑森林实验室
    4周前
    0220
    WILDACTOR:告别 AI 视频“变脸”噩梦,港科大团队实现任意视角下的全身身份严格一致

    WILDACTOR:告别 AI 视频“变脸”噩梦,港科大团队实现任意视角下的全身身份严格一致

    “现在的 AI 视频生成越来越逼真,但往往‘见光死’:镜头一转,主角换了张脸;动作一大,身体变了模样。这种‘身份漂移’让 AI 视频难以真正用于影视制作。” “WILDACTOR 的出现,就是为了让数...
    新技术# WILDACTOR# 身份一致
    1个月前
    0500
    Databricks 推出 FlashOptim:显存占用直砍 50%,70 亿参数模型训练门槛从 112GB 骤降至 35GB

    Databricks 推出 FlashOptim:显存占用直砍 50%,70 亿参数模型训练门槛从 112GB 骤降至 35GB

    在 AI 模型参数规模迈向万亿级的今天,“显存焦虑”已成为制约创新的最大瓶颈。训练一个 70 亿参数的语言模型,仅参数和优化器状态就需要 112GB 显存,这让拥有 24GB 消费级显卡的绝大多数开发...
    新技术# FlashOptim# 显存优化
    1个月前
    0330
    CUDA Agent:字节与清华联手打造,AI 首次超越工业级编译器,自动编写高性能 GPU 内核

    CUDA Agent:字节与清华联手打造,AI 首次超越工业级编译器,自动编写高性能 GPU 内核

    在现代人工智能的基石——GPU 加速计算领域,编写高性能 CUDA 内核 一直是一项只有少数人类专家才能掌握的“黑魔法”。尽管大语言模型在普通编程上表现优异,但在涉及底层硬件架构、内存管理和并行计算的...
    新技术# CUDA Agent# CUDA 内核
    1个月前
    0500
    微软发布 OPCD 新框架:告别冗长系统提示,将企业知识“烧录”进模型参数,推理速度倍增

    微软发布 OPCD 新框架:告别冗长系统提示,将企业知识“烧录”进模型参数,推理速度倍增

    在构建企业级大语言模型应用时,开发者们往往面临一个两难困境:为了让模型懂业务、守规矩,必须编写长达数千字的系统提示(System Prompt),注入公司政策、领域知识和安全约束;但这些冗长的上下文不...
    新技术# OPCD# 微软
    1个月前
    0210
    DeepSeek 联手清北发布 DualPath:破解 AI 智能体长上下文推理的存储带宽瓶颈,吞吐量提升 87%

    DeepSeek 联手清北发布 DualPath:破解 AI 智能体长上下文推理的存储带宽瓶颈,吞吐量提升 87%

    来自北京大学、清华大学和DeepSeek的研究团队发布论文,研究的是AI智能体(Agent)推理时的存储瓶颈问题。 背景是这样的:现在的AI不再只是简单的一问一答,而是变成了能自主规划、调用工具、多轮...
    新技术# DeepSeek# DualPath
    1个月前
    0300
    SeaCache:利用“光谱演化”原理重构扩散模型缓存,实现推理速度与画质的双重突破

    SeaCache:利用“光谱演化”原理重构扩散模型缓存,实现推理速度与画质的双重突破

    扩散模型(Diffusion Models)无疑是当前视觉生成的基石,但其固有的顺序去噪过程导致推理速度缓慢,成为大规模应用的瓶颈。现有的加速方法多采用“缓存策略”,即重用相邻时间步的中间输出。然而...
    新技术# SeaCache
    1个月前
    0350
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    MaxClaw

    MaxClaw

    Minimax 正式宣布对其 AI 智能体平台进行重大升级,推出 探索专家(Expert) 2.0 与 MaxClaw 两大核心功能。此次更新不仅大幅降低了专业智能体的创建门槛,更通过云端化部署解决了 OpenClaw 长期存在的“落地难”问题,标志着 AI 智能体从“极客玩具”向“大众生产力工具”的跨越。
    waoo

    waoo

    waoowaoo AI 影视 Studio 是一款基于 AI 技术的短剧/漫画视频制作工具,支持从小说文本自动生成分镜、角色、场景,并制作成完整视频。
    Joker of Academics(小丑学术期刊 )

    Joker of Academics(小丑学术期刊 )

    Joker 🤡 of Academics(小丑学术期刊 ) 是一本完全经过同行评审的开放获取期刊,致力于严肃研究非严肃的学术成果。我们发表敢于风趣的严谨研究、不知何故居然行得通的荒诞主义方法论,以及应用于可能并不需要它的领域的批判理论。
    查看完整榜单