阿里云新系统 Aegaeon:用 213 个 GPU 实现 1,192 个的推理能力阿里云在 ACM SOSP 2025(操作系统原理研讨会)上发表了一篇经同行评审的论文,介绍其名为 Aegaeon 的新型 GPU 池化系统。该系统在阿里云 Model Studio 平台的多月生产测...新技术# Aegaeon# 阿里云2个月前0510
华为开源 SINQ:新型量化技术让大模型在消费级显卡上高效运行随着大语言模型(LLM)参数规模持续增长,部署成本已成为制约其广泛应用的主要瓶颈之一。 华为苏黎世计算系统实验室近日推出一项名为 SINQ(Sinkhorn-Normalized Quantizati...新技术# SINQ# 华为# 量化技术2个月前0770
Self-Forcing++:一种无需长视频训练即可生成高质量长视频的新方法近年来,扩散模型在图像和短片视频生成方面取得了突破性进展。然而,当扩展到长视频生成(如数十秒甚至数分钟)时,现有方法普遍面临一个核心问题:质量随长度增加而显著下降。 这主要源于两个限制: 计算成本高...新技术# Self Forcing# 字节跳动2个月前01250
英伟达推出LONGLIVE:单卡实现实时交互式长视频生成AI生成视频正从“几秒特效”迈向“分钟级叙事”。 长期以来,生成高质量、长时间连贯的视频是AI内容创作的一大瓶颈。传统扩散模型虽能产出精美画面,却难以支持实时生成;自回归方法虽具备推理加速潜力,又常因...新技术# LONGLIVE# 英伟达2个月前01300
用 Wi-Fi 信号生成房间图像?LatentCSI 结合 AI 实现高分辨率空间重建东京科学研究所的研究团队近日提出一种新方法——LatentCSI,能够利用日常 Wi-Fi 设备采集的无线信号,结合预训练扩散模型,生成高分辨率的室内布局图像。 论文地址:https://arxiv...新技术# LatentCSI2个月前01170
Q-Tuning:用“错误-不确定性”框架统一剪枝,提升微调效率监督微调(SFT)正变得越来越重。 过去,SFT 只是大模型训练流程中的一个轻量级收尾步骤;如今,它已演变为一场计算密集型任务,其数据规模和训练成本常常逼近中期预训练阶段。在有限算力预算下,如何高效利...新技术# Q-Tuning2个月前0620
Rolling Forcing:一种用于长视频生成的新型自回归扩散方法在构建交互式世界模型、神经游戏引擎和沉浸式 XR 应用的道路上,一个核心挑战始终存在:如何实时生成高质量、时间连贯的长视频流? 当前主流的自回归视频生成方法虽能产出单段短片,但在生成多分钟连续视频时...新技术# Rolling Forcing# 长视频生成2个月前01060
SageAttention3 发布:FP4 推理加速与 8 位训练新探索清华大学研究团队近日推出 SageAttention3,一项聚焦于提升 Transformer 注意力机制效率的新研究成果。该工作在推理阶段引入基于 FP4 的微缩放量化技术,并首次系统性探索了 8 ...新技术# SageAttention3# 清华大学2个月前0690
Windows ML 现已可用:让 AI 应用更高效运行在你的电脑上微软宣布,其 Windows ML 平台现已正式进入生产可用状态,面向所有运行 Windows 11 24H2 及以上版本的设备开放。这一进展标志着 Windows 在本地 AI 能力上的关键落地...新技术# Windows ML2个月前0800
潜在分区网络(LZN):以共享高斯潜在空间,统一生成、表示与分类的机器学习新框架在机器学习领域,生成模型(如 DALL・E 生成图像、ChatGPT 生成文本)、表示学习(如 CLIP 实现图文表示匹配)、分类模型(如 ResNet 进行图像分类)是三大核心方向,且各自都已取得成...新技术# LZN# 潜在分区网络2个月前0760
BranchGRPO:树状分支重构,破解GRPO图像视频生成对齐的效率与稳定性难题在图像、视频生成领域,“让模型输出与人类偏好对齐”是关键目标——无论是生成符合审美标准的图像,还是帧间连贯的视频,都需要通过算法优化缩小模型输出与人类期望的差距。群体相对策略优化(GRPO)是近年常用...新技术# BranchGRPO2个月前0910
RPG:一种用于统一且可扩展代码库生成的存储库规划图微软、清华大学和加州大学圣地亚哥分校的研究人员推出一个名为 Repository Planning Graph (RPG) 的框架,用于从头开始生成完整的软件仓库。它通过将软件的功能规划和实现规划统一...新技术# RPG# 代码库生成3个月前0760