英伟达联合团队提出新型连续时间流图(flow map)模型 AYF:统一扩散与流模型的少步生成方案由英伟达、多伦多大学及矢量研究所联合提出一种新型的连续时间流图(flow map)模型Align Your Flow(AYF) ,显著提升扩散模型和基于流的生成模型的采样效率。这些模型虽然在图像与文本...新技术# Align Your Flow# AYF# 英伟达6个月前02480
英伟达发布 Cosmos-Predict2:打造物理AI的世界基础模型在物理AI(Physical AI)系统的开发中,模拟真实世界的动态变化至关重要。为此,英伟达推出了 Cosmos-Predict2,作为其 Cosmos 世界模型 的最新演进版本,专为生成具有物理感...多模态模型# Cosmos-Predict2# 世界基础模型# 英伟达6个月前01970
英伟达推出一款专为复杂推理任务设计的开源模型 — Nemotron-Research-Reasoning-Qwen-1.5B英伟达近日发布了一款专为复杂推理任务设计的开源模型 —— Nemotron-Research-Reasoning-Qwen-1.5B,该模型参数量为 1.5B,在数学、编程、科学问题和逻辑谜题等任务上...大语言模型# Nemotron-Research-Reasoning-Qwen-1.5B# 英伟达6个月前01080
英伟达推出面向文档理解的小而强视觉-语言模型 Llama Nemotron Nano VL英伟达正式发布了 Llama Nemotron Nano VL —— 一款专为高效处理复杂文档设计的轻量级视觉-语言模型(VLM)。该模型基于 Llama 3.1 架构构建,在保持高性能的同时兼顾推理...多模态模型# Llama Nemotron Nano VL# 英伟达6个月前02030
英伟达与微软携手,加速 RTX AI PC 的发展在当今快速发展的技术领域,生成式 AI 正在重塑我们的工作和娱乐方式。英伟达和微软的合作,通过推出 RTX AI PC,正在将这一变革推向新的高度。本文将详细介绍英伟达和微软如何通过一系列创新技术和工...早报# RTX AI PC# 微软# 英伟达7个月前02010
英伟达 TensorRT 为 RTX显卡带来 2 倍性能提升,全面支持所有 RTX显卡英伟达宣布将 TensorRT AI 加速技术 引入 RTX 平台,为所有 GeForce RTX显卡提供最高可达 2 倍于 DirectML 的性能提升。这一突破性进展不仅显著优化了 AI 推理速度...早报# TensorRT# 英伟达7个月前02640
英伟达发布人体运动的通用模型Genmo:实现从视频、2D 关键点、文本描述、音乐和3D 关键帧等多种条件信号中生成和估计高质量的人类运动英伟达研究团队开发的统一框架 GENMO,用于人类运动建模。GENMO 的目标是将人类运动估计(estimation)和生成(generation)任务整合到一个框架中,从而实现从视频、2D 关键点...新技术# Genmo# 人体运动# 英伟达7个月前02610
英伟达向沙特国家支持的AI数据中心提供18,000个AI GPU,此举源于取消的出口规则英伟达宣布将向沙特阿拉伯新成立的国家支持AI公司 Humain 提供 18,000个AI GPU,用于建设一个 500兆瓦的数据中心。这一交易标志着沙特在AI领域的雄心迈出了重要一步,同时也反映了全球...早报# AI# Humain# 沙特7个月前01660
支付巨头Stripe联手英伟达,发布AI支付基础模型并推出稳定币支持的多币种卡金融科技巨头Stripe在年度用户大会Stripe Sessions上宣布了一系列重磅产品更新,其中包括全新的AI支付基础模型、稳定币支持的多币种账户服务、以及与芯片巨头英伟达的深度合作。这些新功能和...早报# Stripe# 英伟达7个月前02400
英伟达推出自动语音识别模型Parakeet-TDT-0.6B-v2:专为高质量英语语音转录设计英伟达推出的 Parakeet-TDT-0.6B-v2 是一款拥有 6 亿参数的自动语音识别(ASR)模型,专为高质量英语语音转录设计。该模型支持标点符号、大写和精准的时间戳预测,能够处理长达 24 ...语音模型# Parakeet-TDT-0.6B-v2# 自动语音识别模型自动语音识别模型# 英伟达7个月前03210
英伟达发布数学推理模型 OpenMath-Nemotron 系列,基于Qwen2.5-32B训练长期以来,数学推理一直是人工智能领域的一项重大挑战。尽管传统的语言模型在生成自然语言文本方面表现出色,但在解决需要深入领域知识和多步骤逻辑推导的复杂数学问题时,它们往往显得力不从心。为了弥合这一差距...大语言模型# OpenMath-Nemotron# Qwen2.5-32B# 数学推理模型8个月前02020
英伟达推出多模态大语言模型Describe Anything 3B:为图像和视频局部描述量身定制的多模态 AI 模型英伟达、加州大学伯克利分校和加州大学旧金山分校的研究人员推出了 Describe Anything 3B (DAM-3B),这是一个专门用于生成细粒度图像和视频字幕的多模态大语言模型(LLM)。DAM...多模态模型# Describe Anything 3B# 多模态大语言模型# 英伟达8个月前05650