英伟达推出Add-it:基于文本指令在图像中添加对象的创新方法英伟达、特拉维夫大学和巴伊兰大学的研究人员推出一个名为Add-it的系统,它是一种无需训练的方法,可以在图像中根据文本提示添加对象。这种方法扩展了预训练扩散模型的注意力机制,以整合来自三个关键来源的信...新技术# Add-it# 英伟达1年前03440
英伟达 RTX显卡实现 OpenAI 最新开源模型 gpt-oss最快推理速度英伟达(NVIDIA)宣布与 OpenAI 深度合作,将后者最新发布的开放权重模型 gpt-oss-20b 和 gpt-oss-120b 带入消费级与专业级设备端,依托 GeForce RTX 与 R...早报# gpt-oss# OpenAI# 英伟达6个月前03330
英伟达 TensorRT 为 RTX显卡带来 2 倍性能提升,全面支持所有 RTX显卡英伟达宣布将 TensorRT AI 加速技术 引入 RTX 平台,为所有 GeForce RTX显卡提供最高可达 2 倍于 DirectML 的性能提升。这一突破性进展不仅显著优化了 AI 推理速度...早报# TensorRT# 英伟达9个月前03250
英伟达开源ViPE工具:从普通视频中精准提取3D信息,还附赠9600万帧标注数据集在空间AI领域,“3D几何感知”是许多技术落地的基础——无论是AR场景构建、自动驾驶环境感知,还是视频内容的3D重构,都需要精准的相机姿态、内参和深度信息。但长期以来,从野外随机拍摄的视频(如自拍、行...3D模型# ViPE# 英伟达5个月前03120
英伟达联合团队提出新型连续时间流图(flow map)模型 AYF:统一扩散与流模型的少步生成方案由英伟达、多伦多大学及矢量研究所联合提出一种新型的连续时间流图(flow map)模型Align Your Flow(AYF) ,显著提升扩散模型和基于流的生成模型的采样效率。这些模型虽然在图像与文本...新技术# Align Your Flow# AYF# 英伟达8个月前03080
这对英伟达来说可能是坏消息!AI芯片初创公司Cerebras 新建 6 个 AI 数据中心,每秒处理 4000 万tokensCerebras Systems,一家致力于挑战英伟达在AI市场主导地位的初创公司,于周二宣布了一项重大扩展计划:在全球新增六个AI数据中心。此举不仅将大幅提升其推理能力,还将与关键行业伙伴建立合作关...早报# AI芯片# Cerebras# 英伟达11个月前02930
在 ComfyUI 中使用英伟达物理世界基础模型Cosmos-Predict2 实现文生图与视频生成指南Cosmos-Predict2 是由英伟达推出的新一代物理世界基础模型,专为物理 AI 场景下的高质量视觉生成与预测任务设计。该模型具备高度的物理准确性、环境交互能力以及细节还原度,能够真实模拟复杂的...工作流# Cosmos-Predict2# 物理世界基础模型# 英伟达7个月前02850
英伟达开源了世界上第一个人形机器人基础模型 GR00T N1,加速通用人形机器人开发人形机器人旨在适应人类工作空间,处理重复性或高要求任务。然而,为现实世界的任务和不可预测环境开发通用人形机器人具有挑战性。每项任务通常需要专用的AI模型。从头开始为每个新任务和环境训练这些模型是一个繁...多模态模型# GR00T N1# 人形机器人基础模型# 英伟达11个月前02830
英伟达 CEO 黄仁勋表示市场对 DeepSeek 的影响理解错误英伟达创始人兼首席执行官黄仁勋在最近的一次采访中表示,市场对 DeepSeek 技术进步及其对英伟达业务潜在负面影响的理解存在偏差。他强调,DeepSeek 的开源推理模型 R1 并不会削弱对计算资源...早报# DeepSeek# 英伟达# 黄仁勋11个月前02810
英伟达发布OpenReasoning-Nemotron:多规模推理模型,覆盖数学、科学与编程英伟达近日发布了 OpenReasoning-Nemotron 模型家族,这是一组专为数学、科学和编程推理任务优化的大语言模型。 模型:https://huggingface.co/collectio...大语言模型# OpenReasoning-Nemotron# 英伟达7个月前02800
英伟达推出面向文档理解的小而强视觉-语言模型 Llama Nemotron Nano VL英伟达正式发布了 Llama Nemotron Nano VL —— 一款专为高效处理复杂文档设计的轻量级视觉-语言模型(VLM)。该模型基于 Llama 3.1 架构构建,在保持高性能的同时兼顾推理...多模态模型# Llama Nemotron Nano VL# 英伟达8个月前02760
英伟达发布人体运动的通用模型Genmo:实现从视频、2D 关键点、文本描述、音乐和3D 关键帧等多种条件信号中生成和估计高质量的人类运动英伟达研究团队开发的统一框架 GENMO,用于人类运动建模。GENMO 的目标是将人类运动估计(estimation)和生成(generation)任务整合到一个框架中,从而实现从视频、2D 关键点...新技术# Genmo# 人体运动# 英伟达9个月前02710