英伟达推出世界基础模型平台NVIDIA Cosmos :帮助物理 AI 开发人员更好、更快地构建物理 AI 系统 英伟达在CES2025上宣布推出 NVIDIA Cosmos 平台,该平台包含先进的世界基础生成模型、高级分词器、防护栏和加速视频处理管道,旨在推动自动驾驶汽车(AV)和机器人等物理 AI 系统的发展... 多模态模型# NVIDIA Cosmos# 世界模型# 英伟达 2周前01010
ComfyUI现已支持英伟达Cosmos:迄今为止最好的开源图生视频模型? 英伟达在前段时间推出Cosmos 平台,该平台包含先进的世界基础生成模型、高级分词器、防护栏和加速视频处理管道,旨在推动自动驾驶汽车(AV)和机器人等物理 AI 系统的发展。虽然被称为“世界模型”,但... 教程# ComfyUI# Cosmos# 英伟达 1个月前01340
英伟达推出图像生成模型家族Edify Image:能够生成高保真度的图像内容,并且具有像素级完美准确性 英伟达推出图像生成模型家族Edify Image,它们能够生成高保真度的图像内容,并且具有像素级完美准确性。Edify Image利用了一系列级联的像素空间扩散模型,这些模型通过一个新颖的拉普拉斯扩散... 新技术# Edify Image# 图像生成# 英伟达 3个月前02360
英伟达推出Add-it:基于文本指令在图像中添加对象的创新方法 英伟达、特拉维夫大学和巴伊兰大学的研究人员推出一个名为Add-it的系统,它是一种无需训练的方法,可以在图像中根据文本提示添加对象。这种方法扩展了预训练扩散模型的注意力机制,以整合来自三个关键来源的信... 新技术# Add-it# 英伟达 3个月前01470
英伟达开源ConsiStory:免训练保持角色和物品一致性的文生图方法 来自特拉维夫大学和英伟达的研究人员提出了一种创新方法ConsiStory,它允许用户通过自然语言描述生成一系列图像,这些图像不仅能够保持一致的主题,而且能够遵循文本提示。ConsiStory的核心目标... 新技术# ConsiStory# 英伟达 4个月前04200
英伟达推出Autoguidance:改进图像生成扩散模型的性能 英伟达和阿尔托大学的研究人员推出Autoguidance,改进图像生成扩散模型的性能,特别是通过一种新颖的方法来控制图像质量、结果的变化性以及与给定条件(如类别标签或文本提示)的一致性。扩散模型是一种... 新技术# Autoguidance# 英伟达 9个月前03930
TensorRT Node for ComfyUI:TensorRT插件正式上架ComfyUI,加速图像生成 之前英伟达已经在Stable Diffusion web UI上推出了TensorRT插件,近日又联合ComfyUI开发者推出了ComfyUI插件,此插件专为英伟达GeForce RTX与 RTX显卡... 插件# TensorRT# TensorRT Node for ComfyUI# 加速 9个月前01,1840
英文将推出RTX Remix开源工具套件,还将推出配套的ComfyUI节点与工作流 英伟达RTX Remix 为游戏修改者提供了强大的工具,使他们能够对经典 DirectX 8 和 DirectX 9 游戏进行重制,包括完整的光线追踪技术、DLSS 3.5(深度学习超采样技术)、精致... 工具# ComfyUI# RTX Remix# 英伟达 9个月前07190
英伟达推出新型文生图模型BlobGEN:基于blob(斑点)的文本到图像扩散模型 英伟达推出新型文生图模型BlobGEN,这个模型的核心思想是将场景分解为视觉原语——被称为密集的blob(斑点)表示——这些表示包含了场景的细粒度细节,同时具备模块化、易于理解和构建的特点。例如,一个... 新技术# BlobGEN# 文生图模型# 英伟达 9个月前06420
采样调节器AlignYouSteps:优化采样步骤,从而提高生成图像的细节和质量 英伟达、多伦多大学和矢量研究所的研究人员推出新的采样调节器AlignYouSteps(调整步伐),用于优化采样步骤,从而提高生成图像的细节和质量。这是一种通用且原则性的方法,用于优化扩散模型的采样计划... 新技术# AlignYouSteps# 英伟达# 采样调节器 10个月前05700
英伟达推出视频生成模型CMD:解决现有视频生成技术在处理高维视频数据时所面临的高内存和计算需求问题 英伟达推出新型的视频生成模型内容-运动潜在扩散模型(Content-Motion Latent Diffusion Model,简称CMD),这个模型是为了解决现有视频生成技术在处理高维视频数据时所面... 新技术# CMD# 英伟达 11个月前05180
文本反转Textual Inversion:通过少量的图像和自然语言描述来创建新的“伪词”来指导图像生成 使用文本到图像生成模型(Text-to-Image Models)来个性化地创造图像,这些模型能够根据自然语言描述生成图像,但通常难以精确地表达特定的独特概念。 项目主页 GitHub 来自特拉维夫大... 新技术# Textual Inversion# 文本反转# 英伟达 1年前04070