SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜
    • 网址提交

    英伟达

    共 66 篇文章
    排序
    发布更新浏览点赞
    英伟达发布 Audio Flamingo 3:全球首个支持 10 分钟音频理解的开源模型

    英伟达发布 Audio Flamingo 3:全球首个支持 10 分钟音频理解的开源模型

    在视觉和文本领域大模型持续突破之后,音频理解也开始迎来新的里程碑。英伟达近日发布了 Audio Flamingo 3(AF3),这是目前最先进的开源大型音频语言模型(Large Audio Langu...
    语音模型# Audio Flamingo 3# 英伟达# 音频理解模型
    6个月前
    03910
    FLUX.1 Kontext 正式开源,英伟达 TensorRT 实现性能翻倍

    FLUX.1 Kontext 正式开源,英伟达 TensorRT 实现性能翻倍

    英伟达 RTX 和 TensorRT 加速了 Black Forest Labs 最新的图像生成与编辑模型;此外,Gemma 3n 现已通过 RTX 和 英伟达 Jetson 加速。 Black Fo...
    早报# FLUX.1 Kontext# Gemma 3n# 英伟达
    6个月前
    02040
    英伟达最新 DLSS 修订版:Transformer 模型显存使用量降低 20%

    英伟达最新 DLSS 修订版:Transformer 模型显存使用量降低 20%

    英伟达近日发布了最新的 DLSS SDK 310.3.0 版本,在推出 DLSS 4 正式版的同时,还带来了一项关键改进:将基于 Transformer 的上行缩放模型(upscaling model...
    早报# DLSS 4# Transformer 模型# 显存
    6个月前
    02080
    在 ComfyUI 中使用英伟达物理世界基础模型Cosmos-Predict2 实现文生图与视频生成指南

    在 ComfyUI 中使用英伟达物理世界基础模型Cosmos-Predict2 实现文生图与视频生成指南

    Cosmos-Predict2 是由英伟达推出的新一代物理世界基础模型,专为物理 AI 场景下的高质量视觉生成与预测任务设计。该模型具备高度的物理准确性、环境交互能力以及细节还原度,能够真实模拟复杂的...
    工作流# Cosmos-Predict2# 物理世界基础模型# 英伟达
    7个月前
    02810
    英伟达联手富士康,拟用人形机器人打造全球最强AI服务器

    英伟达联手富士康,拟用人形机器人打造全球最强AI服务器

    据路透社报道,英伟达正与其合同制造伙伴富士康探讨一项前所未有的计划: 在富士康位于美国德克萨斯州休斯顿的新工厂中,部署人形机器人,用于组装英伟达最新一代 Blackwell 架构的人工智能服务器。 这...
    早报# 人形机器人# 富士康# 英伟达
    7个月前
    01620
    英伟达联合团队提出新型连续时间流图(flow map)模型 AYF:统一扩散与流模型的少步生成方案

    英伟达联合团队提出新型连续时间流图(flow map)模型 AYF:统一扩散与流模型的少步生成方案

    由英伟达、多伦多大学及矢量研究所联合提出一种新型的连续时间流图(flow map)模型Align Your Flow(AYF) ,显著提升扩散模型和基于流的生成模型的采样效率。这些模型虽然在图像与文本...
    新技术# Align Your Flow# AYF# 英伟达
    7个月前
    02870
    英伟达发布 Cosmos-Predict2:打造物理AI的世界基础模型

    英伟达发布 Cosmos-Predict2:打造物理AI的世界基础模型

    在物理AI(Physical AI)系统的开发中,模拟真实世界的动态变化至关重要。为此,英伟达推出了 Cosmos-Predict2,作为其 Cosmos 世界模型 的最新演进版本,专为生成具有物理感...
    多模态模型# Cosmos-Predict2# 世界基础模型# 英伟达
    7个月前
    02120
    英伟达推出一款专为复杂推理任务设计的开源模型 — Nemotron-Research-Reasoning-Qwen-1.5B

    英伟达推出一款专为复杂推理任务设计的开源模型 — Nemotron-Research-Reasoning-Qwen-1.5B

    英伟达近日发布了一款专为复杂推理任务设计的开源模型 —— Nemotron-Research-Reasoning-Qwen-1.5B,该模型参数量为 1.5B,在数学、编程、科学问题和逻辑谜题等任务上...
    大语言模型# Nemotron-Research-Reasoning-Qwen-1.5B# 英伟达
    7个月前
    01120
    英伟达推出面向文档理解的小而强视觉-语言模型 Llama Nemotron Nano VL

    英伟达推出面向文档理解的小而强视觉-语言模型 Llama Nemotron Nano VL

    英伟达正式发布了 Llama Nemotron Nano VL —— 一款专为高效处理复杂文档设计的轻量级视觉-语言模型(VLM)。该模型基于 Llama 3.1 架构构建,在保持高性能的同时兼顾推理...
    多模态模型# Llama Nemotron Nano VL# 英伟达
    7个月前
    02550
    英伟达与微软携手,加速 RTX AI PC 的发展

    英伟达与微软携手,加速 RTX AI PC 的发展

    在当今快速发展的技术领域,生成式 AI 正在重塑我们的工作和娱乐方式。英伟达和微软的合作,通过推出 RTX AI PC,正在将这一变革推向新的高度。本文将详细介绍英伟达和微软如何通过一系列创新技术和工...
    早报# RTX AI PC# 微软# 英伟达
    8个月前
    02010
    英伟达 TensorRT 为 RTX显卡带来 2 倍性能提升,全面支持所有 RTX显卡

    英伟达 TensorRT 为 RTX显卡带来 2 倍性能提升,全面支持所有 RTX显卡

    英伟达宣布将 TensorRT AI 加速技术 引入 RTX 平台,为所有 GeForce RTX显卡提供最高可达 2 倍于 DirectML 的性能提升。这一突破性进展不仅显著优化了 AI 推理速度...
    早报# TensorRT# 英伟达
    8个月前
    03010
    英伟达发布人体运动的通用模型Genmo:实现从视频、2D 关键点、文本描述、音乐和3D 关键帧等多种条件信号中生成和估计高质量的人类运动

    英伟达发布人体运动的通用模型Genmo:实现从视频、2D 关键点、文本描述、音乐和3D 关键帧等多种条件信号中生成和估计高质量的人类运动

    英伟达研究团队开发的统一框架 GENMO,用于人类运动建模。GENMO 的目标是将人类运动估计(estimation)和生成(generation)任务整合到一个框架中,从而实现从视频、2D 关键点...
    新技术# Genmo# 人体运动# 英伟达
    8个月前
    02670
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    人生 K 线

    人生 K 线

    人生 K 线(Life Destiny K-Line)是一个结合传统八字命理与现代大语言模型(LLM)的轻量级可视化工具。它将一个人从 1 岁到 100 岁的运势走势,以类似股票 K 线图的形式呈现,试图用数据可视化的方式“翻译”命理推演结果。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    查看完整榜单