SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    英伟达

    共 61 篇文章
    排序
    发布更新浏览点赞
    英伟达发布 Audio Flamingo 3:全球首个支持 10 分钟音频理解的开源模型

    英伟达发布 Audio Flamingo 3:全球首个支持 10 分钟音频理解的开源模型

    在视觉和文本领域大模型持续突破之后,音频理解也开始迎来新的里程碑。英伟达近日发布了 Audio Flamingo 3(AF3),这是目前最先进的开源大型音频语言模型(Large Audio Langu...
    语音模型# Audio Flamingo 3# 英伟达# 音频理解模型
    5个月前
    03170
    英伟达推出世界生成与自适应多模态控制Cosmos-Transfer1

    英伟达推出世界生成与自适应多模态控制Cosmos-Transfer1

    英伟达推出了一个名为 Cosmos World Foundation Model Platform 的平台,旨在为 Physical AI(物理人工智能)提供定制化的世界模型(World Founda...
    视频模型# Cosmos-Transfer1# 英伟达
    9个月前
    02950
    这对英伟达来说可能是坏消息!AI芯片初创公司Cerebras 新建 6 个 AI 数据中心,每秒处理 4000 万tokens

    这对英伟达来说可能是坏消息!AI芯片初创公司Cerebras 新建 6 个 AI 数据中心,每秒处理 4000 万tokens

    Cerebras Systems,一家致力于挑战英伟达在AI市场主导地位的初创公司,于周二宣布了一项重大扩展计划:在全球新增六个AI数据中心。此举不仅将大幅提升其推理能力,还将与关键行业伙伴建立合作关...
    早报# AI芯片# Cerebras# 英伟达
    9个月前
    02830
    英伟达开源了世界上第一个人形机器人基础模型 GR00T N1,加速通用人形机器人开发

    英伟达开源了世界上第一个人形机器人基础模型 GR00T N1,加速通用人形机器人开发

    人形机器人旨在适应人类工作空间,处理重复性或高要求任务。然而,为现实世界的任务和不可预测环境开发通用人形机器人具有挑战性。每项任务通常需要专用的AI模型。从头开始为每个新任务和环境训练这些模型是一个繁...
    多模态模型# GR00T N1# 人形机器人基础模型# 英伟达
    9个月前
    02790
    英伟达 CEO 黄仁勋表示市场对 DeepSeek 的影响理解错误

    英伟达 CEO 黄仁勋表示市场对 DeepSeek 的影响理解错误

    英伟达创始人兼首席执行官黄仁勋在最近的一次采访中表示,市场对 DeepSeek 技术进步及其对英伟达业务潜在负面影响的理解存在偏差。他强调,DeepSeek 的开源推理模型 R1 并不会削弱对计算资源...
    早报# DeepSeek# 英伟达# 黄仁勋
    10个月前
    02740
    英伟达发布OpenReasoning-Nemotron:多规模推理模型,覆盖数学、科学与编程

    英伟达发布OpenReasoning-Nemotron:多规模推理模型,覆盖数学、科学与编程

    英伟达近日发布了 OpenReasoning-Nemotron 模型家族,这是一组专为数学、科学和编程推理任务优化的大语言模型。 模型:https://huggingface.co/collectio...
    大语言模型# OpenReasoning-Nemotron# 英伟达
    5个月前
    02680
    在 ComfyUI 中使用英伟达物理世界基础模型Cosmos-Predict2 实现文生图与视频生成指南

    在 ComfyUI 中使用英伟达物理世界基础模型Cosmos-Predict2 实现文生图与视频生成指南

    Cosmos-Predict2 是由英伟达推出的新一代物理世界基础模型,专为物理 AI 场景下的高质量视觉生成与预测任务设计。该模型具备高度的物理准确性、环境交互能力以及细节还原度,能够真实模拟复杂的...
    工作流# Cosmos-Predict2# 物理世界基础模型# 英伟达
    5个月前
    02670
    英伟达 TensorRT 为 RTX显卡带来 2 倍性能提升,全面支持所有 RTX显卡

    英伟达 TensorRT 为 RTX显卡带来 2 倍性能提升,全面支持所有 RTX显卡

    英伟达宣布将 TensorRT AI 加速技术 引入 RTX 平台,为所有 GeForce RTX显卡提供最高可达 2 倍于 DirectML 的性能提升。这一突破性进展不仅显著优化了 AI 推理速度...
    早报# TensorRT# 英伟达
    7个月前
    02640
    英伟达发布人体运动的通用模型Genmo:实现从视频、2D 关键点、文本描述、音乐和3D 关键帧等多种条件信号中生成和估计高质量的人类运动

    英伟达发布人体运动的通用模型Genmo:实现从视频、2D 关键点、文本描述、音乐和3D 关键帧等多种条件信号中生成和估计高质量的人类运动

    英伟达研究团队开发的统一框架 GENMO,用于人类运动建模。GENMO 的目标是将人类运动估计(estimation)和生成(generation)任务整合到一个框架中,从而实现从视频、2D 关键点...
    新技术# Genmo# 人体运动# 英伟达
    7个月前
    02610
    英伟达发布开源大语言模型Llama-3.1 Nemotron Ultra-253B-v1:以半数参数超越DeepSeek R1

    英伟达发布开源大语言模型Llama-3.1 Nemotron Ultra-253B-v1:以半数参数超越DeepSeek R1

    英伟达今天发布了一款全新的开源大语言模型—Llama-3.1 Nemotron Ultra-253B-v1,这款拥有2530亿参数的模型在多个基准测试中表现出色,甚至超越了竞争对手DeepSeek R...
    大语言模型# Llama-3.1 Nemotron Ultra# Llama-3.1 Nemotron Ultra-253B-v1# 英伟达
    8个月前
    02540
    英伟达联合团队提出新型连续时间流图(flow map)模型 AYF:统一扩散与流模型的少步生成方案

    英伟达联合团队提出新型连续时间流图(flow map)模型 AYF:统一扩散与流模型的少步生成方案

    由英伟达、多伦多大学及矢量研究所联合提出一种新型的连续时间流图(flow map)模型Align Your Flow(AYF) ,显著提升扩散模型和基于流的生成模型的采样效率。这些模型虽然在图像与文本...
    新技术# Align Your Flow# AYF# 英伟达
    6个月前
    02480
    英伟达开源ViPE工具:从普通视频中精准提取3D信息,还附赠9600万帧标注数据集

    英伟达开源ViPE工具:从普通视频中精准提取3D信息,还附赠9600万帧标注数据集

    在空间AI领域,“3D几何感知”是许多技术落地的基础——无论是AR场景构建、自动驾驶环境感知,还是视频内容的3D重构,都需要精准的相机姿态、内参和深度信息。但长期以来,从野外随机拍摄的视频(如自拍、行...
    3D模型# ViPE# 英伟达
    3个月前
    02450
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Next AI Draw.io

    Next AI Draw.io

    Next AI Draw.io 是一个基于 Next.js 的 Web 应用,将大语言模型(LLM)与 draw.io 的强大图表能力深度集成。用户可通过自然语言指令创建、修改和增强专业图表,无需手动拖拽。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    OiiOii AI

    OiiOii AI

    OiiOii.ai 是一个基于多智能体架构的动画生成平台,其核心目标是将动画制作从线性协作流程,转变为端到端的自动化生成。用户只需上传一张图片或输入一段文字描述,系统即可自动完成剧本生成、分镜设计、角色建模、镜头调度、配乐合成与最终渲染,输出一段完整动画视频。
    查看完整榜单