SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    英伟达

    共 61 篇文章
    排序
    发布更新浏览点赞
    英伟达GeForce RTX 4060 Ti 16GB

    英伟达GeForce RTX 4060 Ti 16GB

    英伟达在去年7月正式发售万众瞩目RTX 4060 Ti 16GB,这张显卡最大的优点就是16GB显存,这对于AI用户来说这张显卡可以说是入门首选,一起来看看这张显卡的规格吧! RTX 4060 Ti ...
    硬件# RTX 4060 Ti 16GB# 英伟达
    2年前
    07000
    文本反转Textual Inversion:通过少量的图像和自然语言描述来创建新的“伪词”来指导图像生成

    文本反转Textual Inversion:通过少量的图像和自然语言描述来创建新的“伪词”来指导图像生成

    使用文本到图像生成模型(Text-to-Image Models)来个性化地创造图像,这些模型能够根据自然语言描述生成图像,但通常难以精确地表达特定的独特概念。 项目主页 GitHub 来自特拉维夫大...
    新技术# Textual Inversion# 文本反转# 英伟达
    2年前
    06170
    英伟达开源ConsiStory:免训练保持角色和物品一致性的文生图方法

    英伟达开源ConsiStory:免训练保持角色和物品一致性的文生图方法

    来自特拉维夫大学和英伟达的研究人员提出了一种创新方法ConsiStory,它允许用户通过自然语言描述生成一系列图像,这些图像不仅能够保持一致的主题,而且能够遵循文本提示。ConsiStory的核心目标...
    新技术# ConsiStory# 英伟达
    1年前
    06080
    英伟达推出图像生成模型家族Edify Image:能够生成高保真度的图像内容,并且具有像素级完美准确性

    英伟达推出图像生成模型家族Edify Image:能够生成高保真度的图像内容,并且具有像素级完美准确性

    英伟达推出图像生成模型家族Edify Image,它们能够生成高保真度的图像内容,并且具有像素级完美准确性。Edify Image利用了一系列级联的像素空间扩散模型,这些模型通过一个新颖的拉普拉斯扩散...
    新技术# Edify Image# 图像生成# 英伟达
    1年前
    05870
    英伟达推出多模态大语言模型Describe Anything 3B:为图像和视频局部描述量身定制的多模态 AI 模型

    英伟达推出多模态大语言模型Describe Anything 3B:为图像和视频局部描述量身定制的多模态 AI 模型

    英伟达、加州大学伯克利分校和加州大学旧金山分校的研究人员推出了 Describe Anything 3B (DAM-3B),这是一个专门用于生成细粒度图像和视频字幕的多模态大语言模型(LLM)。DAM...
    多模态模型# Describe Anything 3B# 多模态大语言模型# 英伟达
    8个月前
    05650
    英伟达开源多语言语音识别和翻译模型:Canary 1B Flash 和 Canary 180M Flash

    英伟达开源多语言语音识别和翻译模型:Canary 1B Flash 和 Canary 180M Flash

    在促进全球交流的进程中,多语言语音识别和翻译技术扮演着至关重要的角色。然而,开发能够实时准确地转录和翻译多种语言的模型面临着诸如处理语言细微差别、确保高准确性与低延迟以及实现跨设备高效部署等挑战。为应...
    语音模型# Canary 180M Flash# Canary 1B Flash# 多语言语音识别
    9个月前
    04440
    ComfyUI、Fooocus、FramePack 英伟达 RTX 50 系显卡(Windows)性能加速指南

    ComfyUI、Fooocus、FramePack 英伟达 RTX 50 系显卡(Windows)性能加速指南

    如果你正在使用 英伟达 RTX 50 系列(Blackwell 架构) 显卡,并希望在 Windows 上运行 ComfyUI、Fooocus 或 FramePack,那么本指南将帮助你显著提升生成效...
    新闻# ComfyUI# Fooocus# FramePack
    5个月前
    03820
    美国国家科学基金会与英伟达联手,斥资 1.5 亿美元推动全开源 AI 模型,加速美国科学创新

    美国国家科学基金会与英伟达联手,斥资 1.5 亿美元推动全开源 AI 模型,加速美国科学创新

    美国国家科学基金会(NSF)与英伟达(NVIDIA)近日宣布达成一项重要合作,共同投资 1.52 亿美元,支持由 Allen 人工智能研究所(Ai2) 牵头的“开放多模态 AI 基础设施加速科学”(O...
    早报# Ai2# 美国国家科学基金会# 艾伦AI研究所
    4个月前
    03810
    英伟达推出世界基础模型平台NVIDIA Cosmos :帮助物理 AI 开发人员更好、更快地构建物理 AI 系统

    英伟达推出世界基础模型平台NVIDIA Cosmos :帮助物理 AI 开发人员更好、更快地构建物理 AI 系统

    英伟达在CES2025上宣布推出 NVIDIA Cosmos 平台,该平台包含先进的世界基础生成模型、高级分词器、防护栏和加速视频处理管道,旨在推动自动驾驶汽车(AV)和机器人等物理 AI 系统的发展...
    多模态模型# NVIDIA Cosmos# 世界模型# 英伟达
    10个月前
    03460
    英伟达推出Add-it:基于文本指令在图像中添加对象的创新方法

    英伟达推出Add-it:基于文本指令在图像中添加对象的创新方法

    英伟达、特拉维夫大学和巴伊兰大学的研究人员推出一个名为Add-it的系统,它是一种无需训练的方法,可以在图像中根据文本提示添加对象。这种方法扩展了预训练扩散模型的注意力机制,以整合来自三个关键来源的信...
    新技术# Add-it# 英伟达
    1年前
    03390
    英伟达推出自动语音识别模型Parakeet-TDT-0.6B-v2:专为高质量英语语音转录设计

    英伟达推出自动语音识别模型Parakeet-TDT-0.6B-v2:专为高质量英语语音转录设计

    英伟达推出的 Parakeet-TDT-0.6B-v2 是一款拥有 6 亿参数的自动语音识别(ASR)模型,专为高质量英语语音转录设计。该模型支持标点符号、大写和精准的时间戳预测,能够处理长达 24 ...
    语音模型# Parakeet-TDT-0.6B-v2# 自动语音识别模型自动语音识别模型# 英伟达
    7个月前
    03210
    英伟达 RTX显卡实现 OpenAI 最新开源模型 gpt-oss最快推理速度

    英伟达 RTX显卡实现 OpenAI 最新开源模型 gpt-oss最快推理速度

    英伟达(NVIDIA)宣布与 OpenAI 深度合作,将后者最新发布的开放权重模型 gpt-oss-20b 和 gpt-oss-120b 带入消费级与专业级设备端,依托 GeForce RTX 与 R...
    早报# gpt-oss# OpenAI# 英伟达
    4个月前
    03180
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Next AI Draw.io

    Next AI Draw.io

    Next AI Draw.io 是一个基于 Next.js 的 Web 应用,将大语言模型(LLM)与 draw.io 的强大图表能力深度集成。用户可通过自然语言指令创建、修改和增强专业图表,无需手动拖拽。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    OiiOii AI

    OiiOii AI

    OiiOii.ai 是一个基于多智能体架构的动画生成平台,其核心目标是将动画制作从线性协作流程,转变为端到端的自动化生成。用户只需上传一张图片或输入一段文字描述,系统即可自动完成剧本生成、分镜设计、角色建模、镜头调度、配乐合成与最终渲染,输出一段完整动画视频。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    OpenStock

    OpenStock

    OpenStock 是昂贵市场平台的开源替代品。追踪实时价格、设置个性化提醒并探索详细的公司洞察——公开构建,为所有人服务,永久免费。
    查看完整榜单