英伟达与微软携手,加速 RTX AI PC 的发展

早报7个月前发布 小马良
201 0

在当今快速发展的技术领域,生成式 AI 正在重塑我们的工作和娱乐方式。英伟达微软的合作,通过推出 RTX AI PC,正在将这一变革推向新的高度。本文将详细介绍英伟达和微软如何通过一系列创新技术和工具,推动 RTX AI PC 的发展,让生成式 AI 在 Windows 11 上的应用变得更加简单和高效。

英伟达 TensorRT for RTX:为 RTX AI PC 提供强大的 AI 加速

英伟达 TensorRT for RTX 是一项突破性技术,通过 Windows ML 加速应用中的 AI 功能。这一技术的推出,使得开发者能够更轻松地在 RTX AI PC 上部署和优化 AI 模型,从而为用户提供更强大的性能和更流畅的体验。

TensorRT for RTX 的关键特性

  • 高性能:TensorRT for RTX 结合了行业领先的 TensorRT 性能,为 RTX AI PC 提供了显著的性能提升。与 DirectML 相比,TensorRT 在 PC 上为 AI 工作负载提供了超过 50% 的性能提升。
  • 即时设备端引擎构建:TensorRT for RTX 不需要预生成 TensorRT 引擎并将其打包到应用中,而是使用即时设备端引擎构建,在几秒钟内优化 AI 模型以适配用户特定的 RTX GPU。
  • 更小的打包尺寸:该库的打包已精简,文件大小显著缩小 8 倍,使得部署更加高效。
  • 广泛的硬件兼容性:通过 Windows ML 的原生支持,TensorRT for RTX 为应用开发者提供了广泛的硬件兼容性和最先进的性能。

开发者支持

TensorRT for RTX 现在通过 Windows ML 预览版向开发者提供,并将于 6 月在英伟达 Developer 网站上作为独立 SDK 提供。(来源:英伟达 TensorRT 为 RTX显卡带来 2 倍性能提升,全面支持所有 RTX显卡

英伟达 NIM 微服务和 AI Blueprints:简化本地 AI 开发

对于 AI 爱好者和开发者来说,开始 AI 开发可能是一个复杂的过程。英伟达 NIM(NVIDIA Inference Microservices)通过提供预打包、优化的 AI 模型,极大地简化了这一过程。这些模型不仅针对 RTX GPU 优化,还提供了容器化的部署方式,使得同一 NIM 微服务可以在 PC 或云端无缝运行。

NIM 微服务的关键特性

  • 预打包和优化:NIM 微服务提供了精选的 AI 模型列表,这些模型预打包了运行所需的所有文件,并针对 RTX GPU 优化以实现最佳性能。
  • 容器化部署:由于它们是容器化的,同一 NIM 微服务可以在 PC 或云端无缝运行。
  • 快速性能:通过 TensorRT 和量化模型,NIM 微服务在英伟达 Blackwell GPU 上实现了比原生运行快两倍以上的性能。

AI Blueprints

英伟达还提供了 AI Blueprints,这些是使用 NIM 微服务的示例工作流程和项目。开发者可以根据需要修改开源蓝图或扩展其功能,快速启动自己的 AI 项目。

最新发布

在 COMPUTEX 期间,英伟达发布了 FLUX.1-schnell NIM 微服务——来自 Black Forest Labs 的图像生成模型,适用于快速图像生成——并更新了 FLUX.1-dev NIM 微服务,增加了对 GeForce RTX 50 和 40 系列 GPU 的广泛兼容性。

Project G-Assist:无代码 AI 开发的新选择

Project G-Assist 是英伟达推出的一个集成到英伟达应用的实验性 AI 助手,使用户能够通过简单的语音和文本命令控制 GeForce RTX 系统。这一工具不仅为普通用户提供了便捷的界面,还为开发者提供了无代码或低代码开发的平台。

Project G-Assist 的关键特性

  • 无代码或低代码开发:Project G-Assist 插件构建器是一个基于 ChatGPT 的应用,允许通过自然语言命令进行无代码或低代码开发。这些轻量级、社区驱动的插件使用简单的 JSON 定义和 Python 逻辑。
  • 丰富的插件生态系统:新的开源插件示例现已在 GitHub 上提供,展示本地 AI 增强 PC 和游戏工作流程的多种方式。例如,Gemini 插件已更新,包含实时网络搜索功能;IFTTT 插件允许用户在数百个兼容端点上创建自动化;Discord 插件使用户能够轻松将游戏精彩片段或消息直接分享到 Discord 服务器。

社区支持

有兴趣开发和实验 Project G-Assist 插件的爱好者可以加入英伟达 Developer Discord 频道,以协作、分享创作并获得支持。每周,RTX AI Garage 博客系列都会展示社区驱动的 AI 创新和内容,供希望了解更多关于 NIM 微服务和 AI Blueprints,以及在 AI PC 和工作站上构建 AI 代理、创意工作流程、数字人、效率应用等的用户参考。

扩展 Windows 11 PC 上的 AI 生态系统

英伟达和微软的合作不仅限于 TensorRT for RTX 和 NIM 微服务,还包括一系列 SDK 和工具,帮助开发者在 Windows 11 上实现更强大的 AI 功能。

英伟达 SDK 的强大支持

英伟达提供了丰富的 SDK,帮助开发者在 Windows 11 上实现更强大的 AI 功能。这些 SDK 包括:

  • NVIDIA CUDA 和 TensorRT:用于 GPU 加速。
  • NVIDIA DLSS 和 Optix:用于 3D 图形。
  • NVIDIA RTX Video 和 Maxine:用于多媒体。
  • NVIDIA Riva 和 ACE:用于生成式 AI。

顶级应用的更新

本月,顶级应用将发布更新,利用这些英伟达 SDK 启用独特功能,包括:

  • LM Studio:发布更新以升级到最新 CUDA 版本,性能提升超过 30%。
  • Topaz Labs:发布生成式 AI 视频模型以增强视频质量,由 CUDA 加速。
  • Chaos Enscape 和 Autodesk VRED:添加 DLSS 4 以获得更快性能和更好图像质量。
  • Bilibili:整合英伟达 Broadcast 功能,如虚拟背景,以提升直播质量。
© 版权声明

相关文章

暂无评论

none
暂无评论...