百科 | 第5页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

新型图像生成模型Hourglass Diffusion Transformer（HDiT）

Stability AI、慕尼黑大学和Birchlabs的开发人员提出了一种名为Hourglass Diffusion Transformer（HDiT）的新型图像生成模型，该模型在保持高分辨率图像合...

2年前

01,0610

高效灵活的对象检测工具YOLO-World

来自腾讯AI实验室、华中科技大学EIC学院的研究人员推出高效实时开放词汇对象检测框架YOLO-World，旨在通过视觉语言模型和大规模数据集的预训练，增强YOLO（You Only Look Once...

新技术 # YOLO-World # 对象检测工具 # 腾讯AI实验室

2年前

01,0570

多模态框架MotionLLM：理解和解释人类行为，特别是通过分析人体动作和视频

清华大学、香港中文大学（深圳）、国际数字经济学院和香港科技大学的研究人员推出人工智能系统MotionLLM，它的主要任务是理解和解释人类行为，特别是通过分析人体动作和视频。例如，你有一台智能相机，它不...

新技术 # MotionLLM # 多模态框架

2年前

01,0560

英伟达GeForce RTX 4070 Ti SUPER

近期，英伟达推出了GeForce RTX 40 SUPER系列第二款显卡，此款显卡对于AI用户来说是个不错的选择，原因就是它拥有与RTX 4080更为接近的规格配置，显存容量和带宽比起原来的RTX 4...

硬件 # RTX 4070 Ti SUPER # 英伟达

2年前

01,0450

创新框架UniAnimate：用于生成高质量、时间连贯的人类图像动画视频

华中科技大学、阿里巴巴和中国科学技术大学的研究人员推出创新框架UniAnimate，它专门用于生成高质量、时间连贯的人类图像动画视频。UniAnimate通过结合统一的视频扩散模型、统一的噪声输入和...

新技术 # UniAnimate # 视频扩散模型

2年前

01,0390

后训练压缩策略DiTFastAttn：压缩和加速DiT模型，缓解DiT的计算瓶颈问题

来自清华大学、无问芯穹（Infinigence AI）、卡内基梅隆大学和上海交通大学的研究人员推出新技术DiTFastAttn，它专门用于压缩和加速一种称为Diffusion Transformers...

新技术 # DiTFastAttn # DiT模型

2年前

01,0310

图像转换方法img2img-turbo：在单个步骤中完成复杂的图像转换任务，同时不需要成对的训练数据，适用于多种应用场景

来自卡内基梅隆大学和Adobe的研究人员推出新的图像转换方法img2img-turbo，它能够在单个步骤中将图像从源域转换到目标域，例如从白天的场景转换到夜晚，或者添加和移除天气效果如雾、雪和雨。这种...

新技术 # img2img-turbo # 图像转换

2年前

01,0300

新型视频生成技术“CVD（协作视频扩散）”：生成从多个不同摄像机轨迹视角下观察同一场景的一致性视频

斯坦福大学和香港中文大学的研究人员推出新型视频生成技术“协作视频扩散”（Collaborative Video Diffusion，简称CVD），这项技术的核心目标是能够生成从多个不同摄像机轨迹视角下...

新技术 # CVD # 协作视频扩散 # 视频生成

2年前

01,0290

视觉语言模型CoLLaVO：提高视觉语言模型在零样本视觉语言任务中的性能

韩国研究人员推出视觉语言模型CoLLaVO（Crayon Large Language and Vision mOdel），此模型旨在通过增强对象级别的图像理解能力，提高视觉语言模型（VLMs）在零样...

新技术 # CoLLaVO # 视觉语言模型

2年前

01,0260

英伟达推出新型文生图模型BlobGEN：基于blob（斑点）的文本到图像扩散模型

英伟达推出新型文生图模型BlobGEN，这个模型的核心思想是将场景分解为视觉原语——被称为密集的blob（斑点）表示——这些表示包含了场景的细粒度细节，同时具备模块化、易于理解和构建的特点。例如，一个...

新技术 # BlobGEN # 文生图模型 # 英伟达

2年前

01,0170

3D图像渲染技术SAGS：改进现有的3D图像渲染方法，以实现更高质量的图像渲染，同时减少所需的计算资源和存储空间

来自伦敦帝国理工学院和华为诺亚方舟实验室的研究人员推出新的3D图像渲染技术SAGS（Structure-Aware 3D Gaussian Splatting），这项技术旨在改进现有的3D图像渲染方法...

新技术 # 3D图像渲染 # SAGS

2年前

01,0110

CUDA与cuDNN安装教程

目前很多AI应用都是建立在英伟达CUDA基础上的，Stable Diffusion也不例外，虽然CPU或英特尔、AMD的显卡也能运行Stable Diffusion相关应用，但运行与生图效率暂时还无法...

教程 # CUDA # cuDNN # GPU

2年前

01,0100

加载更多

百科