小马良 - SD百科 - 第62页

Controlnet作者lllyasviel新开源项目Omost：将大语言模型的编程能力转化为图像合成能力

Controlnet作者lllyasviel新开源项目Omost：将大语言模型的编程能力转化为图像合成能力

Controlnet作者lllyasviel的新开源项目Omost，这是一个将大语言模型的编程能力转化...

2024-06-07 468

Jasper推出新型蒸馏方法Flash Diffusion：高效、快速、多用途且与LoRA兼容，旨在加速预训练扩散模型图像生成

Jasper推出新型蒸馏方法Flash Diffusion：高效、快速、多用途且与LoRA兼容，旨在加速预训练扩散模型图像生成

Jasper推出了一种高效、快速、多用途且与LoRA兼容，旨在加速预训练扩散模型生成的...

2024-06-07 456

自动化图形设计工具PosterLLaVa：利用多模态大语言模型来自动化图形设计中的布局生成任务

自动化图形设计工具PosterLLaVa：利用多模态大语言模型来自动化图形设计中的布局生成任务

腾讯推出PosterLLaVa系统，它是一个统一的多模态布局生成器，利用多模态大语言模型...

2024-06-06 514

Search_T2V：改善文本到视频合成的质量和真实感

Search_T2V：改善文本到视频合成的质量和真实感

浙江大学、飞步科技、宁波港和腾讯数据平台的研究人员推出新技术Search_T2V，旨在...

2024-06-06 396

阿里推出新型视频生成框架I4VGen：无需训练且即插即用的视频扩散推理框架

阿里推出新型视频生成框架I4VGen：无需训练且即插即用的视频扩散推理框架

阿里推出新型视频生成框架I4VGen，这是一个无需训练（training-free）且即插即用（...

2024-06-06 358

人像视频生成框架V-Express：平衡不同控制信号（如文本、音频、参考图像、姿态、深度图等）的强弱，以便在生成视频中实现更协调和有效的控制

人像视频生成框架V-Express：平衡不同控制信号（如文本、音频、参考图像、姿态、深度图等）的强弱，以便在生成视频中实现更协调和有效的控制

南京大学和腾讯人工智能实验室的研究人员推出人像视频生成框架V-Express，它用于生...

2024-06-06 272

英伟达推出Autoguidance：改进图像生成扩散模型的性能

英伟达推出Autoguidance：改进图像生成扩散模型的性能

英伟达和阿尔托大学的研究人员推出Autoguidance，改进图像生成扩散模型的性能，特...

2024-06-06 322

TensorRT Node for ComfyUI：TensorRT插件正式上架ComfyUI，加速图像生成

TensorRT Node for ComfyUI：TensorRT插件正式上架ComfyUI，加速图像生成

之前英伟达已经在Stable Diffusion web UI上推出了TensorRT插件，近日又联合ComfyU...

2024-06-05 1.1k

英文将推出RTX Remix开源工具套件，还将推出配套的ComfyUI节点与工作流

英文将推出RTX Remix开源工具套件，还将推出配套的ComfyUI节点与工作流

英伟达RTX Remix 为游戏修改者提供了强大的工具，使他们能够对经典 DirectX 8 和 D...

2024-06-05 662

创新框架UniAnimate：用于生成高质量、时间连贯的人类图像动画视频

创新框架UniAnimate：用于生成高质量、时间连贯的人类图像动画视频

华中科技大学、阿里巴巴和中国科学技术大学的研究人员推出创新框架UniAnimate，它...

2024-06-05 372

视频插帧新技术ZeroSmooth：提升预训练视频扩散模型生成高帧率视频的能力，而无需额外的训练数据和参数更新

视频插帧新技术ZeroSmooth：提升预训练视频扩散模型生成高帧率视频的能力，而无需额外的训练数据和参数更新

中国科学院大学人工智能学院、中国科学院自动化研究所模式识别新实验室和腾讯AI实...

2024-06-04 478

先进的视频深度估计方法ChronoDepth：通过结合视频生成模型的先验知识，有效地提高了深度估计的准确性和时间一致性

先进的视频深度估计方法ChronoDepth：通过结合视频生成模型的先验知识，有效地提高了深度估计的准确性和时间一致性

浙江大学、博洛尼亚大学、蚂蚁集团和Rock Universe的研究人员推出一种先进的视频深...

2024-06-04 350

升级VIP
全屏浏览
夜间模式
返回顶部