LTX-Video推出0.9.1版本,引入全新VAE解码器,原生支持STG/PAG
之前介绍过的《Lightricks推出开源视频生成模型LTX Video》,今天LTX-Video迎来了...
加速DiT架构视频生成模型的开源技术栈FastVideo:已推出FastHunyuan和FastMochi 两款模型,生成速度提升8倍
加州大学圣地亚哥分校 Hao AI 实验室推出的一个开源技术栈FastVideo ,旨在显著加...
通义语音团队推出语音生成模型CosyVoice 2:提升了多语言语音合成的质量、响应速度和实时性能
阿里巴巴旗下通义实验室语音团队在之前提出的 CosyVoice 基础上,推出了全新的 Cos...
基于修复的指令引导图像编辑框架BrushEdit:通过自然语言指令进行无缝编辑,包括添加对象、移除元素或进行结构性更改等多样化编辑操作
图像编辑技术近年来在基于反演(inversion-based)和基于指令(instruction-based...
UltraReal Fine-Tune:基于 FLUX.1-dev 模型的现实主义微调版本
UltraReal Fine-Tune 是基于 FLUX.1-dev 模型的一个微调版本,旨在通过训练者自己...