多功能大规模扩散模型OneDiffusion:能够无缝支持双向图像合成和理解,跨越多种不同的任务
AI2、加州大学欧文分校和华盛顿大学的研究人员介绍了一种名为OneDiffusion的多功能...
新型故事视频生成框架DreamRunner:根据文本脚本生成长篇、多动作、多场景的视频,适用于CogVideoX模型
故事讲述视频生成(SVG)是一项旨在从文本脚本创建长时间、多动作、多场景视频的任...
跨模态图像生成模型Qwen2vl-Flux:将Qwen2VL的视觉语言理解能力与FLUX框架相结合,实现了更精确和上下文感知的图像生成
Qwen2vl-Flux 是一种先进的跨模态图像生成模型,它将Qwen2VL的视觉语言理解能力与F...
适用于FLUX模型的新型框架OminiControl:通过整合图像条件,使得DiT模型能够处理各种图像生成任务
新加坡国立大学的研究团队提出了一种名为OminiControl的新型框架,它旨在为预训练...
与FLUX.1 Redux竞争?InstantX Team开源基于FLUX.1-dev的IP-Adapter模型
FLUX.1-dev-IP-Adapter 是由 InstantX Team 发布的一个 IP-Adapter,最初在 Shakke...