用于创建数据集的桌面工具qapyq:最新版增加了图像缩放、自动遮罩和裁剪功能,以及自动字幕功能
qapyq 是一款专为生成式 AI 模型的数据集整理、微调(finetune)和 LoRA 设计的图...
实例感知结构化字幕框架InstanceCap:实现实例级 和 细粒度 的视频字幕生成,显著提升了字幕与视频之间的一致性和保真度
近年来,文本到视频生成技术取得了显著进展,但现有的视频字幕生成方法仍然存在一...
UltraReal Fine-Tune:基于 FLUX.1-dev 模型的现实主义微调版本
UltraReal Fine-Tune 是基于 FLUX.1-dev 模型的一个微调版本,旨在通过训练者自己...