TextCraftor:通过微调文本编码器来提高文本到图像生成模型的性能,使得生成的图像更加精确地反映文本描述的内容
来自Snap和美国东北大学的研究人员推出文本编码器TextCraftor,它通过微调文本编...
多模态大语言模型LITA:专门设计来处理视频中的时间定位问题
英伟达推出多模态大语言模型LITA(Language Instructed Temporal-Localization As...
图像转换方法img2img-turbo:在单个步骤中完成复杂的图像转换任务,同时不需要成对的训练数据,适用于多种应用场景
来自卡内基梅隆大学和Adobe的研究人员推出新的图像转换方法img2img-turbo,它能够...
图像风格化技术B-LoRA:将单张图片中的风格和内容分离,从而实现高质量的图像风格化处理
来自特拉维夫大学和赖希曼大学的研究团队推出B-LoRA(Block Low-Rank Adaptation...
Meta推出新型框架OPT2I:通过优化文本提示(prompt)来提高文生图模型的图像与输入提示的一致性
Meta推出新型框架OPT2I,它旨在通过优化文本提示(prompt)来提高文本到图像(T2I...