谷歌推出新框架ImageInWords(IIW):创建准确且细节丰富的图像描述,以提高视觉-语言模型的训练效果 Google Research、Google DeepMind和华盛顿大学的研究团队推出新框架ImageInWords(IIW),此框架旨在创建准确且细节丰富的图像描述,以提高视觉-语言模型(VLMs... 新技术# IIW# ImageInWords# 数据集 10个月前04610
多内容数据集ImagiNet:为了提高合成图像检测的泛化能力而设计 保加利亚大特尔诺沃自然科学与数学高中、索非亚大学、保加利亚普罗夫迪夫数学高中和斯坦福大学的研究人员推出多内容数据集ImagiNet,它是为了提高合成图像检测的泛化能力而设计的。合成图像是由计算机生成的... 新技术# ImagiNet# 数据集 7个月前04490
Adobe推出Toffee:用于主题驱动的文本到图像生成的高效数据集构建方法 Adobe Research和加州大学圣克鲁斯分校的研究人员推出Toffee系统,它是一个用于主题驱动的文本到图像生成的高效数据集构建方法。简单来说,Toffee能够创建大量的图像和文本对,这些图像能... 新技术# Adobe Research# Toffee# 数据集 8个月前03870
BLIP3-KALE:包含2.18亿个图像-文本对的数据集 华盛顿大学、Salesforce Research、斯坦福大学和加州大学伯克利分校推出一个包含2.18亿个图像-文本对的数据集BLIP3-KALE,它弥合了描述性合成字幕和网络规模的事实性替代文本之间... 新技术# BLIP3-KALE# 数据集 3个月前02120
用于创建数据集的桌面工具qapyq:最新版增加了图像缩放、自动遮罩和裁剪功能,以及自动字幕功能 qapyq 是一款专为生成式 AI 模型的数据集整理、微调(finetune)和 LoRA 设计的图像查看器和编辑工具。它提供了丰富的功能,帮助用户高效地处理和准备图像数据,特别适合需要大量图像标注和... 工具# qapyq# 图像缩放# 数据集 2个月前01420
强调了结构化注释的使用!用于训练复杂图像-文本模型的大规模数据集LAION-SG 浙江大学、江南大学、北京大学、阿里巴巴集团和蚂蚁集团的研究人员推出一个用于训练复杂图像-文本模型的大规模数据集LAION-SG,特别强调了结构化注释的使用。LAION-SG通过提供场景图(Scene ... 新技术# LAION-SG# 数据集 2个月前01220