数据集

排序

发布更新浏览点赞

谷歌推出新框架ImageInWords（IIW）：创建准确且细节丰富的图像描述，以提高视觉-语言模型的训练效果

Google Research、Google DeepMind和华盛顿大学的研究团队推出新框架ImageInWords（IIW），此框架旨在创建准确且细节丰富的图像描述，以提高视觉-语言模型（VLMs...

2年前

07020

Adobe推出Toffee：用于主题驱动的文本到图像生成的高效数据集构建方法

Adobe Research和加州大学圣克鲁斯分校的研究人员推出Toffee系统，它是一个用于主题驱动的文本到图像生成的高效数据集构建方法。简单来说，Toffee能够创建大量的图像和文本对，这些图像能...

新技术 # Adobe Research # Toffee # 数据集

2年前

06700

多内容数据集ImagiNet：为了提高合成图像检测的泛化能力而设计

保加利亚大特尔诺沃自然科学与数学高中、索非亚大学、保加利亚普罗夫迪夫数学高中和斯坦福大学的研究人员推出多内容数据集ImagiNet，它是为了提高合成图像检测的泛化能力而设计的。合成图像是由计算机生成的...

新技术 # ImagiNet # 数据集

2年前

06540

BLIP3-KALE：包含2.18亿个图像-文本对的数据集

华盛顿大学、Salesforce Research、斯坦福大学和加州大学伯克利分校推出一个包含2.18亿个图像-文本对的数据集BLIP3-KALE，它弥合了描述性合成字幕和网络规模的事实性替代文本之间...

新技术 # BLIP3-KALE # 数据集

1年前

04270

EleutherAI 发布首个大规模许可训练数据集 The Common Pile v0.1

近日，开源人工智能研究组织 EleutherAI 正式发布了名为 The Common Pile v0.1 的全新训练数据集。该数据集据称是目前用于训练 AI 模型的最大合法授权+公共领域文本集合之一...

大语言模型 # EleutherAI # The Common Pile v0.1 # 数据集

10个月前

03970

用于创建数据集的桌面工具qapyq：最新版增加了图像缩放、自动遮罩和裁剪功能，以及自动字幕功能

qapyq 是一款专为生成式 AI 模型的数据集整理、微调（finetune）和 LoRA 设计的图像查看器和编辑工具。它提供了丰富的功能，帮助用户高效地处理和准备图像数据，特别适合需要大量图像标注和...

工具 # qapyq # 图像缩放 # 数据集

1年前

03890

Janus-4o：基于数据集 ShareGPT-4o-Image 的新型多模态图像生成模型

香港中文大学（深圳）的研究人员推出了一项重要的多模态研究成果 —— ShareGPT-4o-Image 数据集及其衍生的开源多模态大语言模型 Janus-4o。该研究旨在将 GPT-4o 在图像生...

图像模型 # Janus-4o # ShareGPT-4o-Image # 数据集

9个月前

03740

强调了结构化注释的使用！用于训练复杂图像-文本模型的大规模数据集LAION-SG

浙江大学、江南大学、北京大学、阿里巴巴集团和蚂蚁集团的研究人员推出一个用于训练复杂图像-文本模型的大规模数据集LAION-SG，特别强调了结构化注释的使用。LAION-SG通过提供场景图（Scene ...

新技术 # LAION-SG # 数据集

1年前

03060

没有了