BLIP3-KALE

华盛顿大学、Salesforce Research、斯坦福大学和加州大学伯克利分校推出一个包含2.18亿个图像-文本对的数据集BLIP3-KALE，它弥合了描述性合成字幕和网络规模的事实性替代文本之间...

1年前

04270