大型文本到图像提示数据集StyleBreeder:包含680万张图片及180万个提示词

弗吉尼亚理工大学、苏黎世联邦理工学院、慕尼黑工业大学、谷歌和Artbreeder的研究人员推出大型文本到图像提示数据集StyleBreeder,它通过使用文本到图像的生成模型,探索和推广了艺术风格的多样性,使得艺术创作更加民主化。StyleBreeder是一个由包含680万张图片及180万个提示词组成的大型数据集,这些数据由Artbreeder平台上的9.5万用户生成。

研究人员利用这一数据集,设计了一系列任务,旨在辨识多样化的艺术风格、生成个性化作品,并根据用户的偏好推荐艺术风格。通过记录超越传统标签如“赛博朋克”或“毕加索风格”的独特用户原创风格,探索了能深入洞察全球用户集体创意心智的新型众包风格的可能性。此外,研究人员评估了多种个性化技术以增强艺术表现力,并推出了风格图谱,将相关模型以LoRA格式公开,便于公众使用。

主要功能:

  • 艺术风格识别:通过聚类分析,识别和分类不同的艺术风格。
  • 个性化内容生成:根据用户的喜好和历史数据,生成符合用户审美的个性化图像。
  • 风格推荐:基于用户的兴趣和之前的创作,推荐新的风格。

主要特点:

  • 大规模数据集:包含数百万用户生成的图像和文本提示。
  • 多样性:涵盖了广泛的艺术风格,包括传统和现代,以及用户自定义的风格。
  • 民主化艺术:降低了艺术创作的门槛,让更多人能够参与到艺术创作中。

工作原理:

  1. 数据收集:从Artbreeder平台收集用户生成的图像和相关的文本提示。
  2. 风格分析:使用特征提取器将图像转换为风格嵌入,然后通过聚类算法对这些嵌入进行分组,以识别不同的风格。
  3. 个性化生成:利用不同的个性化技术,如文本反转(Textual Inversion)或低秩适应(LoRA),根据特定风格生成新的图像。
  4. 风格推荐系统:通过分析用户的历史创作,使用矩阵分解算法推荐用户可能感兴趣的风格。

具体应用场景:

  • 艺术创作:艺术家和设计师使用StyleBreeder来探索新的风格并创作数字艺术作品。
  • 教育:在艺术和设计教育中,作为教学工具帮助学生理解不同的艺术风格。
  • 娱乐:普通用户可以利用这个平台进行娱乐,尝试创作个性化的图像。
  • 研究:研究人员可以使用这个数据集来研究艺术风格的演变,或者开发新的图像生成和编辑技术。
0

评论0

没有账号?注册  忘记密码?