新型图像生成模型FiT:基于Transformer架构,可以生成无限制分辨率和长宽比的图像 FiT(Flexible Vision Transformer)是一款新型图像生成模型,基于Transformer架构,旨在生成具有无限制分辨率和长宽比的图像。 GitHub 论文 模型 传统的图像生... 新技术# FiT# Transformer# 图像生成模型 1年前06270