LIFT

文本到视频（T2V）生成模型近年来取得了显著进展，能够生成高质量的合成视频。然而，这些模型在将合成视频与人类偏好（例如，准确反映文本描述）对齐方面仍然存在不足。复旦大学、上海人工智能科学院和阿德莱德大...

1年前

03610