LIFT:利用人类反馈进行文生视频模型对齐的新型微调方法 文本到视频(T2V)生成模型近年来取得了显著进展,能够生成高质量的合成视频。然而,这些模型在将合成视频与人类偏好(例如,准确反映文本描述)对齐方面仍然存在不足。复旦大学、上海人工智能科学院和阿德莱德大... 视频模型# LIFT# 微调# 文生视频模型 2周前01220