奖励模型

卡内基梅隆大学的研究人员推出奖励模型（一种基于偏好学习的方法）VADER，来指导视频生成过程，从而让模型更有效地学习如何生成符合特定要求的视频。例如，你想要生成一段描述“一只穿着红色外套、拿着雪球的浣...

2年前

06070