RewardDance

共 1 篇文章

排序

发布更新浏览点赞

RewardDance：用生成式奖励重塑视觉强化学习，让AI生成的图像和视频真正“理解”你的需求

RewardDance：用生成式奖励重塑视觉强化学习，让AI生成的图像和视频真正“理解”你的需求

在视觉生成领域，强化学习（Reinforcement Learning, RL）正成为提升模型表现的关键手段。其中，奖励模型（Reward Model, RM）作为引导生成方向的核心组件，直接影响最终...

新技术 # RewardDance # 字节跳动

7个月前

01410