Flow-GRPO:将在线强化学习与流匹配模型相结合,用于提升文生图模型生成任务的性能香港中文大学MM实验室、清华大学、快手科技、南京大学和上海人工智能实验室推出新方法Flow-GRPO,它将在线强化学习(Reinforcement Learning, RL)与流匹配(Flow Mat...新技术# Flow-GRPO# 强化学习# 流匹配7个月前03440