半策略偏好优化方法SePPO:用于优化和微调文生图模型,使其更好地符合人类的审美和偏好 罗切斯特大学、普渡大学、延世大学、腾讯 AI 实验室和华盛顿大学的研究人员推出半策略偏好优化方法SePPO,用于优化和微调扩散模型(如用于生成图像的模型),使其更好地符合人类的审美和偏好,而无需依赖外... 新技术# SePPO# 半策略偏好优化# 文生图模型 5个月前02330