DuPO框架

共 1 篇文章

排序

发布更新浏览点赞

DuPO框架：通过双学习和偏好优化的方法，使大语言模型能够在没有标注数据的情况下进行自我验证和优化

DuPO框架：通过双学习和偏好优化的方法，使大语言模型能够在没有标注数据的情况下进行自我验证和优化

字节跳动Seed团队和南京大学的研究人员推出DuPO框架，它通过双学习（dual learning）和偏好优化（preference optimization）的方法，使大语言模型（LLMs）能够在没...

新技术 # DuPO框架 # 大语言模型

7个月前

01900