不影响性能!Perplexity 开源基于DeepSeek-R1推出的无审查版本R1 1776

大语言模型20小时前发布 小马良
2 0

R1 1776Perplexity基于DeepSeek-R1推出的无审查版本,该模型号称提供公正、准确和真实的信息,同时保持高推理能力。目前,用户可以在 HuggingFace 上下载该模型,或者通过 Perplexity 的 Sonar API 使用。

评估

为了确保模型保持完全“无审查”,并且能够处理广泛的敏感话题,Perplexity策划了一个包含 1000 多个示例的多样化、多语言评估集,全面涵盖了此类主题。然后,Perplexity使用人工标注员以及精心设计的 LLM 评判员来衡量模型回避或提供过于净化的响应查询的可能性。

不影响性能!Perplexity 开源基于DeepSeek-R1推出的无审查版本R1 1776

Perplexity还确保模型的数学和推理能力在去审查过程后保持不变。对多个基准的评估表明,Perplexity的后训练模型与基础 R1 模型表现相当,表明去审查对推理性能无影响。

不影响性能!Perplexity 开源基于DeepSeek-R1推出的无审查版本R1 1776

PS:说是无审查,但是有人工标注员,也只是从一个价值观调到另一个价值观罢了!

© 版权声明

相关文章

暂无评论

none
暂无评论...