HereticHeretic 是一款开源工具,通过参数消融(parameter ablation)技术,在不进行后训练的前提下,降低语言模型对特定提示的拒绝率(即减少“安全对齐”行为),同时最大限度保留原始模型的语言能力。0110AI工具# Heretic# 安全对齐