OBLITERATUS OBLITERATUS 是一个最先进的开源工具包,它不通过重新训练或微调来“覆盖”模型的价值观,而是利用机械可解释性(Mechanistic Interpretability)技术,精准定位并手术式移除那些负责拒绝行为的内部权重方向。010AI工具# OBLITERATUS# 模型训练