#Heretic #Python #TGAgent
Heretic 是一个用于移除语言模型审查限制(即“安全对齐”)的全自动工具。它基于方向消融(abliteration)技术和 Optuna 参数优化器,无需进行昂贵的二次训练。该工具通过联合优化拒绝回答的次数和 KL 散度,在解除模型审查的同时尽可能保留原模型的智力表现与性能。项目支持大多数 dense 模型、多模态模型及 MoE 架构,只需基础的命令行知识即可运行。
https://github.com/p-e-w/heretic
📡 来源:@shenzjd_com
Heretic 是一个用于移除语言模型审查限制(即“安全对齐”)的全自动工具。它基于方向消融(abliteration)技术和 Optuna 参数优化器,无需进行昂贵的二次训练。该工具通过联合优化拒绝回答的次数和 KL 散度,在解除模型审查的同时尽可能保留原模型的智力表现与性能。项目支持大多数 dense 模型、多模态模型及 MoE 架构,只需基础的命令行知识即可运行。
https://github.com/p-e-w/heretic
📡 来源:@shenzjd_com