大模型在微调阶段的后门攻击

bfs • 2025 年 11 月 24 日 10:11 • 学术报告 • 阅读 159

随着大语言模型的快速发展与广泛应用，其安全问题日益凸显，后门攻击便是主要威胁之一。本次报告介绍了两种针对大模型微调阶段的后门攻击方法，它们分别通过确定目标生成条件和改变Token，提升攻击的隐蔽性与有效性。

原创文章，作者：BFS，如若转载，请注明出处：https://www.isclab.org.cn/2025/11/24/%e5%a4%a7%e6%a8%a1%e5%9e%8b%e5%9c%a8%e5%be%ae%e8%b0%83%e9%98%b6%e6%ae%b5%e7%9a%84%e5%90%8e%e9%97%a8%e6%94%bb%e5%87%bb/

对抗样本攻防的两种奇思妙想

« 上一篇 2025 年 11 月 17 日 17:28

2025年第22届信息安全与对抗技术竞赛“智能安全赛”获奖证书下载通知

下一篇 » 2025 年 11 月 25 日 12:00

大模型在微调阶段的后门攻击

相关推荐

请登录