本学术报告围绕大模型微调中的后门攻击问题展开。内容涵盖:后门攻击的基本原理与主流微调方法;两种新型攻击技术的设计与危害分析;以及针对现有防御体系的不足与盲区,展望后门攻击的未来演进方向。报告旨在分享微调生态下的潜在风险,为后续相关安全研究提供技术梳理与启发思考。
2026060102424725原创文章,作者:bfs,如若转载,请注明出处:https://www.isclab.org.cn/2026/06/01/%e5%9f%ba%e4%ba%8e%e5%a4%a7%e6%a8%a1%e5%9e%8b%e5%be%ae%e8%b0%83%e7%9a%84%e5%90%8e%e9%97%a8%e6%94%bb%e5%87%bb/