大模型在微调阶段的后门攻击

bfs • 2025年11月24日上午10:11 • 学术报告 • 阅读 1182

随着大语言模型的快速发展与广泛应用，其安全问题日益凸显，后门攻击便是主要威胁之一。本次报告介绍了两种针对大模型微调阶段的后门攻击方法，它们分别通过确定目标生成条件和改变Token，提升攻击的隐蔽性与有效性。

原创文章，作者：bfs，如若转载，请注明出处：https://www.isclab.org.cn/2025/11/24/%e5%a4%a7%e6%a8%a1%e5%9e%8b%e5%9c%a8%e5%be%ae%e8%b0%83%e9%98%b6%e6%ae%b5%e7%9a%84%e5%90%8e%e9%97%a8%e6%94%bb%e5%87%bb/

bfs

对抗样本攻防的两种奇思妙想

上一篇 2025年11月17日下午5:28

2025年第22届信息安全与对抗技术竞赛“智能安全赛”获奖证书下载通知

下一篇 2025年11月25日下午12:00

Web应用模糊测试技术

模糊测试是一种通过提供非预期的输入并监视异常结果来发现软件故障的方法。Web应用对于软件提供商和终端用户都具有优越性，针对Web应用…

学术报告 2017年11月13日
0922
学术报告

机器学习中的凸优化

机器学习模型一般可化简为求解一个目标函数/损失函数的最优化问题，根据优化目标及约束的不同，可划分为凸优化（C…

2018年11月20日
11.6K
数据挖掘

Bias-Variance trade-off 启发式参数优化算法举例参数寻优：梯度下降/牛顿下降法追根溯源频繁项集算法分析并查集算法及其在约束传递中的应用 Floyd解决…

学术报告 2014年10月18日
01.3K
学术报告

程序的链接

本次报告介绍了程序链接过程的基本概念，以及静态链接和动态链接中文件的结构和链接过程。基本概念包括程序构建（Build）过程、链接的历史和链接的作用等。链接的主要工作就是处理各个模块…

2021年3月15日
31.4K
数据挖掘项目实战

数据挖掘项目实战，主要以kaggle竞赛平台Titanic生存预测为例详细讲解数据挖掘项目的工作流程，具体包…

学术报告 2018年5月2日
01.2K
学术报告

DQN深度强化学习算法

本次学术报告主要给大家详细的介绍DQN算法原理及其调参细节，并且进行举例说明和总结以加深大家的理解。

2020年5月31日
21.4K
学术报告

Web快速开发方法简介

本次报告先介绍了五种Web开发模式，讲解了各种开发模式的结构和优缺点，并结合实验室内部情况对合适的开发模式进行了推荐。之后简单介绍了Django、Flask、CherryPy这三个…

2020年1月13日
21.4K
学术报告

联邦学习的后门攻击方法

联邦学习在保证数据安全和隐私的情况下解决了数据孤岛和数据碎片化问题，主要分为横向联邦学习、纵向联邦学习和联邦迁移学习。本次学术报告首先介绍联邦学习的历史现状、分类及应用场景，然后通…

2022年8月30日
31.8K
文本安全

动态规划——最小编辑代价序列标注模型命名实体识别简介文本表示方法（一）——空间向量模型文本表示方法（二）——潜在语义分析文本表示方法(三)——topic models i…

学术报告 2014年10月18日
1953
学术报告

大规模多标签分类方法

近年来，随着互联网技术的高速发展和数据规模的快速增长、大数据的应用，多标签分类应用场景越来越多，如电子商务中的商品分类、网页标签、新闻标注、蛋白质功能分类、音乐分类、语义场景分类等…

2020年12月13日
22.7K

大模型在微调阶段的后门攻击

相关推荐