大模型在微调阶段的后门攻击

bfs • 2025年11月24日上午10:11 • 学术报告 • 阅读 1348

随着大语言模型的快速发展与广泛应用，其安全问题日益凸显，后门攻击便是主要威胁之一。本次报告介绍了两种针对大模型微调阶段的后门攻击方法，它们分别通过确定目标生成条件和改变Token，提升攻击的隐蔽性与有效性。

原创文章，作者：bfs，如若转载，请注明出处：https://www.isclab.org.cn/2025/11/24/%e5%a4%a7%e6%a8%a1%e5%9e%8b%e5%9c%a8%e5%be%ae%e8%b0%83%e9%98%b6%e6%ae%b5%e7%9a%84%e5%90%8e%e9%97%a8%e6%94%bb%e5%87%bb/

bfs

对抗样本攻防的两种奇思妙想

上一篇 2025年11月17日下午5:28

2025年第22届信息安全与对抗技术竞赛“智能安全赛”获奖证书下载通知

下一篇 2025年11月25日下午12:00

学术报告

二进制函数相似性分析

本次报告介绍了二进制函数相似性分析的发展历史和主要变革，讲解了二进制相似性分析的主要方法，重点介绍了结构特征、语义特征的概念及应用原理。

2022年11月28日
01.3K
Ajax技术

　　Ajax技术是创建交互式网页应用的网页开发技术，无需重新加载整个网页的情况下，能够更新部分网页的技术。Ajax 的特点在于异步交互，动态更新 web 页面，因此它的适用范围是交…

学术报告 2017年11月11日
01.2K
学术报告

Linux应用软件安装使用原理扫盲

Linux系统是大多数人常见但又不熟悉的操作系统，其在软件安装于使用方法上与Windows有较大的差异。本次…

2018年12月17日
01.1K
学术报告

面向数据异构与通信高效的联邦大模型优化与应用研究

联邦大模型将联邦学习与大语言模型相结合，遵循“数据不动、模型动”的原则，在无需集中原始数据的前提下，共同训练与优化大模型。该技术能有效破解数据孤岛，为医疗、教育等领域提供隐私安全的…

2025年10月27日
01.2K
学术报告

深度神经网络对抗样本防御方法

近年来深度学习技术不断突破，极大促进了人工智能行业的发展，但人工智能模型本身易受到对抗攻击从而引起严重后果。对原始样本有针对性地加入微小扰动，该扰动不易被人眼所察觉，但会导致人工智…

2021年1月4日
11.7K
学术报告

跨域开发与安全

在大型项目开发时，可能会遇到多域名或多个ip之间使用ajax异步请求进行通信的情况，默认情况下，浏览器会阻断ajax对跨域请求的读取。本此报告介绍了开发中的跨域方案和跨域方案可能产…

2020年9月14日
21.5K
学术报告

二进制代码反编译技术

二进制代码反编译技术在漏洞检测、恶意代码分析等逆向工程领域中具有重要应用，显著提升了全检安全分析的效率与深度。该技术有助于高效理解和重构二进制程序，支持其修复、维护与再开发。本次报…

2025年4月9日
01.4K
学术报告

法律文本可解释性研究

法律文本可解释性研究是将可解释性研究方法应用到法律文本领域，旨在构建智慧法庭，辅助法官判案，实现法律检索和类案匹配。本次学术报告从案件罪名预测和相似案例匹配两个应用角度进行讲解，对…

2020年11月22日
01.3K
学术报告

代码摘要技术

代码摘要（Code Summarization）是一项通过自动生成自然语言描述以解释目标代码的技术。其目标是帮助理解代码的功能和用途。通过本次学术报告对学习代码摘的学习，希望大家可…

2024年9月23日
11.1K
学术报告

文本表示方法（一）——空间向量模型

2014年10月19日
01.3K

大模型在微调阶段的后门攻击

相关推荐