大模型在微调阶段的后门攻击

bfs • 2025年11月24日上午10:11 • 学术报告 • 阅读 2249

随着大语言模型的快速发展与广泛应用，其安全问题日益凸显，后门攻击便是主要威胁之一。本次报告介绍了两种针对大模型微调阶段的后门攻击方法，它们分别通过确定目标生成条件和改变Token，提升攻击的隐蔽性与有效性。

原创文章，作者：bfs，如若转载，请注明出处：https://www.isclab.org.cn/2025/11/24/%e5%a4%a7%e6%a8%a1%e5%9e%8b%e5%9c%a8%e5%be%ae%e8%b0%83%e9%98%b6%e6%ae%b5%e7%9a%84%e5%90%8e%e9%97%a8%e6%94%bb%e5%87%bb/

bfs

对抗样本攻防的两种奇思妙想

上一篇 2025年11月17日下午5:28

2025年第22届信息安全与对抗技术竞赛“智能安全赛”获奖证书下载通知

下一篇 2025年11月25日下午12:00

学术报告

强化学生个性的知识追踪

知识追踪是缓解基础教育普及需求和严重不足的教师数量之间矛盾的一个关键途径。目前，提高知识追踪的个性化水平是研究重点之一。本次报告介绍了两类强化学生个性的知识追踪技术，包括额外个性化…

2023年12月27日
01.6K
学术报告

并查集算法及其在约束传递中的应用

<img src="https://www.isclab.org.cn/wp-content/uploads/2015/06/41.png" alt=&q…

2015年6月15日
01.7K
学术报告

图半监督学习

图半监督学习是半监督学习中的一种，基于聚类假设和流形假设，利用少量的有标记样本和大量的未标记样本，提高训练得…

2018年9月3日
01.8K
学术报告

多标签学习综述

多标签学习的研究对于多义性对象的学习建模具有十分重要的意义，现已逐渐成为机器学习界一个新的研究热点。本次报告…

2019年7月10日
02.4K
学术报告

二进制程序中加解密函数的定位

模糊测试是一种应用广泛的自动化漏洞挖掘方法，但当被测程序使用加密算法处理输入数据时，对输入数据的直接变异并不…

2018年6月19日
01.8K
学术报告

深度学习系统的自动化测试简介

深度学习（DL）在图像分类、语音识别等领域达到或超过了人类水平的性能，且被广泛应用于安全关键领域中（自动驾驶、恶意软件检测等）。然而一些原因（如训练数据偏差、模型过拟合或欠拟合），…

2020年7月12日
12.6K
学术报告

开放式信息抽取技术

本报告介绍了开放式信息抽取（OIE）的基本概念，展示了Neural OIE的两大类方法原理，并分别讲述了基于Transformer的Nerual OIE技术和利用Meta-Lear…

2023年5月4日
02.1K
学术报告

使用Python进行并发编程

本次报告首先介绍了线程、进程的概念，由此讲解操作系统中实现并发编程的三种方式，着重介绍了Python语言下多线程、多进程、协程的编程方法，并结合开发实际，给出了在线程、进程、协程之…

2020年2月27日
02.2K
学术报告

Android MediaRecorder架构详解

1. 简介在android中录制音频有两种方式，MediaRecorder和AudioRecord。两者的区别如下： (1) MediaRecorder 简单方便，不需要理会中间…

2014年12月7日
53.0K
学术报告

频繁项集算法分析

一、什么是频繁项集项集是指事项的集合，而频繁项集就是频繁出现在数据集中的项集，说白了就在数据集中“出现次数足够多”的项集。其中，项集的出现频度是指包含项集的事务的数量，简称为项集…

2015年6月18日
03.1K

大模型在微调阶段的后门攻击

相关推荐