基于大模型微调的后门攻击

bfs • 2026年6月1日上午10:44 • 学术报告 • 阅读 1020

本学术报告围绕大模型微调中的后门攻击问题展开。内容涵盖：后门攻击的基本原理与主流微调方法；两种新型攻击技术的设计与危害分析；以及针对现有防御体系的不足与盲区，展望后门攻击的未来演进方向。报告旨在分享微调生态下的潜在风险，为后续相关安全研究提供技术梳理与启发思考。

2026060102424725

基于大模型微调的后门攻击下载

原创文章，作者：bfs，如若转载，请注明出处：https://www.isclab.org.cn/2026/06/01/%e5%9f%ba%e4%ba%8e%e5%a4%a7%e6%a8%a1%e5%9e%8b%e5%be%ae%e8%b0%83%e7%9a%84%e5%90%8e%e9%97%a8%e6%94%bb%e5%87%bb/

bfs

面向无人机系统的漏洞挖掘

上一篇 2026年6月1日上午10:41

机器合成数据生成与评价方法

下一篇 2026年6月8日上午9:55

学术报告

开放式信息抽取技术

本报告介绍了开放式信息抽取（OIE）的基本概念，展示了Neural OIE的两大类方法原理，并分别讲述了基于Transformer的Nerual OIE技术和利用Meta-Lear…

2023年5月4日
03.2K
学术报告

神经网络模型测试方法与模型健壮性

针对神经网络模型的缺陷测试使用了神经元覆盖率指标指导测试，这是一种从软件测试领域迁移的概念，指的是测试激活的神经元越多，测试越充分。但是近年来这种测试方法的有效性存疑，特别是测试生…

2022年7月24日
03.4K
学术报告

模型窃取

机器学习，尤其是神经网络，已广泛部署在行业环境中，模型通常被部署为预测服务。但是，具有对模型的查询访问权的对手可以窃取该模型以获得与远程目标模型基本一致的替代模型，这就是模型窃取攻…

2021年5月10日
45.4K
学术报告

程序崩溃的根本原因分析

程序崩溃的根本原因分析技术旨在通过分析崩溃时的输入数据，自动推断并定位导致崩溃的根本原因所在的位置，辅助开发人员快速修复软件缺陷。本次报告介绍了2个利用谓词进行程序崩溃的根本原因分…

2024年7月2日
13.0K
学术报告

基于图的课程推荐方法

课程推荐在人机协同、个性化学习平台等智能教育系统中具有重要价值，显著提升了模型对用户兴趣动态变化的建模能力与推荐效果。本次报告将介绍课程推荐任务，分析其研究背景与应用意义，并重点讲…

2025年4月22日
13.0K
学术报告

基于神经网络的源代码表示方法

简介：神经网络算法在自然语言和计算机视觉等领域取得了快速发展和成熟应用，且在程序分析领域也具有广泛应用，如代码克隆检测、程序分类、漏洞分析和代码搜索等任务。然而不同的程序源代码表示…

2020年7月19日
03.4K
学术报告

检索增强生成系统的知识投毒攻击

本报告围绕RAG系统知识投毒攻击展开：PoisonedRAG首次揭示知识库投毒攻击面，提出”检索条件+生成条件”的启发式分解框架；Joint-GCG在此基础…

2026年5月18日
01.4K
Boosting Methods

　　集成学习是机器学习领域中提升单一模型学习效果的典型方法，而Boosting则是集成学习中常用且效果良好的算法之一。通过将Weak learner巧妙地组合成Strong lea…

学术报告 2017年9月14日
12.8K
学术报告

特定安全领域中的对抗样本防御方法

以深度学习为代表的人工智能技术正在悄然改变人们的生产生活方式，但深度学习模型的部署也带来了一定的安全隐患。对抗样本攻击能使深度学习模型系统进行误判，对各个人工智能应用领域造成了严重…

2021年8月31日
13.4K
学术报告

无监督数据增强研究

面对渴求大量数据的深度学习，数据扩增方法可以缓和一部分需求，但数据扩增方法往往只应用在有监督学习设定中，带来…

2019年7月28日
13.2K

基于大模型微调的后门攻击

相关推荐