大模型在微调阶段的后门攻击

随着大语言模型的快速发展与广泛应用,其安全问题日益凸显,后门攻击便是主要威胁之一。本次报告介绍了两种针对大模型微调阶段的后门攻击方法,它们分别通过确定目标生成条件和改变Token,提升攻击的隐蔽性与有效性。

大模型在微调阶段的后门攻击-满乐彤

原创文章,作者:bfs,如若转载,请注明出处:https://www.isclab.org.cn/2025/11/24/%e5%a4%a7%e6%a8%a1%e5%9e%8b%e5%9c%a8%e5%be%ae%e8%b0%83%e9%98%b6%e6%ae%b5%e7%9a%84%e5%90%8e%e9%97%a8%e6%94%bb%e5%87%bb/

(1)
bfsbfs
上一篇 2025年11月17日 下午5:28
下一篇 2025年11月25日 下午12:00

相关推荐

  • 强化学生个性的知识追踪

    知识追踪是缓解基础教育普及需求和严重不足的教师数量之间矛盾的一个关键途径。目前,提高知识追踪的个性化水平是研究重点之一。本次报告介绍了两类强化学生个性的知识追踪技术,包括额外个性化…

    2023年12月27日
    1.6K
  • 并查集算法及其在约束传递中的应用

    <img src="https://www.isclab.org.cn/wp-content/uploads/2015/06/41.png" alt=&q…

    2015年6月15日
    1.7K
  • 图半监督学习

          图半监督学习是半监督学习中的一种,基于聚类假设和流形假设,利用少量的有标记样本和大量的未标记样本,提高训练得…

    2018年9月3日
    1.8K
  • 多标签学习综述

          多标签学习的研究对于多义性对象的学习建模具有十分重要的意义,现已逐渐成为机器学习界一个新的研究热点。本次报告…

    2019年7月10日
    2.4K
  • 二进制程序中加解密函数的定位

          模糊测试是一种应用广泛的自动化漏洞挖掘方法,但当被测程序使用加密算法处理输入数据时,对输入数据的直接变异并不…

    2018年6月19日
    1.8K
  • 深度学习系统的自动化测试简介

    深度学习(DL)在图像分类、语音识别等领域达到或超过了人类水平的性能,且被广泛应用于安全关键领域中(自动驾驶、恶意软件检测等)。然而一些原因(如训练数据偏差、模型过拟合或欠拟合),…

    2020年7月12日
    2.6K
  • 开放式信息抽取技术

    本报告介绍了开放式信息抽取(OIE)的基本概念,展示了Neural OIE的两大类方法原理,并分别讲述了基于Transformer的Nerual OIE技术和利用Meta-Lear…

    2023年5月4日
    2.1K
  • 使用Python进行并发编程

    本次报告首先介绍了线程、进程的概念,由此讲解操作系统中实现并发编程的三种方式,着重介绍了Python语言下多线程、多进程、协程的编程方法,并结合开发实际,给出了在线程、进程、协程之…

    2020年2月27日
    2.2K
  • Android MediaRecorder架构详解

    1. 简介 在android中录制音频有两种方式,MediaRecorder和AudioRecord。两者的区别如下: (1) MediaRecorder 简单方便,不需要理会中间…

    2014年12月7日
    3.0K
  • 频繁项集算法分析

    一、 什么是频繁项集项集是指事项的集合,而频繁项集就是频繁出现在数据集中的项集,说白了就在数据集中“出现次数足够多”的项集。其中,项集的出现频度是指包含项集的事务的数量,简称为项集…

    2015年6月18日
    3.1K