大模型在微调阶段的后门攻击

随着大语言模型的快速发展与广泛应用,其安全问题日益凸显,后门攻击便是主要威胁之一。本次报告介绍了两种针对大模型微调阶段的后门攻击方法,它们分别通过确定目标生成条件和改变Token,提升攻击的隐蔽性与有效性。

大模型在微调阶段的后门攻击-满乐彤

原创文章,作者:bfs,如若转载,请注明出处:https://www.isclab.org.cn/2025/11/24/%e5%a4%a7%e6%a8%a1%e5%9e%8b%e5%9c%a8%e5%be%ae%e8%b0%83%e9%98%b6%e6%ae%b5%e7%9a%84%e5%90%8e%e9%97%a8%e6%94%bb%e5%87%bb/

(1)
bfsbfs
上一篇 2025年11月17日 下午5:28
下一篇 2025年11月25日 下午12:00

相关推荐

  • 基于深度学习的二进制软件漏洞挖掘

    本次学术报告面向基于深度学习的二进制软件漏洞挖掘,首先定义二进制缺陷检测子任务的基本概念和TIPO,其后介绍模糊测试、符号执行等动态缺陷检测方法,最终具体讲解了三种基于深度学习的二…

    2020年8月2日
    3.0K
  • 关联规则分析相关算法介绍

          关联规则分析是以中基于规则的机器学习算法,也是一种用于知识发现的算法。可以在大数据中发现感兴趣的关系,目的是…

    2018年9月25日
    2.4K
  • 差分隐私原理及应用

    大数据时代隐私泄露成为了一个严重的问题,大量的个人信息在网上传播。另一方面大数据时代对数据的可用性也有一定的要求。因此当前如何在保障用户的隐私的同时,提供一定的可用性成为一个关键问…

    2020年5月17日
    3.7K
  • GBDT梯度提升决策树

          梯度提升决策树(GBDT)是集成学习中梯度提升方法(Gradient Boost)与决策树(Decision…

    2018年5月7日
    2.1K
  • EM算法的应用——GMM的参数估计

            EM(Expectation-maximization)算法是机器学习十大算法之一。…

    2014年12月11日
    4.2K
  • Linux高级网络配置

          Linux系统强大的网络配置能力使得Linux能够工作在各种复杂网络环境下并提供各种稳定的服务。本次报告介绍…

    2019年5月13日
    2.2K
  • Android消息机制

    Android消息机制,主要讲解Android系统内部不同线程之间的信息交互,具体介绍了MessageQueue、Looper和Handler三者之间的交互和各自的原理。 附件-A…

    学术报告 2018年4月3日
    2.2K
  • 动态规划算法简介

    1 基本概念 维基百科对动态规划(Dynamic programming,DP)的定义:它是一种在数学、计算机科学和经济学中使用的,通过把原问题分解为相对简单的子问题的方式求解复杂…

    2015年1月29日
    2.5K
  • 超图对比学习

    超图对比学习是一种利用超图结构来捕捉节点间复杂关系,并通过对比学习机制来优化节点表示的学习方法。本次报告通过两个算法,从超图增强技术、对比损失形式和对比训练策略三个方面介绍超图对比…

    2024年8月19日
    2.0K
  • Floyd解决传递闭包

    传递闭包:在数学上的定义——在集合X上的二元关系R的传递闭包是包含R的X上的最小传递关系。其中定义域是数据集X,而运算关系是必须具有传递性,这里的最小传递关系指的是包含所有可达路径…

    2015年3月10日
    2.4K