大模型在微调阶段的后门攻击

随着大语言模型的快速发展与广泛应用,其安全问题日益凸显,后门攻击便是主要威胁之一。本次报告介绍了两种针对大模型微调阶段的后门攻击方法,它们分别通过确定目标生成条件和改变Token,提升攻击的隐蔽性与有效性。

大模型在微调阶段的后门攻击-满乐彤

原创文章,作者:bfs,如若转载,请注明出处:https://www.isclab.org.cn/2025/11/24/%e5%a4%a7%e6%a8%a1%e5%9e%8b%e5%9c%a8%e5%be%ae%e8%b0%83%e9%98%b6%e6%ae%b5%e7%9a%84%e5%90%8e%e9%97%a8%e6%94%bb%e5%87%bb/

(1)
bfsbfs
上一篇 2025年11月17日 下午5:28
下一篇 2025年11月25日 下午12:00

相关推荐

  • 二进制函数相似性分析

    本次报告介绍了二进制函数相似性分析的发展历史和主要变革,讲解了二进制相似性分析的主要方法,重点介绍了结构特征、语义特征的概念及应用原理。

    2022年11月28日
    1.3K
  • Ajax技术

      Ajax技术是创建交互式网页应用的网页开发技术,无需重新加载整个网页的情况下,能够更新部分网页的技术。Ajax 的特点在于异步交互,动态更新 web 页面,因此它的适用范围是交…

    学术报告 2017年11月11日
    1.2K
  • Linux应用软件安装使用原理扫盲

          Linux系统是大多数人常见但又不熟悉的操作系统,其在软件安装于使用方法上与Windows有较大的差异。本次…

    2018年12月17日
    1.1K
  • 面向数据异构与通信高效的联邦大模型优化与应用研究

    联邦大模型将联邦学习与大语言模型相结合,遵循“数据不动、模型动”的原则,在无需集中原始数据的前提下,共同训练与优化大模型。该技术能有效破解数据孤岛,为医疗、教育等领域提供隐私安全的…

    2025年10月27日
    1.2K
  • 深度神经网络对抗样本防御方法

    近年来深度学习技术不断突破,极大促进了人工智能行业的发展,但人工智能模型本身易受到对抗攻击从而引起严重后果。对原始样本有针对性地加入微小扰动,该扰动不易被人眼所察觉,但会导致人工智…

    2021年1月4日
    1.7K
  • 跨域开发与安全

    在大型项目开发时,可能会遇到多域名或多个ip之间使用ajax异步请求进行通信的情况,默认情况下,浏览器会阻断ajax对跨域请求的读取。本此报告介绍了开发中的跨域方案和跨域方案可能产…

    2020年9月14日
    1.5K
  • 二进制代码反编译技术

    二进制代码反编译技术在漏洞检测、恶意代码分析等逆向工程领域中具有重要应用,显著提升了全检安全分析的效率与深度。该技术有助于高效理解和重构二进制程序,支持其修复、维护与再开发。本次报…

    2025年4月9日
    1.4K
  • 法律文本可解释性研究

    法律文本可解释性研究是将可解释性研究方法应用到法律文本领域,旨在构建智慧法庭,辅助法官判案,实现法律检索和类案匹配。本次学术报告从案件罪名预测和相似案例匹配两个应用角度进行讲解,对…

    2020年11月22日
    1.3K
  • 代码摘要技术

    代码摘要(Code Summarization)是一项通过自动生成自然语言描述以解释目标代码的技术。其目标是帮助理解代码的功能和用途。通过本次学术报告对学习代码摘的学习,希望大家可…

    2024年9月23日
    1.1K