文本生成大模型后门攻击研究

研究文本生成大模型的后门攻击,揭示了现有文本大模型的后门风险。本次学术报告详细介绍了现有文本生成模型的后门分类方法以及基准数据集,在文本大模型的多个下游任务实现了后门攻击,并总结了现有所使用的主流方法,最后提出了领域所面临的挑战和未来发展方向。

文本生成大模型后门攻击研究-赵怡清

原创文章,作者:bfs,如若转载,请注明出处:https://www.isclab.org.cn/2025/03/24/%e6%96%87%e6%9c%ac%e7%94%9f%e6%88%90%e5%a4%a7%e6%a8%a1%e5%9e%8b%e5%90%8e%e9%97%a8%e6%94%bb%e5%87%bb%e7%a0%94%e7%a9%b6/

(1)
bfsbfs
上一篇 2025年3月17日 上午11:06
下一篇 2025年3月31日 上午11:12

相关推荐

  • 基于深度学习的恶意流量检测方法

    近年来,基于机器学习的算法在恶意流量检测领域中越来越流行,但此类算法通常使用浅层模型,在训练之前需要一组专家手工制作的特征来预处理数据。此类方法的主要问题是,在不同类型的场景下,手…

    2020年12月27日
    3.9K
  • 大模型赋能的模糊测试用例生成技术

    随着大模型技术的兴起和发展,软件漏洞模糊测试方法在新技术的赋能下,可以实现更好的代码覆盖率和漏洞发现数量。本次学术报告针对结合大模型实现模糊测试用例生成的方法,介绍了Fuzz4Al…

    2024年9月3日
    1.6K
  • 面向生成模型的模型窃取方法

    针对判别模型窃取及防御方法的研究日趋成熟,近期的研究表明,生成模型同样面临模型窃取威胁。本次学术报告重点介绍了关于生成模型的窃取方法的原理,以及其与判别模型窃取方法、评价指标的区别…

    2022年7月19日
    1.5K
  • 跨语言命名实体识别

    跨语言命名实体识别是用源语言的标记数据训练NER模型,并在目标语言的测试数据上对其进行评估。其利用具有丰富实体标签的高资源(源)语言(如英语)的知识来克服低(零)资源(目标)语言的…

    2024年5月18日
    1.5K
  • 认知诊断技术及其研究

    认知诊断广泛适用于教育教学、临床测量等需要评估用户认知状态的场景。研究智能教育领域下的认知诊断有助于发现学生的认知缺陷,从而进行个性化精准干预。本次学术报告讲述了认知诊断的基本概念…

    2023年9月16日
    1.2K
  • 操作系统结构与内核安全基础

      虽然每个电脑使用者都听说过操作系统,但是大部分人对于操作系统的结构,以及平时计算机安全领域常常提到的“操作系统内核”是十分陌生的。  本次学术报告为大家讲解了操作系统最基本的结…

    学术报告 2017年8月30日
    1.4K
  • 基于协同过滤的推荐算法

          推荐系统在现在的生活中随处可见,淘宝天猫的商品推荐,音乐软件的每日歌曲推荐等,协同过滤就是一种很受欢迎的推荐…

    2018年8月27日
    1.3K
  • 协议模糊测试方法

    本次报告围绕协议模糊测试方法展开,从提升协议模糊测试效率和有效性上考虑,要满足以下三个层面内容:1、数据生成角度:生成的测试用例要符合协议规范;2、数据传输角度:生成的测试用例能够…

    2026年3月1日
    336
  • 图半监督学习

          图半监督学习是半监督学习中的一种,基于聚类假设和流形假设,利用少量的有标记样本和大量的未标记样本,提高训练得…

    2018年9月3日
    1.2K
  • 软件漏洞检测及其严重性评估

    本报告介绍了漏洞检测的基本方法以及基于漏洞代码的漏洞评估的概念和评估方法。针对一种漏洞检测方式和一种漏洞评估方式进行了深入讲解,并探讨了漏洞检测和评估领域的现状,提出了一些未来发展…

    2023年3月27日
    1.4K