文本生成大模型后门攻击研究

研究文本生成大模型的后门攻击,揭示了现有文本大模型的后门风险。本次学术报告详细介绍了现有文本生成模型的后门分类方法以及基准数据集,在文本大模型的多个下游任务实现了后门攻击,并总结了现有所使用的主流方法,最后提出了领域所面临的挑战和未来发展方向。

文本生成大模型后门攻击研究-赵怡清

原创文章,作者:bfs,如若转载,请注明出处:https://www.isclab.org.cn/2025/03/24/%e6%96%87%e6%9c%ac%e7%94%9f%e6%88%90%e5%a4%a7%e6%a8%a1%e5%9e%8b%e5%90%8e%e9%97%a8%e6%94%bb%e5%87%bb%e7%a0%94%e7%a9%b6/

(1)
bfsbfs
上一篇 2025年3月17日 上午11:06
下一篇 2025年3月31日 上午11:12

相关推荐

  • 对抗环境下的鲁棒机器学习

    对抗样本的存在表明现代神经网络是相当脆弱的。为解决这一问题,研究者相继提出了许多方法,其中使用对抗样本进行训练被认为是至今最有效的方法之一。 然而,经过对抗训练后神经网络对于正常样…

    2021年1月21日
    1.6K
  • 缺失模态的情绪变化识别

    随着多模态情绪识别应用不断发展,真实场景中的模态缺失问题对模型鲁棒性提出了挑战。本次学术报告聚焦缺失模态下的情绪变化识别,介绍了基于单模态专家融合与难度感知课程学习的代表性方法,为…

    2025年12月30日
    1.1K
  • 多标签学习综述

          多标签学习的研究对于多义性对象的学习建模具有十分重要的意义,现已逐渐成为机器学习界一个新的研究热点。本次报告…

    2019年7月10日
    1.7K
  • 网络未知协议逆向技术

    网络协议逆向技术是指根据网络流量数据包进行静态分析,推断其所属协议的字段信息、报文格式、交互模式等信息。针对互联网中存在的大量未知(私有)协议进行逆向分析,发现潜在安全漏洞,对维护…

    2024年12月23日
    1.5K
  • 胶囊(向量神经)网络

        胶囊(向量神经)网络是针对CNN的缺陷提出的一种新的方法,主要实现了两点改进:1.将CNN的输出结果由标量(scalar)替换成了向…

    学术报告 2018年2月26日
    1.4K
  • 格式化字符串漏洞

          介绍了格式化字符串漏洞的常见形式,以及在Windows32和Linux64下的两种利用思路,可以扩展到其他漏…

    2018年7月15日
    1.3K
  • 不规则多元时间序列预测研究

    时序数据预测任务是时间序列处理领域中一项基本的任务,根据历史时间段数据序列预测未来一段时间的数据序列,广泛应用于天气预报、经济预测、医疗保健预测等领域。在复杂的现实世界中,时序数据…

    2024年3月15日
    1.7K
  • 预训练语言模型GPT3

    为了从网络上海量文本信息提取有价值信息,需要使用计算机处理文本数据,首要任务是将文本转换为计算机可以处理的向量化数据。单词是文本的最小单位,所以需要使用语言模型得到词向量表示成为文…

    2021年2月19日
    1.7K
  • 深度域适应方法

    本次学术报告介绍了深度域适应方法的基本概念,以三种无监督域适应基本算法为例,简要梳理了域适应方法的发展脉络。通过分析半监督域适应方法论文,详细讲解了半监督域适应方法的基本原理。最后…

    2022年11月7日
    1.2K
  • 智能模型的不确定性估计

    智能模型的不确定性是模型内生脆弱性问题的重要表征之一,反映了模型对输入数据预测结果的可信程度,包含了对数据和模型两方面缺陷的量化估计。本次报告介绍了模型不确定性估计工作基本概念,讲…

    2023年11月6日
    1.2K