文本生成大模型后门攻击研究

研究文本生成大模型的后门攻击,揭示了现有文本大模型的后门风险。本次学术报告详细介绍了现有文本生成模型的后门分类方法以及基准数据集,在文本大模型的多个下游任务实现了后门攻击,并总结了现有所使用的主流方法,最后提出了领域所面临的挑战和未来发展方向。

文本生成大模型后门攻击研究-赵怡清

原创文章,作者:bfs,如若转载,请注明出处:https://www.isclab.org.cn/2025/03/24/%e6%96%87%e6%9c%ac%e7%94%9f%e6%88%90%e5%a4%a7%e6%a8%a1%e5%9e%8b%e5%90%8e%e9%97%a8%e6%94%bb%e5%87%bb%e7%a0%94%e7%a9%b6/

(1)
bfsbfs
上一篇 2025年3月17日 上午11:06
下一篇 2025年3月31日 上午11:12

相关推荐

  • 联邦学习

    联邦学习(Federated Learning)在2016年由谷歌最先提出,其设计目标是在保障大数据交换时的信息安全、保护终端数据和个人数据隐私、保证合法合规的前提下,在多参与方或…

    2020年6月7日
    3.4K
  • 人工智能模型的公平性测试——既要公平,也要正确

    人工智能技术在决策系统等领域发挥了重要作用。用于模型训练的数据集中含有显示或者隐式的敏感属性,模型往往会利用敏感属性的特征做出决策,导致人工智能模型在公平性方面出现偏差,产生严重的…

    2025年3月31日
    2.5K
  • 深度模型可解释方法

          深度模型可解释性一直是业界关注的问题。报告介绍了一种新颖的深度学习可解释性方法——树正则化。通过在深度模型训…

    学术报告 2018年3月26日
    2.6K
  • 多人协作开发Git使用介绍

    本报告介绍多人协作开发中Git的使用,通过讲述版本控制的概念和比对不同版本控制的区别,详细阐述Git底层工作原理及Git多人协作流程和核心用法,掌握Git相关基本知识及Git的核心…

    2023年2月6日
    2.5K
  • 深度学习模型校准技术

    深度学习模型校准技术是模型预测可靠性的重要保障手段之一,其通过正则化或后处理方法调节模型对样本实例上的置信度,使其与预测的真实概率良好匹配。本次报告介绍了深度学习模型校准的基本概念…

    2024年7月2日
    2.8K
  • 软件缺陷自动修复方法

    随着现代软件规模的不断扩大和复杂性的不断提高,软件缺陷调试所消耗的成本也在不断增加,软件缺陷的自动修复成为越来越迫切的需求。软件缺陷自动修复可以分为缺陷定位、补丁生成、补丁验证三个…

    2021年12月20日
    3.0K
  • 认知诊断前沿探索

    认知诊断是研究学习者学习行为,分析挖掘基于这些行为的认知状态的方法。知识认知诊断的前沿方法旨在通过准确预测学习者的表现和深入分析其认知能力,推动个性化学习体验的优化。这一方法为教育…

    2024年5月18日
    2.3K
  • 长短期记忆网络

      LSTM,全称为长短期记忆网络(Long Short-Term Memory networks),是一种深度神经网络,同时也是一种特殊的循环神经网络(RNN)。通过在RNN的网…

    学术报告 2017年9月20日
    2.7K
  • 基于度量学习的小样本学习方法介绍

    Few-shot learning (FSL)的含义是得到从少量样本中学习和概括的能力,它希望机器学习模型在学习了一定类别的大量数据后,对于新的类别,只需要少量的样本就能快速学习。…

    2020年11月2日
    3.8K
  • 敏感文本数据脱敏方法

    本次报告对文本数据的脱敏方法展开介绍,介绍了目前常用的文本数据脱敏方法,重点讲解了文本数据泛化脱敏的基本概念,详细阐述了文本泛化脱敏方法和文本差分隐私噪声扰动脱敏方法,最后对比了文…

    2022年5月30日
    3.8K