文本生成大模型后门攻击研究

bfs • 2025年3月24日下午6:47 • 学术报告 • 阅读 3561

研究文本生成大模型的后门攻击，揭示了现有文本大模型的后门风险。本次学术报告详细介绍了现有文本生成模型的后门分类方法以及基准数据集，在文本大模型的多个下游任务实现了后门攻击，并总结了现有所使用的主流方法，最后提出了领域所面临的挑战和未来发展方向。

文本生成大模型后门攻击研究-赵怡清

文本生成大模型后门攻击研究-赵怡清下载

原创文章，作者：bfs，如若转载，请注明出处：https://www.isclab.org.cn/2025/03/24/%e6%96%87%e6%9c%ac%e7%94%9f%e6%88%90%e5%a4%a7%e6%a8%a1%e5%9e%8b%e5%90%8e%e9%97%a8%e6%94%bb%e5%87%bb%e7%a0%94%e7%a9%b6/

bfs

提示词怎么在别人兜里：提示词窃取攻击

上一篇 2025年3月17日上午11:06

人工智能模型的公平性测试——既要公平，也要正确

下一篇 2025年3月31日上午11:12

学术报告

属性缺失异质图神经网络

本报告主要介绍属性缺失异质图神经网络，探讨了异质图研究领域的发展历程，详细介绍了属性缺失异质图的基本概念、常用处理方法以及两种前沿的属性补全异质图神经网络。

2025年2月20日
02.9K
学术报告

提高对抗鲁棒性的特征降噪方法

当深度学习以惊人的准确性执行各种各样任务的同时，在图像分类等领域的深度神经网络却容易受到对抗样本的攻击，从而输出错误的预测结果。本次学术报告首先说明了对抗攻防的主要方法分类和残差网…

2021年4月19日
03.3K
学术报告

Using Sentiment Representation Learning to Enhance Gender Classification for User Profiling

用户画像意味着利用机器学习技术来预测用户的属性，例如人口统计学属性，兴趣属性，偏好属性等。它是精确营销的强大…

2018年12月17日
02.8K
学术报告

Android进程注入

1. 基本知识由于Android系统使用的是Linux内核，在Linux上使用的很多攻防技术都能被应用到Android上，进程注入技术就是其中一种。（以下有关进程注入的描述大多针…

2015年1月5日
13.6K
学术报告

机器学习中的多分类问题

机器学习在现实中常常遇到多分类问题，而一些优秀的二分类学习算法（如逻辑回归，SVM等等）不支持多分类任务。一…

2019年4月21日
13.1K
学术报告

基于度量学习的小样本学习方法介绍

Few-shot learning (FSL)的含义是得到从少量样本中学习和概括的能力，它希望机器学习模型在学习了一定类别的大量数据后，对于新的类别，只需要少量的样本就能快速学习。…

2020年11月2日
04.5K
学术报告

Linux高级网络配置

Linux系统强大的网络配置能力使得Linux能够工作在各种复杂网络环境下并提供各种稳定的服务。本次报告介绍…

2019年5月13日
03.2K
学术报告

Dropout随机失活

具有大量参数的深度神经网络是非常强大的机器学习系统。然而，在这样复杂的网络中，过拟合的问题难以解决。复杂的网络结构和缓慢的运行速度导致我们很难在测试时通过组合许多不同大型神经网络的…

2022年1月21日
03.0K
学术报告

Web前端框架对比

前端开发是创建WEB页面或APP等前端界面呈现给用户的过程，通过HTML，CSS及JavaScript以及衍生出来的各种技术、框架、解决方案，来实现互联网产品的用户界面交互。本次学…

2021年5月27日
13.4K
学术报告

预训练加密流量表征方法-巩锟

本次报告从BERT框架入手，讲解基于预训练的加密流量表征方法。首先介绍加密流量分析的问题和挑战，在基本概念部分着重分析BERT输入表示、预训练过程中的MLM和NSP任务，然后以ET…

2023年8月7日
13.1K

文本生成大模型后门攻击研究

相关推荐