大语言模型的越狱攻击

bfs • 2024年12月19日下午8:36 • 学术报告 • 阅读 3553

主要探讨大语言模型的越狱攻击，阐述其研究背景、意义，历史与现状。而后涉及 EnDec和 ActorAttack 算法讲解，包含算法简介，以及算法的具体流程，通过实验对比展示其性能，总结了各自算法的特点、贡献与不足，展望未来发展方向。

大语言模型越狱攻击-贺晨阳-2024.12.1

大语言模型越狱攻击-贺晨阳-2024.12.1 下载

原创文章，作者：bfs，如若转载，请注明出处：https://www.isclab.org.cn/2024/12/19/%e5%a4%a7%e8%af%ad%e8%a8%80%e6%a8%a1%e5%9e%8b%e7%9a%84%e8%b6%8a%e7%8b%b1%e6%94%bb%e5%87%bb/

bfs

面向深度学习模型的鲁棒性解释方法研究

上一篇 2024年12月19日下午8:02

多元时间序列异常检测方法研究

下一篇 2024年12月19日下午8:41

基于LSTM-CRF的序列标注算法

条件随机场（conditional random fields）是一种满足马尔可夫性质的条件概率图模型。它很好地解决了隐马尔可夫模型…

学术报告 2018年1月29日
03.7K
启发式参数优化算法举例

优化问题在日常生活中比较常见，而对于数据挖掘领域优化问题则更为常见，更为普遍。任何一种算法在设计之初必然预留了一组可调的参数，以期通过参数调节来得到算法的最佳效果。因为参数优化问题…

学术报告 2015年9月9日
04.2K
学术报告

跨域开发与安全

在大型项目开发时，可能会遇到多域名或多个ip之间使用ajax异步请求进行通信的情况，默认情况下，浏览器会阻断ajax对跨域请求的读取。本此报告介绍了开发中的跨域方案和跨域方案可能产…

2020年9月14日
23.6K
学术报告

人工智能模型的公平性测试

人工智能技术发展迅速，不仅在图像领域，在决策系统等领域也发挥了重要作用。用于模型训练的数据集中含有显示或者隐式的敏感属性（如性别、种族等），模型往往会利用敏感属性的特征做出决策，这…

2024年9月29日
03.3K
学术报告

基于Transformer的时间序列分析

本次报告主要从Transformer框架入手，介绍基于Transformer模型的时间序列分析方法。针对Transformer模型的位置嵌入、注意力机制、模型架构三个方向在时间序列…

2023年6月17日
03.5K
学术报告

基于突变的模糊测试

基于突变的模糊测试对于漏洞检测能力的开发和测试资源的利用较为重要，为了快速、高效地寻找到待测程序中的缺陷，需要提高模糊测试过程的测试效率。本次报告为大家介绍了基于突变的模糊测试的基…

2024年6月19日
12.8K
学术报告

AFL–基于覆盖的模糊测试工具

本次报告介绍了模糊测试以及各种分类方法，并且讲解了目前流行的模糊测试工具AFL的原理，阐明了AFL工具是如何提高代码覆盖率的。针对AFL存在的测试用例生成盲目性的问题，介绍了一种基…

2021年3月29日
23.7K
学术报告

基于深度学习的文本分类方法

在自然语言处理任务中，文本分类旨在将文本文档分类为给定的类别，是一项基础而重要的任务。近年来，深度神经模型由于其表现力和对特征工程的最低要求而在文本分类中越来越受欢迎。然而，将深度…

2022年3月7日
43.0K
学术报告

深度生成模型

近年，机器学习已经在计算机视觉、语音识别、语音合成以及自然语言处理（NLP）领域取得了突破性成果，在机器翻译和情感计算中展现的能力也颇令人期待。其中机器学习方法可以分为生成方法（…

2022年1月14日
03.3K
学术报告

机器学习模型后门攻击检测

本次学术报告简要介绍了人工智能系统面临的各种安全威胁，通过将对抗样本与后门攻击进行多方面比较，从而引入了机器学习模型后门攻击的原理和检测方法，以及后门攻击技术的应用领域。

2021年8月22日
13.8K

大语言模型的越狱攻击

相关推荐