大语言模型的越狱攻击

bfs • 2024年12月19日下午8:36 • 学术报告 • 阅读 3613

主要探讨大语言模型的越狱攻击，阐述其研究背景、意义，历史与现状。而后涉及 EnDec和 ActorAttack 算法讲解，包含算法简介，以及算法的具体流程，通过实验对比展示其性能，总结了各自算法的特点、贡献与不足，展望未来发展方向。

大语言模型越狱攻击-贺晨阳-2024.12.1

大语言模型越狱攻击-贺晨阳-2024.12.1 下载

原创文章，作者：bfs，如若转载，请注明出处：https://www.isclab.org.cn/2024/12/19/%e5%a4%a7%e8%af%ad%e8%a8%80%e6%a8%a1%e5%9e%8b%e7%9a%84%e8%b6%8a%e7%8b%b1%e6%94%bb%e5%87%bb/

bfs

面向深度学习模型的鲁棒性解释方法研究

上一篇 2024年12月19日下午8:02

多元时间序列异常检测方法研究

下一篇 2024年12月19日下午8:41

学术报告

音频事件识别参数优化方法

目前音频处理领域各种系统的参数优化研究，通常把系统的各个层次（一般包括特征提取、特征向量生成、模型训练等）割裂开来进行相互独立的参数寻优，再将独立寻优结果进行简单组合，构成系统的参…

2015年1月28日
03.6K
学术报告

Android安全体系结构简介

Android操作系统是一个开放式的操作系统，保护这样一个开放平台，需要强有力的安全体系结构。Android系统拥有多层次的安全机制，可以灵活地满足用户各层次的安全需求。 1…

2014年10月21日
24.3K
学术报告

二进制代码反编译技术

二进制代码反编译技术在漏洞检测、恶意代码分析等逆向工程领域中具有重要应用，显著提升了全检安全分析的效率与深度。该技术有助于高效理解和重构二进制程序，支持其修复、维护与再开发。本次报…

2025年4月9日
03.6K
学术报告

基于深度学习的文本分类方法

在自然语言处理任务中，文本分类旨在将文本文档分类为给定的类别，是一项基础而重要的任务。近年来，深度神经模型由于其表现力和对特征工程的最低要求而在文本分类中越来越受欢迎。然而，将深度…

2022年3月7日
43.0K
学术报告

鲁棒性认证方法

随着对抗样本的危险性日益凸显，提高模型的鲁棒性成为研究的主要方向之一，然而，在评估鲁棒性方面还没有统一的标准，使得不同的防御方法之间对比存在很大的困难。

2021年9月13日
13.9K
Deep Learning词向量生成–CBOW和Skip-gram

　　Deep Learning词向量生成的方法通过神经网络模型让机器自动学习到每个词有效的特征表示，而CBOW模型和Skip-gram模型是目前最流行、常用的Deep learni…

学术报告 2017年10月13日
03.3K
学术报告

日志数据的深度学习异常检测方法

本报告介绍了利用系统的日志数据进行异常检测所面临的挑战，给出了日志数据分类、用途、实例等基本概念和基础知识，并对日志数据的解析处理和利用日志数据进行异常检测的高水平文献算法进行了详…

2021年9月23日
13.6K
学术报告

利用图挖掘的内部威胁检测方法

随着图神经网络的广泛应用，以及越来越多的组织和企业关注内部威胁，利用图挖掘的方法检测内部威胁受到越来越多研究者的重视。本次报告介绍了利用图挖掘内部威胁检测方法的整体架构，以及如何从…

2022年6月14日
03.5K
学术报告

App个人隐私安全检测技术

本报告主要介绍了隐私数据类型，以及基本的隐私风险检测方法。第一篇论文侧重于分析APP整体的隐私数据泄露，并根据隐私泄露的风险程度给相应的App进行风险评级；第二篇侧重于研究APP中…

2022年4月11日
03.9K
学术报告

显式周期引导的长时序列预测

该研究提出显式周期引导的长期时间序列预测方法，核心包括Periodformer和CycleNet两种模型。Periodformer通过周期注意力机制显式捕捉长期周期性模式，降低计算…

2025年11月3日
02.9K

大语言模型的越狱攻击

相关推荐