大语言模型的越狱攻击

主要探讨大语言模型的越狱攻击,阐述其研究背景、意义,历史与现状。而后涉及 EnDec和 ActorAttack 算法讲解,包含算法简介,以及算法的具体流程,通过实验对比展示其性能,总结了各自算法的特点、贡献与不足,展望未来发展方向。

大语言模型越狱攻击-贺晨阳-2024.12.1

原创文章,作者:bfs,如若转载,请注明出处:https://www.isclab.org.cn/2024/12/19/%e5%a4%a7%e8%af%ad%e8%a8%80%e6%a8%a1%e5%9e%8b%e7%9a%84%e8%b6%8a%e7%8b%b1%e6%94%bb%e5%87%bb/

(0)
bfsbfs
上一篇 2024年12月19日 下午8:02
下一篇 2024年12月19日 下午8:41

相关推荐

  • 大模型赋能的渗透测试技术

    本次报告围绕大模型赋能的渗透测试技术展开,首先阐述了渗透测试的基本概念、研究背景和研究意义,然后介绍了传统自动化渗透测试方法的特点与优劣势,并介绍了大模型赋能的渗透测试方法的研究现…

    2025年5月13日
    2.8K
  • 关系抽取之远程监督

    远程监督方法用于关系抽取任务,会给数据集带来噪声样本,为此,本文介绍了两种基于多示例学习的去噪方法,能够有效的去除训练集中存在的噪声样本。

    2019年8月24日
    2.3K
  • 基于汇编指令嵌入的漏洞同源性判别

    同源函数是由相同源码编译得到的程序函数。同源漏洞判别是漏洞挖掘的主要方法之一,用于发现已知漏洞的同源漏洞。本次报告主要汇报基于汇编指令嵌入的同源漏洞判别方法,介绍了汇编指令嵌入的基…

    2021年11月8日
    2.1K
  • cookie及cookie安全

          Cookie 是网站为辨别用户身份而储存在用户终端上的数据(通常经过加密),是绕开http无状态性的额外手段…

    学术报告 2018年4月23日
    2.3K
  • Android安全体系结构简介

    Android操作系统是一个开放式的操作系统,保护这样一个开放平台,需要强有力的安全体系结构。Android系统拥有多层次的安全机制,可以灵活地满足用户各层次的安全需求。    1…

    2014年10月21日
    3.2K
  • 基于突变的模糊测试

    基于突变的模糊测试对于漏洞检测能力的开发和测试资源的利用较为重要,为了快速、高效地寻找到待测程序中的缺陷,需要提高模糊测试过程的测试效率。本次报告为大家介绍了基于突变的模糊测试的基…

    2024年6月19日
    1.8K
  • 代码变更表示学习技术

    代码变更表示学习技术通常将代码变更进行结构化或序列化的中间表示,并将中间表示输入到表示学习模型以获取代码变更中更细粒度的特征,是众多软件工程任务的重要环节之一。本次报告介绍了2类任…

    2023年10月23日
    2.0K
  • 计算机启动流程详解2

          计算机从按下电源按钮到操作系统启动完成的过程其实相当复杂,大多数普通用户可能并不了解其中的过程和玄机。本次报…

    2018年6月10日
    2.2K
  • 缺失模态的情绪变化识别

    随着多模态情绪识别应用不断发展,真实场景中的模态缺失问题对模型鲁棒性提出了挑战。本次学术报告聚焦缺失模态下的情绪变化识别,介绍了基于单模态专家融合与难度感知课程学习的代表性方法,为…

    2025年12月30日
    2.2K
  • 归一化流在表格数据生成中的应用

    归一化流(Normalizing Flows)是一类生成模型,它利用一系列可逆变换将简单分布映射为复杂数据分布,具有精确计算概率密度的能力。在表格数据生成领域,归一化流的应用对于理…

    2024年4月17日
    2.6K