对抗性扰动下的后门防御方法

bfs • 2024年1月17日下午9:54 • 学术报告 • 阅读 3154

后门防御旨在使用神经元剪枝、知识蒸馏等手段消除模型中隐藏的后门，阻止攻击者使用触发器样本控制深度学习模型的输出。本次学术报告主要讲解了两种以对抗性扰动和后门攻击关系为基础的后门防御方法。

原创文章，作者：bfs，如若转载，请注明出处：https://www.isclab.org.cn/2024/01/17/%e5%af%b9%e6%8a%97%e6%80%a7%e6%89%b0%e5%8a%a8%e4%b8%8b%e7%9a%84%e5%90%8e%e9%97%a8%e9%98%b2%e5%be%a1%e6%96%b9%e6%b3%95/

bfs

DNN中的理论可解释性

上一篇 2024年1月17日下午9:52

灵通测（九尾狐）：打造新生代多领域模糊测试解决方案

下一篇 2024年1月24日下午2:17

Android Hook 技术分析

　　Hook技术就是在事件传送到终点前截获并监控事件的传输，像个钩子钩上事件一样，并且能够在钩上事件时，处理一些自己特定的事件。　　附件-Android Hook 技术分析.pdf

学术报告 2017年11月11日
22.6K
学术报告

基于知识库的命名实体识别

基于统计的命名实体识别方法根据特征的获取方式，有神经网络和特征工程两个研究方向，实践表明来自知识库的词典特征…

2019年7月18日
12.9K
学术报告

大语言模型调研

针对大语言模型展开调研，介绍大语言模型发展背景和研究现状，通过讲解LLaMA2模型的预训练和微调步骤，全面讲解大语言模型的训练过程，随后对越狱攻击大语言模型的方法进行研究，通过讲解…

2024年1月3日
02.8K
学术报告

主动学习在医学图像分析中的应用

主动学习也叫做询问学习或最佳实验设计，它是机器学的分支，更人工智能。主要的假设是是否学习算法是可以去选择先要…

2018年8月20日
02.4K
学术报告

使用远程服务器搭建深度学习开发环境

本次报告首先讲解了虚拟化技术的原理和使用方式，结合多种虚拟化方式的特点，介绍了实验室内部的选择和使用情况。之后以实验室常用的系统为例，讲解了使用远程服务器搭建深度学习开发环境的过程…

2020年2月27日
12.9K
学术报告

深度神经网络后门攻击

人工智能模型安全是人工智能应用落地需要考量的重要问题，后门攻击威胁是人工智能模型安全的重要议题。本次学术报告以深度神经网络为后门攻击的对象，从深度神经网络训练的内部机理出发，通过了…

2021年8月15日
33.2K
学术报告

源代码漏洞分类

漏洞分类是漏洞分析中的重要一环，为了及时评估并缓解漏洞问题，快速、准确的漏洞分类方法必不可少，但目前漏洞分类领域面临着由于不同类型的漏洞数量高度不平衡导致的漏洞类型预测精度不佳的问…

2023年12月14日
13.0K
学术报告

准确高效地检测安卓APP中的第三方库

本次报告主要讲述了如何准确高效地检测安卓APP内的第三方库。介绍了第三方库检测的基本概念和主要困难，解释了准确高效检测第三方库的意义，详细讲解布隆过滤器的原理与使用方法、基于熵的代…

2023年7月27日
02.5K
学术报告

XSS跨站脚本攻击

XSS攻击是客户端脚本安全中的头号大敌，多次位列OWASP TOP 10榜首，严重威胁到web网络安全。XS…

2018年6月25日
02.7K
学术报告

图神经网络可解释方法

图神经网络模型的可解释性对于建立用户与决策模型之间的信任关系至关重要，为了安全、可信地部署图神经网络模型，需要提高图神经网络模型的可解释性和透明性。本次报告带大家了解图神经网络的可…

2021年7月11日
03.0K

对抗性扰动下的后门防御方法

相关推荐