Deep Learning Backdoor Attacks Detection

The susceptibility of deep neural networks to backdoor or trojan attacks has been demonstrated, wherein an adversary embeds a trigger during the training phase. This trigger allows the model to correctly classify regular inputs but produces a targeted and incorrect classification when the input contains the trigger. In this report, a trojan detection method was discussed, which circumvents the need for access to the training/test data, avoids computationally intensive operations, and does not rely on assumptions about the trojan trigger’s characteristics. Instead, this approach focuses on analyzing the weights of the network’s final linear layer. Empirical findings revealed several recurring traits in trojaned networks, absent in benign networks.

Deep-Learning-Backdoor-Attacks-Detection-Saba-Zaib

原创文章,作者:bfs,如若转载,请注明出处:https://www.isclab.org.cn/2023/06/26/deep-learning-backdoor-attacks-detection/

(0)
bfsbfs
上一篇 2023年6月19日 上午8:26
下一篇 2023年7月3日 上午10:18

相关推荐

  • 函数级漏洞检测

    本次报告讲述漏洞检测相关基本概念,源码级漏洞检测的一般步骤,主要从关键点选取、代码切片、代码表示等几个方面讲解源码漏洞检测方法,主要针对泛化性、多类型漏洞检测问题进行研究。

    2022年10月30日
    2.7K
  • 逆向分析与软件保护

    逆向思维应用在学习、工作中的方方面面,学术报告中介绍了逆向分析的概念及应用,通过微信的破解演示展示了软件逆向的过程。在最后针对软件发布后可能存在的被调试、被破解风险,介绍了几种软件…

    2020年5月5日
    3.7K
  • 机器学习中的非凸优化

          机器学习模型可化简为求解一个目标函数/损失函数的最优化问题,根据优化目标及约束的不同,可划分为凸优化(Con…

    2019年6月24日
    3.7K
  • 在线集成学习

          本次学术报告介绍了集成学习和在线学习基本思想,对离线bagging(装袋)和离线boosting(提升)的基…

    2019年7月1日
    3.4K
  • Glibc内存管理2

          内存管理是指软件运行时对计算机内存资源的分配和使用的技术。其最主要的目的是如何高效,快速的分配,并且在适当的…

    2019年6月19日
    2.9K
  • 文本风格迁移

    风格迁移是将多种类型风格转换成另一风格,是自然语言处理领域的一个重要问题,表征着文本生成和风格控制技术的发展情况,在大数据时代下的隐私保护等方面起着重要作用。本文主要介绍了文本风格…

    2020年11月10日
    3.4K
  • 利用图挖掘的内部威胁检测方法

    随着图神经网络的广泛应用,以及越来越多的组织和企业关注内部威胁,利用图挖掘的方法检测内部威胁受到越来越多研究者的重视。本次报告介绍了利用图挖掘内部威胁检测方法的整体架构,以及如何从…

    2022年6月14日
    3.2K
  • 大规模多标签分类方法

    近年来,随着互联网技术的高速发展和数据规模的快速增长、大数据的应用,多标签分类应用场景越来越多,如电子商务中的商品分类、网页标签、新闻标注、蛋白质功能分类、音乐分类、语义场景分类等…

    2020年12月13日
    4.5K
  • 深度学习讨论会

        本次学术报告简单介绍了深度学习的定义和过程,并给出了基于Keras实现手写数字识别的基本过程和实验结果,讨论了设置不同batch s…

    学术报告 2017年12月3日
    3.0K