Deep Learning Backdoor Attacks Detection

The susceptibility of deep neural networks to backdoor or trojan attacks has been demonstrated, wherein an adversary embeds a trigger during the training phase. This trigger allows the model to correctly classify regular inputs but produces a targeted and incorrect classification when the input contains the trigger. In this report, a trojan detection method was discussed, which circumvents the need for access to the training/test data, avoids computationally intensive operations, and does not rely on assumptions about the trojan trigger’s characteristics. Instead, this approach focuses on analyzing the weights of the network’s final linear layer. Empirical findings revealed several recurring traits in trojaned networks, absent in benign networks.

Deep-Learning-Backdoor-Attacks-Detection-Saba-Zaib

原创文章,作者:bfs,如若转载,请注明出处:https://www.isclab.org.cn/2023/06/26/deep-learning-backdoor-attacks-detection/

(0)
bfsbfs
上一篇 2023年6月19日 上午8:26
下一篇 2023年7月3日 上午10:18

相关推荐

  • 深度神经网络后门攻击

    人工智能模型安全是人工智能应用落地需要考量的重要问题,后门攻击威胁是人工智能模型安全的重要议题。本次学术报告以深度神经网络为后门攻击的对象,从深度神经网络训练的内部机理出发,通过了…

    2021年8月15日
    2.8K
  • 深度神经网络模型后门攻击检测

    本报告介绍了深度学习后门攻击及其检测的基本概念、类型划分等背景知识,对2种基于主动策略的后门攻击检测算法进行了具体说明,阐述了对于深度学习后门攻击检测的发展趋势和未来前景。

    2023年11月3日
    2.8K
  • 深度学习讨论会

        本次学术报告简单介绍了深度学习的定义和过程,并给出了基于Keras实现手写数字识别的基本过程和实验结果,讨论了设置不同batch s…

    学术报告 2017年12月3日
    2.3K
  • 跨语言命名实体识别

    跨语言命名实体识别是用源语言的标记数据训练NER模型,并在目标语言的测试数据上对其进行评估。其利用具有丰富实体标签的高资源(源)语言(如英语)的知识来克服低(零)资源(目标)语言的…

    2024年5月18日
    2.3K
  • 动态规划算法简介

    1 基本概念 维基百科对动态规划(Dynamic programming,DP)的定义:它是一种在数学、计算机科学和经济学中使用的,通过把原问题分解为相对简单的子问题的方式求解复杂…

    2015年1月29日
    2.5K
  • 深度半监督聚类技术

    研究深度半监督聚类方法,首先利用自编码器对高维数据降维处理,同时提取构建三种范围的约束信息:主动构建的成对约束、带标签的种子约束、簇间大小比例约束;最后融合三种约束信息指导编码器训…

    2023年4月23日
    2.3K
  • 文本相似度度量方法

    文本相似度度量是自然语言处理中的一个基础问题,是许多下游任务的基础,如文本分类、信息检索、对话系统、句义标注等。相似度匹配的过程包括了构造特征与度量特征两个基本步骤,其中构造特征是…

    2022年3月13日
    2.7K
  • 扩散模型加速采样方法与应用

    扩散模型在数据生成的众多领域上呈现出了非常好的效果。然而,在实际应用过程中,扩散模型的采样原理导致其生成速度非常缓慢,严重限制了模型的实际应用效果。为了对采样生成过程进行优化,近年…

    2023年4月17日
    2.2K
  • 协议模糊测试方法

    本次报告围绕协议模糊测试方法展开,从提升协议模糊测试效率和有效性上考虑,要满足以下三个层面内容:1、数据生成角度:生成的测试用例要符合协议规范;2、数据传输角度:生成的测试用例能够…

    2026年3月1日
    1.4K
  • 从生成机制探索机生文本检测新方法

    随着大语言模型生成文本规模持续扩大,跨模型、跨领域场景下的机生文本检测面临泛化性不足的挑战。本次学术报告从文本生成机制出发,系统介绍了基于前文记忆建模与多范围写作策略差异的代表性方…

    2026年1月5日
    2.3K