对抗环境下的鲁棒机器学习

对抗样本的存在表明现代神经网络是相当脆弱的。为解决这一问题,研究者相继提出了许多方法,其中使用对抗样本进行训练被认为是至今最有效的方法之一。

然而,经过对抗训练后神经网络对于正常样本的性能往往会下降,这一问题引起了学术界的广泛关注,这种准确度与鲁棒性之间互相妥协的本质原因仍未被找出。传统的基于经验风险最小化的神经网络为何不鲁棒?为何需要对抗训练才能使其鲁棒?为什么越鲁棒的模型,在干净测试集上的精度反而越低?甚至鲁棒性越强的模型,在干净样本上的准确率越差。带着这些问题,本次学术报告结合2019-2020年的经典顶会论文,针对深度学习时代下深度神经网络的鲁棒性问题展开讨论。

对抗环境下的鲁棒机器学习-郝靖伟

原创文章,作者:bfs,如若转载,请注明出处:https://www.isclab.org.cn/2021/01/21/%e5%af%b9%e6%8a%97%e7%8e%af%e5%a2%83%e4%b8%8b%e7%9a%84%e9%b2%81%e6%a3%92%e6%9c%ba%e5%99%a8%e5%ad%a6%e4%b9%a0/

(0)
bfsbfs
上一篇 2021年1月10日 下午8:54
下一篇 2021年1月24日 下午8:28

相关推荐

  • AI模型计量&图增强的幻觉检测

    本次报告以小米SU7等案例引入AI模型计量,概述计量内涵、发展现状与指标体系,并梳理数据评测、算法评测与人工评测方法;进一步聚焦图增强幻觉检测,讲解LapEigvals注意力谱特征…

    2026年3月2日
    1.6K
  • 归一化流在表格数据生成中的应用

    归一化流(Normalizing Flows)是一类生成模型,它利用一系列可逆变换将简单分布映射为复杂数据分布,具有精确计算概率密度的能力。在表格数据生成领域,归一化流的应用对于理…

    2024年4月17日
    2.7K
  • 从图视角理解多智能体系统安全

    多智能体系统安全是当前人工智能研究中的重要方向,与系统稳定性、信息可信性及防御能力密切相关,但现有研究多集中于单智能体输入输出过滤或局部安全策略,难以刻画复杂交互网络中的全局风险传…

    2026年4月13日
    2.1K
  • 超参数优化

    本次报告介绍了超参数的概念和对模型的影响,解释了超参数与模型参数的区别,详细讲解了网格搜索、随机搜索、贝叶斯优化三种优化方法,分析其使用场景及优缺点,最后列举了三种实用的开源调优工…

    2023年1月2日
    2.2K
  • 软件漏洞注入技术

    随着计算机技术的发展,漏洞威胁问题已然日渐严峻,高效、准确的漏洞检测技术对于漏洞的发现和防护都至关重要,但目前常用的检测算法面临漏洞数据集少、信息不准确、构建成本高等问题,所以一个…

    2023年9月27日
    2.3K
  • 聚类知识及其初始化问题

    聚类学习作为机器学习中最为常用的算法,已经广泛的应用于许多领域。本文主要介绍聚类的一些基础知识,并且以概率聚类模型为例,并讲解一个聚类算法:基于t分布的熵惩罚最大期望算法,使大家对…

    2019年8月24日
    2.3K
  • 大模型越狱攻击的检测技术

    本次报告围绕大模型越狱攻击的检测技术展开,首先阐述了越狱检测的定义,然后介绍了常见的越狱攻击以及检测技术的研究现状。接着详细介绍了GradSafe和JailGuard两种主流方法,…

    2025年5月8日
    2.8K
  • Agent or not?从程序自动修复评估智能体

    本次报告在程序自动修复场景评估智能体,首先以OpenClaw为例引出Agent,阐释智能体与程序自动修复的内涵、背景及SWE-bench、ACI等基础;随后重点介绍SWE-agen…

    2026年3月9日
    2.1K
  • 深度神经网络后门攻击

    人工智能模型安全是人工智能应用落地需要考量的重要问题,后门攻击威胁是人工智能模型安全的重要议题。本次学术报告以深度神经网络为后门攻击的对象,从深度神经网络训练的内部机理出发,通过了…

    2021年8月15日
    2.8K
  • 二进制文件复合数据类型恢复

    二进制文件复合类型恢复技术在程序理解、逆向分析和漏洞检测等领域具有关键价值,能够显著提升类型信息还原与代码语义解析的准确性与效率。该技术通过推断和重建结构体、数组等复杂数据类型,有…

    2025年9月4日
    1.9K