无监督数据增强研究

      面对渴求大量数据的深度学习,数据扩增方法可以缓和一部分需求,但数据扩增方法往往只应用在有监督学习设定中,带来的提升也较为有限。GoogleAI最新提出了一种在半监督学习设定中,把数据扩增方法运用在未标注数据上的新方法。他们的方法,无监督数据扩增 UDA,会鼓励模型面对未标注数据和扩增过的未标注数据时产生一致的预测。与此前使用高斯噪声和 dropout 噪声的方法不同,UDA 有一些小的调整,它借助目前最先进的数据扩增方法产生了难度更高、更真实的噪声。这些小调整让 UDA 在六种语言任务、三种视觉任务中都带来了显著的表现提升,即便使用到的有标注数据集非常小。

网络安全2组-学术报告PPT-无监督数据增强研究.pdf

原创文章,作者:admin,如若转载,请注明出处:https://www.isclab.org.cn/2019/07/28/%e5%ad%a6%e6%9c%af%e6%8a%a5%e5%91%8a-%e6%97%a0%e7%9b%91%e7%9d%a3%e6%95%b0%e6%8d%ae%e5%a2%9e%e5%bc%ba%e7%a0%94%e7%a9%b6/

(1)
adminadmin
上一篇 2019年7月18日 上午8:52
下一篇 2019年8月13日 上午9:36

相关推荐

  • 面向NIDS的流量对抗样本检测

    在AI攻击复杂性和密集性不断提升的大背景下,ML-NIIDS面临巨大挑战,其中流量对抗样本严重威胁其安全稳定。本次报告从NIDS的迭代发展,聚焦到对抗性安全威胁,再引出主流流量对抗…

    2023年10月23日
    790
  • 基于视觉直觉的源代码表征

    源代码表征是软件工程中的一个重要研究领域,主要关注如何有效地将源代码转化为可以支持各种软件工程任务(如代码搜索、克隆检测、代码自动生成等)的数学模型或数据结构。这些表征通常需要捕获…

    2024年9月23日
    523
  • 基于模型修改的深度学习后门攻击

    本报告介绍了深度学习后门攻击的基本概念、类型划分等背景知识,对一种基于模型权重修改和一种基于模型结构修改的后门攻击算法进行了具体说明,阐述了对于深度学习后门攻击领域现状的未来发展的…

    2023年3月20日
    1.1K
  • 机器学习常用的可解释方法

    可解释性对于建立用户与决策模型之间的信任关系至关重要,提高机器学习模型的可解释性和透明性是机器学习在现实任务中进一步发展和应用的关键。本次报告带大家了解机器学习常用的可解释方法的基…

    2020年10月25日
    1.0K
  • 弱监督技术方法

    当前监督学习技术已经取得了巨大的成功,但是值得注意的是,由于数据标注过程的成本太高,很多任务很难获得如全部真值标签这样的强监督信息。而无监督学习由于学习过程太过困难,它的发展缓慢。…

    2022年2月21日
    774
  • 基于突变的模糊测试

    基于突变的模糊测试对于漏洞检测能力的开发和测试资源的利用较为重要,为了快速、高效地寻找到待测程序中的缺陷,需要提高模糊测试过程的测试效率。本次报告为大家介绍了基于突变的模糊测试的基…

    2024年6月19日
    515
  • 二进制代码开源成分分析

    二进制代码-源代码匹配是信息安全领域的重点研究方向之一。在给定二进制代码的情况下,逆向分析研究人员希望找到它对应的源代码,从而提升逆向分析的效率和准确率。但由于源代码和二进制代码的…

    2022年6月27日
    1.3K
  • 网络安全态势感知

    随着网络技术的飞速发展,其安全问题日益突出。虽然已经采取了多种网络安全防护措施,但是单一的安全防护措施没有综合考虑各种防护措施之间的关联性,无法从宏观角度评估网络安全性。网络安全态…

    2020年4月21日
    1.2K
  • Padding–A CNN operation that cannot be ignored

    本次报告主要讲述了padding的种类及其影响,介绍了卷积网络的基本概念和性质、使用padding的主要原因等,详细讲解了特征偏移和信息侵蚀的概念、表现及解决方案,最后对paddi…

    2022年12月5日
    659
  • 基于网络流量的设备识别

    介绍了设备识别的发展历史、各层协议的特征及其优劣性,对两篇关于内网、外网识别的高水平文献进行了讲解,对比了设备识别的主要研究方向,以期帮助初学者快速了解领域内的动态及发展前景。

    2020年10月8日
    1.7K