无监督数据增强研究

admin • 2019年7月28日下午5:00 • 学术报告 • 阅读 1574

面对渴求大量数据的深度学习，数据扩增方法可以缓和一部分需求，但数据扩增方法往往只应用在有监督学习设定中，带来的提升也较为有限。GoogleAI最新提出了一种在半监督学习设定中，把数据扩增方法运用在未标注数据上的新方法。他们的方法，无监督数据扩增 UDA，会鼓励模型面对未标注数据和扩增过的未标注数据时产生一致的预测。与此前使用高斯噪声和 dropout 噪声的方法不同，UDA 有一些小的调整，它借助目前最先进的数据扩增方法产生了难度更高、更真实的噪声。这些小调整让 UDA 在六种语言任务、三种视觉任务中都带来了显著的表现提升，即便使用到的有标注数据集非常小。

网络安全2组-学术报告PPT-无监督数据增强研究.pdf

原创文章，作者：admin，如若转载，请注明出处：https://www.isclab.org.cn/2019/07/28/%e5%ad%a6%e6%9c%af%e6%8a%a5%e5%91%8a-%e6%97%a0%e7%9b%91%e7%9d%a3%e6%95%b0%e6%8d%ae%e5%a2%9e%e5%bc%ba%e7%a0%94%e7%a9%b6/

赞 (1)

0

基于知识库的命名实体识别

上一篇 2019年7月18日上午8:52

对抗式多任务学习

下一篇 2019年8月13日上午9:36

长短期记忆网络

　　LSTM，全称为长短期记忆网络（Long Short-Term Memory networks），是一种深度神经网络，同时也是一种特殊的循环神经网络（RNN）。通过在RNN的网…

学术报告 2017年9月20日
01.6K
学术报告

二进制代码开源成分分析

二进制代码-源代码匹配是信息安全领域的重点研究方向之一。在给定二进制代码的情况下，逆向分析研究人员希望找到它对应的源代码，从而提升逆向分析的效率和准确率。但由于源代码和二进制代码的…

2022年6月27日
11.9K
学术报告

跨语言命名实体识别

跨语言命名实体识别是用源语言的标记数据训练NER模型，并在目标语言的测试数据上对其进行评估。其利用具有丰富实体标签的高资源(源)语言(如英语)的知识来克服低(零)资源(目标)语言的…

2024年5月18日
11.5K
学术报告

面向深度学习模型的鲁棒性解释方法研究

深度学习模型的鲁棒性解释方法旨在提升模型在面对输入扰动或对抗攻击时的解释一致性，是增强模型可信性和应用价值的重要研究方向。本次学术报告介绍了该领域的研究背景与发展现状，重点阐述了M…

2024年12月19日
11.2K
学术报告

深度学习模型后门攻击检测

本报告介绍了深度学习后门攻击基本概念及后门攻击检测发展历史和类型划分等背景知识，对2种基于模型演化策略的后门攻击检测算法进行了具体说明，阐述了深度学习后门攻击检测的发展趋势和未来前…

2024年5月20日
01.9K
学术报告

认知诊断前沿探索

认知诊断是研究学习者学习行为，分析挖掘基于这些行为的认知状态的方法。知识认知诊断的前沿方法旨在通过准确预测学习者的表现和深入分析其认知能力，推动个性化学习体验的优化。这一方法为教育…

2024年5月18日
21.1K
学术报告

法律文本可解释性研究

法律文本可解释性研究是将可解释性研究方法应用到法律文本领域，旨在构建智慧法庭，辅助法官判案，实现法律检索和类案匹配。本次学术报告从案件罪名预测和相似案例匹配两个应用角度进行讲解，对…

2020年11月22日
01.4K
学术报告

缓冲区溢出漏洞浅析

1.认识漏洞 1.1.漏洞的定义百度：漏洞是在硬件、软件、协议的具体实现或系统安全策略上存在的缺陷，从而可以使攻击者能够在未授权的情况下访问或破坏系统。 Wikip…

2014年10月21日
02.2K
学术报告

图嵌入-GraphSAGE

现在大多数方法都是直推式学习，不能直接泛化到未知节点。这些方法是在一个固定的图上直接学习每个节点embedding，但是大多情况图是会演化的，当网络结构改变以及新节点的出现，直推…

2020年7月6日
01.8K
学术报告

准确高效地检测安卓APP中的第三方库

本次报告主要讲述了如何准确高效地检测安卓APP内的第三方库。介绍了第三方库检测的基本概念和主要困难，解释了准确高效检测第三方库的意义，详细讲解布隆过滤器的原理与使用方法、基于熵的代…

2023年7月27日
01.1K