学术报告

  • 聚类知识及其初始化问题

    聚类学习作为机器学习中最为常用的算法,已经广泛的应用于许多领域。本文主要介绍聚类的一些基础知识,并且以概率聚类模型为例,并讲解一个聚类算法:基于t分布的熵惩罚最大期望算法,使大家对聚类有着更加广泛而深入的了解。

    2019 年 8 月 24 日 32 0
  • 关系抽取之远程监督

    远程监督方法用于关系抽取任务,会给数据集带来噪声样本,为此,本文介绍了两种基于多示例学习的去噪方法,能够有效的去除训练集中存在的噪声样本。

    2019 年 8 月 24 日 41 0
  • 基于行为语义分析的android恶意软件分析方法

    Android恶意软件对社会造成较大危害。为此,本文介绍了一种基于关联行为分析的Android恶意软件检测系统,该方法具有较强的行为表征能力,能有效的应对各种进化变异的恶意软件。

    2019 年 8 月 13 日 55 0
  • 对抗式多任务学习

          对抗式多任务学习是针对普通的多任务学习模型在共享特征提取时,可能会被特定任务的特定特征所污染的问题所提出的,提出了一种Shared-Private Model,定义了共享与私有两个特征空间,训练时沿用生成式对抗网络的思想以及正交约束减轻了私有与共享特征空间中的冗余特征。可以应用于多种场景…

    2019 年 8 月 13 日 52 0
  • 无监督数据增强研究

          面对渴求大量数据的深度学习,数据扩增方法可以缓和一部分需求,但数据扩增方法往往只应用在有监督学习设定中,带来的提升也较为有限。GoogleAI最新提出了一种在半监督学习设定中,把数据扩增方法运用在未标注数据上的新方法。他们的方法,无监督数据扩增 UDA,会鼓励模型面对未标注数据和扩增过的…

    2019 年 7 月 28 日 99 0
  • 基于知识库的命名实体识别

          基于统计的命名实体识别方法根据特征的获取方式,有神经网络和特征工程两个研究方向,实践表明来自知识库的词典特征并不能被神经网络完全取代。本次报告首先解释了命名实体识别、知识库等概念;接下来,按照历史发展的顺序描述现存的知识库利用方法,其中重点介绍基于神经网络的知识库利用方法;然后,展示实验…

    2019 年 7 月 18 日 106 0
  • 多标签学习综述

          多标签学习的研究对于多义性对象的学习建模具有十分重要的意义,现已逐渐成为机器学习界一个新的研究热点。本次报告将对多标签学习的研究现状做一个简介,首先给出多标签学习的定义与面临的主要问题,并介绍多标签性能评价指标,然后介绍几种具有代表性的多标签学习算法。 附件-多标签学习综述.pdf

    2019 年 7 月 10 日 72 0
  • 在线集成学习

          本次学术报告介绍了集成学习和在线学习基本思想,对离线bagging(装袋)和离线boosting(提升)的基本原理进行了简单回顾,并详细介绍了在线bagging和在线boosting的算法原理。 附件-在线集成学习.pdf

    2019 年 7 月 1 日 69 0