大规模多标签分类方法

近年来,随着互联网技术的高速发展和数据规模的快速增长、大数据的应用,多标签分类应用场景越来越多,如电子商务中的商品分类、网页标签、新闻标注、蛋白质功能分类、音乐分类、语义场景分类等。大规模多标签文本分类(XMTC)是一个自然语言处理(NLP)任务,标记每个给定文本与最相关的多个标签,即从超大空间的类别中找到每个文档中最相关的标签子集,不同于多分类,每个实例只有一个相关的标签。在计算资源有限的情况下,大量的样本、标签和大量的“尾部标签”(只有极少数的正样本)为开发高效的分类器带来了巨大的计算挑战。

本次学术报告主要介绍了多标签分类的背景、应用及主要解决方法,并详细讲解了一个结合标签树与深度学习的算法。

网络安全-学术报告-大规模多标签分类方法-张睿智-2020.12.13

原创文章,作者:admin,如若转载,请注明出处:https://www.isclab.org.cn/2020/12/13/%e5%a4%a7%e8%a7%84%e6%a8%a1%e5%a4%9a%e6%a0%87%e7%ad%be%e5%88%86%e7%b1%bb%e6%96%b9%e6%b3%95/

(2)
adminadmin
上一篇 2020年12月7日 下午2:29
下一篇 2020年12月20日 下午9:45

相关推荐

  • 基于深度学习的恶意流量检测方法

    近年来,基于机器学习的算法在恶意流量检测领域中越来越流行,但此类算法通常使用浅层模型,在训练之前需要一组专家手工制作的特征来预处理数据。此类方法的主要问题是,在不同类型的场景下,手…

    2020年12月27日
    3.7K
  • 深度模型可解释方法

          深度模型可解释性一直是业界关注的问题。报告介绍了一种新颖的深度学习可解释性方法——树正则化。通过在深度模型训…

    学术报告 2018年3月26日
    1.1K
  • 时空数据挖掘

    物联网技术和人工智能的快速发展,含时间、空间特性的数据指数增长。如何进行多源异构时空数据本身特性出发,和机器学习深度学习技术深入融合,实现数据实现知识发现和信息挖掘,服务于城市发展…

    2021年5月18日
    1.4K
  • 计算机启动流程详解2

          计算机从按下电源按钮到操作系统启动完成的过程其实相当复杂,大多数普通用户可能并不了解其中的过程和玄机。本次报…

    2018年6月10日
    1.2K
  • 弱监督技术方法

    当前监督学习技术已经取得了巨大的成功,但是值得注意的是,由于数据标注过程的成本太高,很多任务很难获得如全部真值标签这样的强监督信息。而无监督学习由于学习过程太过困难,它的发展缓慢。…

    2022年2月21日
    1.1K
  • 异常检测算法

        iForest (Isolation Forest)孤立森林 是一个基于Ensemble的快速异常检测方法,具有线性时间复杂度和高精…

    学术报告 2017年11月27日
    1.2K
  • HTTPS浅析

        HTTPS(全称:Hyper Text Transfer Protocol over Secure Socket Layer),是以…

    学术报告 2018年3月18日
    1.3K
  • 深度神经网络中的后门攻击

    深度神经网络在图像识别、语音处理以及机器翻译等领域具有良好的预测性能,但是由于深度神经网络对决策结果可解释性的缺乏以及解决训练开销而寻求的外包训练的安全难以有效保证,都导致深度神经…

    2020年12月7日
    2.0K
  • 基于行为语义分析的android恶意软件分析方法

    Android恶意软件对社会造成较大危害。为此,本文介绍了一种基于关联行为分析的Android恶意软件检测系统,该方法具有较强的行为表征能力,能有效的应对各种进化变异的恶意软件。

    2019年8月13日
    1.4K
  • 图神经网络可解释方法

    图神经网络模型的可解释性对于建立用户与决策模型之间的信任关系至关重要,为了安全、可信地部署图神经网络模型,需要提高图神经网络模型的可解释性和透明性。本次报告带大家了解图神经网络的可…

    2021年7月11日
    1.4K