大规模多标签分类方法

近年来,随着互联网技术的高速发展和数据规模的快速增长、大数据的应用,多标签分类应用场景越来越多,如电子商务中的商品分类、网页标签、新闻标注、蛋白质功能分类、音乐分类、语义场景分类等。大规模多标签文本分类(XMTC)是一个自然语言处理(NLP)任务,标记每个给定文本与最相关的多个标签,即从超大空间的类别中找到每个文档中最相关的标签子集,不同于多分类,每个实例只有一个相关的标签。在计算资源有限的情况下,大量的样本、标签和大量的“尾部标签”(只有极少数的正样本)为开发高效的分类器带来了巨大的计算挑战。

本次学术报告主要介绍了多标签分类的背景、应用及主要解决方法,并详细讲解了一个结合标签树与深度学习的算法。

网络安全-学术报告-大规模多标签分类方法-张睿智-2020.12.13

原创文章,作者:admin,如若转载,请注明出处:https://www.isclab.org.cn/2020/12/13/%e5%a4%a7%e8%a7%84%e6%a8%a1%e5%a4%9a%e6%a0%87%e7%ad%be%e5%88%86%e7%b1%bb%e6%96%b9%e6%b3%95/

(2)
adminadmin
上一篇 2020年12月7日 下午2:29
下一篇 2020年12月20日 下午9:45

相关推荐

  • Android安全体系结构简介

    Android操作系统是一个开放式的操作系统,保护这样一个开放平台,需要强有力的安全体系结构。Android系统拥有多层次的安全机制,可以灵活地满足用户各层次的安全需求。    1…

    2014年10月21日
    2.5K
  • 联邦学习

    联邦学习(Federated Learning)在2016年由谷歌最先提出,其设计目标是在保障大数据交换时的信息安全、保护终端数据和个人数据隐私、保证合法合规的前提下,在多参与方或…

    2020年6月7日
    2.1K
  • 图匹配网络

    本次学术报告旨在带领听众完成图匹配网络相关知识入门。首先介绍了图匹配网络的基本概念;随后以GMN和MGMN为例讲解了图匹配网络的两种经典范式,详细阐述了图匹配网络的基本原理和应用场…

    2023年6月19日
    1.6K
  • 跨语言过程调用方法

    本报告介绍了跨语言过程调用的基本概念,展示了基于socket、http通信和rpc框架等三种方法的网络通信式过程调用的原理,梳理了基于ctypes和pybind11等两种方法的链接…

    2022年10月31日
    1.4K
  • Glibc内存管理2

          内存管理是指软件运行时对计算机内存资源的分配和使用的技术。其最主要的目的是如何高效,快速的分配,并且在适当的…

    2019年6月19日
    1.4K
  • 融合多模态交互及语义一致性建模的社交机器人检测

    社交机器人模仿人类在Twitter等社交平台上的行为。数以百万计的机器人通常基于平台API,通过自动化程序控制,通过模仿真实用户以实现恶意目标,检测社交机器人对于净化网络空间环境具…

    2023年7月14日
    1.6K
  • 自动化漏洞挖掘初探

    摘要:本报告介绍了web漏洞挖掘中的基本概念,实战通用方案及相关思路总结,进一步详细讲解了手工挖掘中存在的痛点问题,重点阐述了前沿自动化漏洞挖掘算法原理,分析其如何弥补手工挖掘的不…

    2023年2月13日
    1.7K
  • 程序崩溃的故障定位方法

    程序崩溃的故障定位方法通过统计调试或符号执行,自动推断出程序崩溃的根本原因。本次报告介绍了1个基于符号执行的方法、1个结合统计调试和符号执行的方法,旨在提高故障定位的准确性与效率,…

    2025年1月12日
    1.2K
  • 动态规划探究

          动态规划是用来解决多阶段决策过程最优化问题的一种方法,它的适用问题一般需要具备2个要素ー最优子结构与重叠子问…

    2018年10月22日
    1.6K
  • 代码异味检测

    本次学术报告对以往实验室软件系统/代码质量评估的研究方向做了一个总结并引出新的概念:代码异味检测。针对代码异味概念,生成原因和研究最新的方向进行了探讨。同时结合两篇论文,从多异味检…

    2023年6月5日
    1.7K