大规模多标签分类方法

近年来,随着互联网技术的高速发展和数据规模的快速增长、大数据的应用,多标签分类应用场景越来越多,如电子商务中的商品分类、网页标签、新闻标注、蛋白质功能分类、音乐分类、语义场景分类等。大规模多标签文本分类(XMTC)是一个自然语言处理(NLP)任务,标记每个给定文本与最相关的多个标签,即从超大空间的类别中找到每个文档中最相关的标签子集,不同于多分类,每个实例只有一个相关的标签。在计算资源有限的情况下,大量的样本、标签和大量的“尾部标签”(只有极少数的正样本)为开发高效的分类器带来了巨大的计算挑战。

本次学术报告主要介绍了多标签分类的背景、应用及主要解决方法,并详细讲解了一个结合标签树与深度学习的算法。

网络安全-学术报告-大规模多标签分类方法-张睿智-2020.12.13

原创文章,作者:admin,如若转载,请注明出处:https://www.isclab.org.cn/2020/12/13/%e5%a4%a7%e8%a7%84%e6%a8%a1%e5%a4%9a%e6%a0%87%e7%ad%be%e5%88%86%e7%b1%bb%e6%96%b9%e6%b3%95/

(2)
adminadmin
上一篇 2020年12月7日 下午2:29
下一篇 2020年12月20日 下午9:45

相关推荐

  • 多标签学习综述

          多标签学习的研究对于多义性对象的学习建模具有十分重要的意义,现已逐渐成为机器学习界一个新的研究热点。本次报告…

    2019年7月10日
    2.9K
  • 长短期记忆网络

      LSTM,全称为长短期记忆网络(Long Short-Term Memory networks),是一种深度神经网络,同时也是一种特殊的循环神经网络(RNN)。通过在RNN的网…

    学术报告 2017年9月20日
    2.7K
  • 深度半监督聚类技术

    研究深度半监督聚类方法,首先利用自编码器对高维数据降维处理,同时提取构建三种范围的约束信息:主动构建的成对约束、带标签的种子约束、簇间大小比例约束;最后融合三种约束信息指导编码器训…

    2023年4月23日
    2.6K
  • 基于大模型微调的后门攻击

    本学术报告围绕大模型微调中的后门攻击问题展开。内容涵盖:后门攻击的基本原理与主流微调方法;两种新型攻击技术的设计与危害分析;以及针对现有防御体系的不足与盲区,展望后门攻击的未来演进…

    2026年6月1日
    214
  • 基于汇编指令嵌入的漏洞同源性判别

    同源函数是由相同源码编译得到的程序函数。同源漏洞判别是漏洞挖掘的主要方法之一,用于发现已知漏洞的同源漏洞。本次报告主要汇报基于汇编指令嵌入的同源漏洞判别方法,介绍了汇编指令嵌入的基…

    2021年11月8日
    2.5K
  • 启发式参数优化算法举例

    优化问题在日常生活中比较常见,而对于数据挖掘领域优化问题则更为常见,更为普遍。任何一种算法在设计之初必然预留了一组可调的参数,以期通过参数调节来得到算法的最佳效果。因为参数优化问题…

    学术报告 2015年9月9日
    3.5K
  • 网络表示学习GraphGAN

    网络表示学习(Network Representation Learning),又名网络嵌入(Network Embedding)、图嵌入(Graph Embedding),旨在从…

    2019年11月13日
    3.0K
  • 基于LSTM-CRF的序列标注算法

        条件随机场(conditional random fields)是一种满足马尔可夫性质的条件概率图模型。它很好地解决了隐马尔可夫模型…

    学术报告 2018年1月29日
    2.9K
  • 基于图结构处理的文本生成

    文本生成技术是自然语言处理中一个重要的研究领域,具有广阔的应用前景。传统文本生成的Seq2Seq框架不能有效地利用原始语料中的语义信息,而Graph2Seq模型可以丰富文本的语义知…

    2022年2月28日
    2.5K
  • 对抗式多任务学习

          对抗式多任务学习是针对普通的多任务学习模型在共享特征提取时,可能会被特定任务的特定特征所污染的问题所提出的,…

    2019年8月13日
    2.8K