大规模多标签分类方法

近年来,随着互联网技术的高速发展和数据规模的快速增长、大数据的应用,多标签分类应用场景越来越多,如电子商务中的商品分类、网页标签、新闻标注、蛋白质功能分类、音乐分类、语义场景分类等。大规模多标签文本分类(XMTC)是一个自然语言处理(NLP)任务,标记每个给定文本与最相关的多个标签,即从超大空间的类别中找到每个文档中最相关的标签子集,不同于多分类,每个实例只有一个相关的标签。在计算资源有限的情况下,大量的样本、标签和大量的“尾部标签”(只有极少数的正样本)为开发高效的分类器带来了巨大的计算挑战。

本次学术报告主要介绍了多标签分类的背景、应用及主要解决方法,并详细讲解了一个结合标签树与深度学习的算法。

网络安全-学术报告-大规模多标签分类方法-张睿智-2020.12.13

原创文章,作者:admin,如若转载,请注明出处:https://www.isclab.org.cn/2020/12/13/%e5%a4%a7%e8%a7%84%e6%a8%a1%e5%a4%9a%e6%a0%87%e7%ad%be%e5%88%86%e7%b1%bb%e6%96%b9%e6%b3%95/

(2)
adminadmin
上一篇 2020年12月7日 下午2:29
下一篇 2020年12月20日 下午9:45

相关推荐

  • 缓解多模态大语言模型的幻觉问题

    该研究针对多模态大语言模型生成内容与输入信息不符的“幻觉”问题,提出两种缓解方法:OPERA在推理阶段通过惩罚过信任与回溯重分配机制减少幻觉;HACL在训练阶段引入幻觉文本作为困难…

    2025年12月1日
    608
  • 高准确率的鲁棒加密恶意流量实时检测方法

    本报告讲述了加密恶意流量检测领域基本概念,通过详细介绍基于频域分析的实时鲁棒恶意流量检测和基于自适应聚类的网络边缘恶意流量分类方法,启发思考通过统计聚类分析来提升加密恶意流量检测算…

    2022年3月21日
    1.2K
  • AI测试:历史与发展

    本报告重点讲解了AI测试的发展历史,从2007年Murphy等人认为AI系统是不可测试到后续变形测试、差分测试、覆盖测试、突变测试等传统测试方法的引入,再到正确性、鲁棒性、隐私性、…

    2022年8月23日
    851
  • 强化学习中的信用分配

    本报告围绕强化学习中的“信用分配”难题,系统梳理了延迟/稀疏奖励场景下如何精准识别关键动作的研究脉络, 介绍LaRe与VinePPO两项新工作 ,分别利用大模型先验与无偏采样提升奖…

    2026年1月12日
    382
  • 学术论文评审意见生成方法研究

    学术论文投稿数量的不断增长带来巨大审稿压力,而人工智能和大数据的发展为学术论文自动化评审提供了契机。本次学术报告介绍了学术论文评审意见生成的两种最新方法,为减轻审稿人负担、提高评审…

    2025年9月22日
    434
  • 符号执行简介

          符号执行 (Symbolic Execution)是一种程序分析技术。其可以通过分析程序来得到让特…

    2019年1月2日
    921
  • 深度学习模型后门攻击检测

    本报告介绍了深度学习后门攻击基本概念及后门攻击检测发展历史和类型划分等背景知识,对2种基于模型演化策略的后门攻击检测算法进行了具体说明,阐述了深度学习后门攻击检测的发展趋势和未来前…

    2024年5月20日
    1.2K
  • 大模型支持的程序崩溃故障定位方法

    本次报告聚焦大模型支持下的程序崩溃故障定位方法,介绍了AutoFL与FlexFL两个代表性算法,重点讲解了函数交互在大模型中的创新应用,并比较开源与闭源模型在定位精度与效率上的表现…

    2025年6月16日
    603
  • 数据挖掘中的数据清洗方法

          数据清洗是数据挖掘工作中很重要的一部分工作,目的是解决数据的质量问题,将“脏”数据变成标准的、干净的数据,更…

    2018年5月14日
    1.0K