无监督关键词提取方法介绍

关键词提取技术是通过计算机程序从文档中自动提取重要性和主题性的词或短语的自动化技术,该技术在图书馆学、情报学和自然语言处理等领域应用广泛。目前关键词提取技术主要分为无监督和有监督这两大类。本次学术报告主要讲述无监督的关键词提取技术,首先介绍了关键词提取的一些基本概念,然后着重介绍了一些经典的无监督关键词提取技术,最后讲述了关键词提取技术的应用领域和未来的研究方向。

文本安全组-学术报告-无监督关键词提取方法介绍-林朝坤-2020.03.15

原创文章,作者:bfs,如若转载,请注明出处:https://www.isclab.org.cn/2020/03/16/%e6%97%a0%e7%9b%91%e7%9d%a3%e5%85%b3%e9%94%ae%e8%af%8d%e6%8f%90%e5%8f%96%e6%96%b9%e6%b3%95%e4%bb%8b%e7%bb%8d/

(1)
bfsbfs
上一篇 2020年3月9日 上午9:03
下一篇 2020年3月23日 上午11:32

相关推荐

  • 源代码安全补丁存在性测试

    本报告围绕“源代码安全补丁存在性测试”展开,聚焦于如何自动识别开源软件中的安全补丁,解决安全补丁与普通补丁混杂、厂商静默发布、攻击窗口缩短等问题,介绍了一种结构感知的检测方法——R…

    2025年7月21日
    2.5K
  • 隐私保护的领域自适应迁移学习方法

    本报告讲述了隐私计算技术体系的整体架构及主要理论,给出了迁移学习及领域自适应问题的基本概念,通过详细介绍隐私保护政策下最新的去中心化无监督领域自适应论文以及基于隐私保护的模型联邦个…

    2021年10月11日
    2.8K
  • 高斯混合模型及求解算法

          高斯混合模型(Gaussian mixture model,GMM)用于对样本的概率密度分布进行估计,而估计…

    2019年2月18日
    2.4K
  • 对抗环境下的鲁棒机器学习

    对抗样本的存在表明现代神经网络是相当脆弱的。为解决这一问题,研究者相继提出了许多方法,其中使用对抗样本进行训练被认为是至今最有效的方法之一。 然而,经过对抗训练后神经网络对于正常样…

    2021年1月21日
    3.0K
  • Dropout随机失活

    具有大量参数的深度神经网络是非常强大的机器学习系统。然而,在这样复杂的网络中,过拟合的问题难以解决。复杂的网络结构和缓慢的运行速度导致我们很难在测试时通过组合许多不同大型神经网络的…

    2022年1月21日
    2.5K
  • 操作系统与内核安全基础

    本次报告从计算机的总体结构切入,介绍的了计算机系统的分层体系结构;对操作系统及其内核的做了详细说明,包括操作系统与操作系统内核的关系,以及操作系统内核的主要功能等内容;报告还分析了…

    2019年11月14日
    3.3K
  • 网络爬虫技术介绍

          网络爬虫,是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本,它们被广泛用于互联网搜索引擎或其他类似网…

    2019年4月3日
    2.6K
  • 二进制文件复合数据类型恢复

    二进制文件复合类型恢复技术在程序理解、逆向分析和漏洞检测等领域具有关键价值,能够显著提升类型信息还原与代码语义解析的准确性与效率。该技术通过推断和重建结构体、数组等复杂数据类型,有…

    2025年9月4日
    2.4K
  • 联邦学习

    联邦学习(Federated Learning)在2016年由谷歌最先提出,其设计目标是在保障大数据交换时的信息安全、保护终端数据和个人数据隐私、保证合法合规的前提下,在多参与方或…

    2020年6月7日
    3.5K
  • 深度模型可解释方法

          深度模型可解释性一直是业界关注的问题。报告介绍了一种新颖的深度学习可解释性方法——树正则化。通过在深度模型训…

    学术报告 2018年3月26日
    2.7K