文本相似度度量方法

文本相似度度量是自然语言处理中的一个基础问题,是许多下游任务的基础,如文本分类、信息检索、对话系统、句义标注等。相似度匹配的过程包括了构造特征与度量特征两个基本步骤,其中构造特征是核心任务。报告的两篇论文讲述了构造特征的一些可供借鉴的方法。第一篇文章从逻辑表达与推理中构造特征来度量句子的相似度,第二篇从表征学习的角度来度量不同长度文本的相似度。

文本相似度度量方法-孔令迪

原创文章,作者:bfs,如若转载,请注明出处:https://www.isclab.org.cn/2022/03/13/%e6%96%87%e6%9c%ac%e7%9b%b8%e4%bc%bc%e5%ba%a6%e5%ba%a6%e9%87%8f%e6%96%b9%e6%b3%95/

(3)
bfsbfs
上一篇 2022年3月7日 上午10:30
下一篇 2022年3月21日 下午5:17

相关推荐

  • 迎新聚力,未来可期——欢迎2025级新同学

    秋韵正深,情谊正暖。随着12名2025级新同学的加入,BFS课题组焕发出全新的生机与活力。为欢迎新生力量、促进新老成员深度交流并迅速凝聚团队,9月23日傍晚,一场以“破冰”为核、智…

    2025年9月30日
    3.1K
  • DNN模型水印及其鲁棒性评估

    模型水印技术是一种利用特定信息认证保护模型知识产权的方法。本次报告分析了深度学习领域现有的模型水印嵌入方法,从性能鲁棒性和稳定鲁棒性两方面讲述模型水印鲁棒性评估方法,并以实例分析和…

    2023年11月30日
    2.0K
  • 代码摘要技术

    代码摘要(Code Summarization)是一项通过自动生成自然语言描述以解释目标代码的技术。其目标是帮助理解代码的功能和用途。通过本次学术报告对学习代码摘的学习,希望大家可…

    2024年9月23日
    1.8K
  • 基于汇编指令嵌入的漏洞同源性判别

    同源函数是由相同源码编译得到的程序函数。同源漏洞判别是漏洞挖掘的主要方法之一,用于发现已知漏洞的同源漏洞。本次报告主要汇报基于汇编指令嵌入的同源漏洞判别方法,介绍了汇编指令嵌入的基…

    2021年11月8日
    2.0K
  • 联邦学习

    联邦学习(Federated Learning)在2016年由谷歌最先提出,其设计目标是在保障大数据交换时的信息安全、保护终端数据和个人数据隐私、保证合法合规的前提下,在多参与方或…

    2020年6月7日
    2.7K
  • 聚类知识及其初始化问题

    聚类学习作为机器学习中最为常用的算法,已经广泛的应用于许多领域。本文主要介绍聚类的一些基础知识,并且以概率聚类模型为例,并讲解一个聚类算法:基于t分布的熵惩罚最大期望算法,使大家对…

    2019年8月24日
    2.1K
  • 隧道流量识别研究

    本文介绍两种隧道流量识别方法:DecETT方法构建不同的损失解耦隧道流协议特征和应用语义特征,实现AF检测;Graphtunnel方法构建DNS递归解析图进行DNS隧道流量监测。未…

    2026年2月3日
    1.5K
  • 不完全多视图聚类技术

    不完全多视图聚类技术旨在处理多视图数据中部分视图缺失的问题,确保在数据不完整的情况下仍能进行有效的聚类分析。通过整合各视图的信息,该技术能够弥合视图之间的差异,提升聚类性能。其应用…

    2024年9月10日
    1.8K
  • 动态网络嵌入方法研究

    传统的网络表示一般使用高维的稀疏向量,但是局限在于难以度量节点间的相似性,而一般的静态网络嵌入方法,忽略网络的动态演化过程,因此提出了基于动态网络的嵌入方法学习。本次将基于深度自编…

    2021年6月14日
    2.1K
  • 公开课-《信息系统安全与对抗技术》

    课程链接:中国大学MOOC——《信息系统与安全对抗技术》课程链接:北京高校优质课程——《信息系统与安全对抗技术》 没有网络安全就没有国家安全,网络空间安全与对抗是信息科技发展中永存…

    通知公告 2019年9月2日
    2.6K