文本相似度度量方法

文本相似度度量是自然语言处理中的一个基础问题,是许多下游任务的基础,如文本分类、信息检索、对话系统、句义标注等。相似度匹配的过程包括了构造特征与度量特征两个基本步骤,其中构造特征是核心任务。报告的两篇论文讲述了构造特征的一些可供借鉴的方法。第一篇文章从逻辑表达与推理中构造特征来度量句子的相似度,第二篇从表征学习的角度来度量不同长度文本的相似度。

文本相似度度量方法-孔令迪

原创文章,作者:bfs,如若转载,请注明出处:https://www.isclab.org.cn/2022/03/13/%e6%96%87%e6%9c%ac%e7%9b%b8%e4%bc%bc%e5%ba%a6%e5%ba%a6%e9%87%8f%e6%96%b9%e6%b3%95/

(3)
bfsbfs
上一篇 2022年3月7日 上午10:30
下一篇 2022年3月21日 下午5:17

相关推荐

  • Java虚拟机垃圾回收机制

        Java虚拟机实现了自动内存管理机制,包括自动内存分配和自动垃圾回收,大大避免了由于代码错误导致的内存泄漏和溢出,得到大量开发者青睐…

    学术报告 2017年12月18日
    1.9K
  • 提示词怎么在别人兜里:提示词窃取攻击

    研究提示词窃取攻击,揭示了提示词面临的泄露风险。本次学术报告介绍了提示词的应用价值和市场体量,讲述了关于提示词窃取攻击的最新方法,指明了现有的缺陷和未来发展方向。

    2025年3月17日
    2.3K
  • 法律文本可解释性研究

    法律文本可解释性研究是将可解释性研究方法应用到法律文本领域,旨在构建智慧法庭,辅助法官判案,实现法律检索和类案匹配。本次学术报告从案件罪名预测和相似案例匹配两个应用角度进行讲解,对…

    2020年11月22日
    2.1K
  • 域自适应网络框架DANE

    本次报告介绍一种域自适应网络嵌入框架DANE,该框架解决了嵌入空间偏移和嵌入分布偏移的问题。在DANE中,来自多个网络的节点通过一组共享的可学习参数被编码为向量,以便向量共享对齐的…

    2021年3月1日
    2.3K
  • 缺失模态的情绪变化识别

    随着多模态情绪识别应用不断发展,真实场景中的模态缺失问题对模型鲁棒性提出了挑战。本次学术报告聚焦缺失模态下的情绪变化识别,介绍了基于单模态专家融合与难度感知课程学习的代表性方法,为…

    2025年12月30日
    2.0K
  • Android Hook 技术分析

      Hook技术就是在事件传送到终点前截获并监控事件的传输,像个钩子钩上事件一样,并且能够在钩上事件时,处理一些自己特定的事件。  附件-Android Hook 技术分析.pdf

    学术报告 2017年11月11日
    1.9K
  • 人工智能模型的公平性测试——既要公平,也要正确

    人工智能技术在决策系统等领域发挥了重要作用。用于模型训练的数据集中含有显示或者隐式的敏感属性,模型往往会利用敏感属性的特征做出决策,导致人工智能模型在公平性方面出现偏差,产生严重的…

    2025年3月31日
    2.0K
  • 基于深度学习的恶意流量检测方法

    近年来,基于机器学习的算法在恶意流量检测领域中越来越流行,但此类算法通常使用浅层模型,在训练之前需要一组专家手工制作的特征来预处理数据。此类方法的主要问题是,在不同类型的场景下,手…

    2020年12月27日
    4.5K
  • 软件漏洞注入技术

    随着计算机技术的发展,漏洞威胁问题已然日渐严峻,高效、准确的漏洞检测技术对于漏洞的发现和防护都至关重要,但目前常用的检测算法面临漏洞数据集少、信息不准确、构建成本高等问题,所以一个…

    2023年9月27日
    2.0K
  • 表格数据生成:GAN模型的演进与未来

    表格数据生成能为深度学习扩充不平衡数据,同时也能避免隐私问题,研究如何生成高保真表格数据具有重要意义。本次报告分析了各个生成模型的优劣,以及GAN在表格数据领域的创新思路。

    2023年8月15日
    2.1K