敏感文本数据脱敏方法

本次报告对文本数据的脱敏方法展开介绍,介绍了目前常用的文本数据脱敏方法,重点讲解了文本数据泛化脱敏的基本概念,详细阐述了文本泛化脱敏方法和文本差分隐私噪声扰动脱敏方法,最后对比了文本数据和表格数据隐私保护的差异,并对发展方向做出了总结。

敏感文本数据脱敏方法-关业礼

原创文章,作者:bfs,如若转载,请注明出处:https://www.isclab.org.cn/2022/05/30/%e6%95%8f%e6%84%9f%e6%96%87%e6%9c%ac%e6%95%b0%e6%8d%ae%e8%84%b1%e6%95%8f%e6%96%b9%e6%b3%95/

(0)
bfsbfs
上一篇 2022年5月25日 下午2:26
下一篇 2022年6月6日 上午8:42

相关推荐

  • 胶囊(向量神经)网络

        胶囊(向量神经)网络是针对CNN的缺陷提出的一种新的方法,主要实现了两点改进:1.将CNN的输出结果由标量(scalar)替换成了向…

    学术报告 2018年2月26日
    852
  • 多视图聚类技术

    多视图聚类技术旨在利用不同视图之间信息的互补性和一致性增强模型的鲁棒性,提高聚类准确率。本次报告首先讲述多视图聚类的基本概念,然后结合两篇算法对完全多视图聚类和不完全多视图聚类方法…

    2023年12月27日
    1.3K
  • 层次聚类算法

    对聚类算法有一点点入门的时候就知道,几乎所有的“平面型”聚类算法都有一个共同的弱点-难以确定类别数(聚类停止条件),而层次聚类在一定程度上解决了这个问题(它算一种比较古老比较通用的…

    2015年1月28日
    1.1K
  • AI测试:历史与发展

    本报告重点讲解了AI测试的发展历史,从2007年Murphy等人认为AI系统是不可测试到后续变形测试、差分测试、覆盖测试、突变测试等传统测试方法的引入,再到正确性、鲁棒性、隐私性、…

    2022年8月23日
    853
  • 层次多标签文本分类方法

    随着互联网技术的高速发展和数据规模的快速增长,层次多标签分类应用场景越来越多,如文献组织、新闻标注、蛋白质功能分类等。层次多标签文本分类是多标签分类下的子任务,标记每个给定文本与最…

    2022年6月6日
    1.2K
  • 二进制函数相似性分析

    本次报告介绍了二进制函数相似性分析的发展历史和主要变革,讲解了二进制相似性分析的主要方法,重点介绍了结构特征、语义特征的概念及应用原理。

    2022年11月28日
    759
  • 深度学习系统安全性测试及测试样本优先级排序

    深度学习在近十年取得了长足发展。由于其在复杂领域表现出优异的性能,逐渐被集成到软件体系中形成深度学习系统。这一方面推动了深度学习的发展,另一方面也对深度学习的安全性提出了巨大挑战:…

    2021年11月29日
    1.4K
  • 极端多标签文本分类

    极端多标签文本分类旨在为每个文本分配大量可能的标签,处理标签数量巨大和数据稀疏性问题。该技术通过高效的特征选择、标签嵌入和深度学习模型,提高分类准确性和速度。极端多标签文本分类广泛…

    2024年9月17日
    713
  • 深度神经网络后门攻击

    人工智能模型安全是人工智能应用落地需要考量的重要问题,后门攻击威胁是人工智能模型安全的重要议题。本次学术报告以深度神经网络为后门攻击的对象,从深度神经网络训练的内部机理出发,通过了…

    2021年8月15日
    1.3K
  • 代码异味检测

    本次学术报告对以往实验室软件系统/代码质量评估的研究方向做了一个总结并引出新的概念:代码异味检测。针对代码异味概念,生成原因和研究最新的方向进行了探讨。同时结合两篇论文,从多异味检…

    2023年6月5日
    958