敏感文本数据脱敏方法

bfs • 2022年5月30日上午9:00 • 学术报告 • 阅读 2562

本次报告对文本数据的脱敏方法展开介绍，介绍了目前常用的文本数据脱敏方法，重点讲解了文本数据泛化脱敏的基本概念，详细阐述了文本泛化脱敏方法和文本差分隐私噪声扰动脱敏方法，最后对比了文本数据和表格数据隐私保护的差异，并对发展方向做出了总结。

原创文章，作者：bfs，如若转载，请注明出处：https://www.isclab.org.cn/2022/05/30/%e6%95%8f%e6%84%9f%e6%96%87%e6%9c%ac%e6%95%b0%e6%8d%ae%e8%84%b1%e6%95%8f%e6%96%b9%e6%b3%95/

bfs

表格数据隐私保护

上一篇 2022年5月25日下午2:26

层次多标签文本分类方法

下一篇 2022年6月6日上午8:42

学术报告

基于MPEG-2码流的非线性编辑系统编辑方法

以本人为主提出了基于ES（基本数据流层）的视, 音频剪辑算法；基于打包数据流层的视, 音频剪辑算法；基于PES流的视, 音频同步剪辑算法。并基于这些算法实现了基于MPEG-2码流的…

2011年10月9日
01.3K
学术报告

简述对抗样本检测方法

对抗样本会的存在严重威胁到机器学习模型的输出准确性。目前最常用的对抗样本生成方法是FGSM，其通过在沿着损失…

2018年10月17日
183.3K
学术报告

自动化漏洞挖掘初探

摘要：本报告介绍了web漏洞挖掘中的基本概念，实战通用方案及相关思路总结，进一步详细讲解了手工挖掘中存在的痛点问题，重点阐述了前沿自动化漏洞挖掘算法原理，分析其如何弥补手工挖掘的不…

2023年2月13日
01.6K
学术报告

注意力机制

注意力机制应用在encoder-decoder模型中，可以使Decoder根据时刻的不同，让每一时刻的输入都…

2018年10月8日
11.5K
学术报告

网络表示学习-Deepwalk

网络表示是衔接网络原始数据和网络应用任务的桥梁。网络表示学习算法负责从网络数据中学习得到网络中每个节点的向量…

2019年3月18日
01.4K
学术报告

动态网络嵌入

许多真实世界的网络不是静态的而是处于不断进化的状态，随着网络的不断进化，一方面新节点需要被表示，另一方面，原始节点的嵌入表示就变得陈旧，需要被不断更新。本次学术报告首先介绍了动态网…

2020年4月7日
11.7K
学术报告

主动学习在医学图像分析中的应用

主动学习也叫做询问学习或最佳实验设计，它是机器学的分支，更人工智能。主要的假设是是否学习算法是可以去选择先要…

2018年8月20日
01.2K
学术报告

层次多标签文本分类方法

随着互联网技术的高速发展和数据规模的快速增长，层次多标签分类应用场景越来越多，如文献组织、新闻标注、蛋白质功能分类等。层次多标签文本分类是多标签分类下的子任务，标记每个给定文本与最…

2022年6月6日
21.8K
学术报告

数据集不平衡评估方法

本报告围绕“数据集不平衡程度评估”展开，聚焦于如何科学量化多类数据中的结构性不平衡问题，突破传统以样本比例为核心的评估局限。报告系统回顾了不平衡评估的发展脉络，分析了现有方法在面对…

2025年7月28日
01.2K
学术报告

联邦学习的后门防御方法

本报告介绍了联邦学习领域后门攻击与防御的基本概念、联邦学习的训练流程，分别聚合规则和聚类规则的后门防御算法进行具体说明，阐述了联邦学习领域后门攻击与防御的发展方向及个人思考。

2023年4月9日
01.8K

敏感文本数据脱敏方法

相关推荐