基于T-Closeness的微聚集数据脱敏算法

大数据时代的到来,同时也带来了隐私、敏感信息保护方面的棘手难题。数据脱敏措施层出不穷,K-Anonymity,L-Diversity,T-Closeness,以及相结合的微聚集算法,能够在保证数据效用的同时,最大化防止隐私数据泄露,本次学术报告详细讲解了T-Closeness的原理、用来计算两种概率分布距离的EMD(Earth Mover ‘s distance)算法和三种基于T-Closeness微聚集的数据脱敏算法原理,并在数据集上实验了三种微聚集算法,查看了生成簇大小、时间成本和数据效用等实验结果,最后分析得到的实验结果和数据。

基于T-Closeness的微聚集数据脱敏算法-关业礼

原创文章,作者:bfs,如若转载,请注明出处:https://www.isclab.org.cn/2021/04/06/%e5%9f%ba%e4%ba%8et-closeness%e7%9a%84%e5%be%ae%e8%81%9a%e9%9b%86%e6%95%b0%e6%8d%ae%e8%84%b1%e6%95%8f%e7%ae%97%e6%b3%95/

(1)
bfsbfs
上一篇 2021年3月29日 下午2:09
下一篇 2021年4月14日 下午3:49

相关推荐

  • 爬虫中的攻与防

    爬虫技术是获取数据的利器,它避免了繁琐又低效的人工数据搜集。爬虫带来获取数据极大便利的同时,也催生了反爬技术的发展。学术报告以反爬措施以及对抗反爬的手段作为议题,详细介绍了5类反爬…

    2020年5月10日
    1.7K
  • 法律文本可解释性研究

    法律文本可解释性研究是将可解释性研究方法应用到法律文本领域,旨在构建智慧法庭,辅助法官判案,实现法律检索和类案匹配。本次学术报告从案件罪名预测和相似案例匹配两个应用角度进行讲解,对…

    2020年11月22日
    1.3K
  • 预训练在NLP的发展

    自从深度学习火起来后,预训练过程就是做图像或者视频领域的一种比较常规的做法,有比较长的历史了,而且这种做法很有效,能明显促进应用的效果。那预训练在自然语言处理中优势怎样发展起来的呢…

    2019年10月20日
    1.3K
  • 数据样本的质量评估方法

    本报告主要介绍数据样本的质量评估方法。随着数据规模的不断扩大,如何有效评估数据样本的贡献成为提升模型性能和效率的关键问题。报告分析了当前领域内的主要评估方法,讨论了不同评估标准对模…

    2025年2月24日
    1.2K
  • 内存分段和常见段错误

          段错误(segmentation fault)是我们在Linux下编程以及在线提交代码常见的错误。本次学术报…

    2018年7月25日
    995
  • 二进制代码补丁存在性测试

    二进制代码补丁存在性测试(Patch Presence Test, PPT) 旨在检测目标二进制文件是否已应用特定补丁,以确保安全性和合规性。希望在这次学术报告中,大家掌握二进制代…

    2025年3月3日
    1.1K
  • 对抗环境强化学习

    强化学习(Reinforcement learning ,RL )是机器学习领域之一,研究如何通过一系列的顺序决策来达成一个特定目标。本次报告从强化学习的基本框架开始,介绍了强化学…

    2019年12月17日
    1.5K
  • 时空数据挖掘

    物联网技术和人工智能的快速发展,含时间、空间特性的数据指数增长。如何进行多源异构时空数据本身特性出发,和机器学习深度学习技术深入融合,实现数据实现知识发现和信息挖掘,服务于城市发展…

    2021年5月18日
    1.4K
  • 归一化流在表格数据生成中的应用

    归一化流(Normalizing Flows)是一类生成模型,它利用一系列可逆变换将简单分布映射为复杂数据分布,具有精确计算概率密度的能力。在表格数据生成领域,归一化流的应用对于理…

    2024年4月17日
    1.5K
  • Web前端框架对比

    前端开发是创建WEB页面或APP等前端界面呈现给用户的过程,通过HTML,CSS及JavaScript以及衍生出来的各种技术、框架、解决方案,来实现互联网产品的用户界面交互。本次学…

    2021年5月27日
    1.4K