利用差分隐私噪声扰动的单词替换方法

在机器学习(ML)和人工智能(AI)时代,保护隐私的数据分析至关重要,在这个时代,一个可用性强的数据集可以提供比优化算法更高的收益。然而现有机制无法提供足够的隐私保障阻碍了自然语言处理(NLP)领域的发展,所以对敏感数据的计算和脱敏处理是近年来的一个重要目标。本报告介绍了数据脱敏的重要性和应用场景,简述了数据脱敏针对多元异构的输入数据所使用的方法,并重点描述利用差分隐私噪声扰动原理的文本数据脱敏方法。

利用差分隐私噪声扰动的单词替换方法-关业礼

原创文章,作者:bfs,如若转载,请注明出处:https://www.isclab.org.cn/2021/12/07/%e5%88%a9%e7%94%a8%e5%b7%ae%e5%88%86%e9%9a%90%e7%a7%81%e5%99%aa%e5%a3%b0%e6%89%b0%e5%8a%a8%e7%9a%84%e5%8d%95%e8%af%8d%e6%9b%bf%e6%8d%a2%e6%96%b9%e6%b3%95/

(2)
bfsbfs
上一篇 2021年11月29日 上午9:51
下一篇 2021年12月12日 下午9:56

相关推荐

  • Android第三方库检测

    本次报告主要讲述了Android第三方库检测的相关内容。介绍了第三方库的基本概念和相关研究,解释了第三方库检测的基本方法,详细讲解其中的相似性对比方法,主要针对库检测和库版本识别进…

    2022年11月20日
    1.3K
  • 隐私保护的领域自适应迁移学习方法

    本报告讲述了隐私计算技术体系的整体架构及主要理论,给出了迁移学习及领域自适应问题的基本概念,通过详细介绍隐私保护政策下最新的去中心化无监督领域自适应论文以及基于隐私保护的模型联邦个…

    2021年10月11日
    1.4K
  • 基于元学习的知识图谱补全技术

    知识图谱补全是知识图谱技术研究热点。以前的知识图谱补全方法需要大量的训练实例,而知识图谱中普便存在“长尾数据”现象,大多关系无法提供大量样本数据。本次学术报告通过将元学习方法思想引…

    2021年6月27日
    2.1K
  • 基于突变的模糊测试

    基于突变的模糊测试对于漏洞检测能力的开发和测试资源的利用较为重要,为了快速、高效地寻找到待测程序中的缺陷,需要提高模糊测试过程的测试效率。本次报告为大家介绍了基于突变的模糊测试的基…

    2024年6月19日
    1.0K
  • 表格数据生成:GAN模型的演进与未来

    表格数据生成能为深度学习扩充不平衡数据,同时也能避免隐私问题,研究如何生成高保真表格数据具有重要意义。本次报告分析了各个生成模型的优劣,以及GAN在表格数据领域的创新思路。

    2023年8月15日
    1.4K
  • 不完全多视图聚类技术

    不完全多视图聚类技术旨在处理多视图数据中部分视图缺失的问题,确保在数据不完整的情况下仍能进行有效的聚类分析。通过整合各视图的信息,该技术能够弥合视图之间的差异,提升聚类性能。其应用…

    2024年9月10日
    1.1K
  • 软件缺陷自动修复方法

    随着现代软件规模的不断扩大和复杂性的不断提高,软件缺陷调试所消耗的成本也在不断增加,软件缺陷的自动修复成为越来越迫切的需求。软件缺陷自动修复可以分为缺陷定位、补丁生成、补丁验证三个…

    2021年12月20日
    1.8K
  • 面向联邦基础模型的安全评测与防御方法研究

    聚焦IoRT/IIoT场景下联邦基础模型的安全评测与防御,概述联邦微调范式与隐蔽后门风险;重点介绍SecFFT频域一致性检测机制与长期意图建模相结合实现安全加权聚合,以及FL-ID…

    2025年12月22日
    1.5K
  • 基于T-Closeness的微聚集数据脱敏算法

    大数据时代的到来,同时也带来了隐私、敏感信息保护方面的棘手难题。数据脱敏措施层出不穷,K-Anonymity,L-Diversity,T-Closeness,以及相结合的微聚集算法…

    2021年4月6日
    1.8K
  • 组合对抗攻击的自动化搜索方法

    对抗攻击是当下智能系统的新威胁,它使得很多在现实世界中应用的智能系统存在的安全漏洞极大地暴露了出来。近年来,学界提出了多种实现对抗攻击的方法,但是在不知道目标模型的防御细节的情况下…

    2021年5月6日
    1.7K