利用差分隐私噪声扰动的单词替换方法

在机器学习(ML)和人工智能(AI)时代,保护隐私的数据分析至关重要,在这个时代,一个可用性强的数据集可以提供比优化算法更高的收益。然而现有机制无法提供足够的隐私保障阻碍了自然语言处理(NLP)领域的发展,所以对敏感数据的计算和脱敏处理是近年来的一个重要目标。本报告介绍了数据脱敏的重要性和应用场景,简述了数据脱敏针对多元异构的输入数据所使用的方法,并重点描述利用差分隐私噪声扰动原理的文本数据脱敏方法。

利用差分隐私噪声扰动的单词替换方法-关业礼

原创文章,作者:bfs,如若转载,请注明出处:https://www.isclab.org.cn/2021/12/07/%e5%88%a9%e7%94%a8%e5%b7%ae%e5%88%86%e9%9a%90%e7%a7%81%e5%99%aa%e5%a3%b0%e6%89%b0%e5%8a%a8%e7%9a%84%e5%8d%95%e8%af%8d%e6%9b%bf%e6%8d%a2%e6%96%b9%e6%b3%95/

(2)
bfsbfs
上一篇 2021年11月29日 上午9:51
下一篇 2021年12月12日 下午9:56

相关推荐

  • 流式数据漂移应对方法

    该报告针对流式数据中的概念漂移问题,提出了两种应对方法:PUDD利用预测不确定性实现早期漂移检测,比传统错误率更敏感;CALIPER在漂移发生后基于数据自身判断何时累积足够数据以触…

    2026年5月7日
    149
  • 机器学习中的非凸优化

          机器学习模型可化简为求解一个目标函数/损失函数的最优化问题,根据优化目标及约束的不同,可划分为凸优化(Con…

    2019年6月24日
    3.0K
  • 使用远程服务器搭建深度学习开发环境

    本次报告首先讲解了虚拟化技术的原理和使用方式,结合多种虚拟化方式的特点,介绍了实验室内部的选择和使用情况。之后以实验室常用的系统为例,讲解了使用远程服务器搭建深度学习开发环境的过程…

    2020年2月27日
    2.4K
  • 操作系统结构与内核安全基础

      虽然每个电脑使用者都听说过操作系统,但是大部分人对于操作系统的结构,以及平时计算机安全领域常常提到的“操作系统内核”是十分陌生的。  本次学术报告为大家讲解了操作系统最基本的结…

    学术报告 2017年8月30日
    2.3K
  • Deep Learning词向量生成–CBOW和Skip-gram

      Deep Learning词向量生成的方法通过神经网络模型让机器自动学习到每个词有效的特征表示,而CBOW模型和Skip-gram模型是目前最流行、常用的Deep learni…

    学术报告 2017年10月13日
    2.2K
  • 群体认知诊断技术研究

    智慧教育系统的不断发展促进了在线学习的用户数量爆炸式增长,对于学生认知水平诊断要求不断提高,群体认知诊断技术能够帮助平台挖掘学习群体的共性需求,增进教学效果。本次学术报告介绍了群体…

    2025年10月11日
    1.9K
  • 提示词怎么在别人兜里:提示词窃取攻击

    研究提示词窃取攻击,揭示了提示词面临的泄露风险。本次学术报告介绍了提示词的应用价值和市场体量,讲述了关于提示词窃取攻击的最新方法,指明了现有的缺陷和未来发展方向。

    2025年3月17日
    2.4K
  • 面向恶意软件检测系统的对抗样本攻击

    当下投入使用的恶意软件检测系统日益增多,但同时还带来了大量的安全问题,如何有效地提高恶意软件检测系统的鲁棒性变成当下重要的课题。在这里,从攻击者的角度入手,面向恶意软件检测系统,着…

    2020年5月24日
    3.1K
  • 数据处理:飞一般的感觉

    本次报告介绍了Python中数据读取和处理的优化方法,对比了csv、pkl、feather、json等数据存储格式的读写速度与空间占用,分析了各数据格式的具体应用场景,同时引入混合…

    2022年12月26日
    2.0K
  • 深度学习中的Normalization

    Batch Normalization(BN)自从提出之后,因为效果特别好,很快被作为深度学习的标准工具应用在了各种场合。BN大法虽然好,但是也存在一些局限和问题,诸如当Batch…

    2019年10月29日
    2.2K