利用差分隐私噪声扰动的单词替换方法

在机器学习(ML)和人工智能(AI)时代,保护隐私的数据分析至关重要,在这个时代,一个可用性强的数据集可以提供比优化算法更高的收益。然而现有机制无法提供足够的隐私保障阻碍了自然语言处理(NLP)领域的发展,所以对敏感数据的计算和脱敏处理是近年来的一个重要目标。本报告介绍了数据脱敏的重要性和应用场景,简述了数据脱敏针对多元异构的输入数据所使用的方法,并重点描述利用差分隐私噪声扰动原理的文本数据脱敏方法。

利用差分隐私噪声扰动的单词替换方法-关业礼

原创文章,作者:bfs,如若转载,请注明出处:https://www.isclab.org.cn/2021/12/07/%e5%88%a9%e7%94%a8%e5%b7%ae%e5%88%86%e9%9a%90%e7%a7%81%e5%99%aa%e5%a3%b0%e6%89%b0%e5%8a%a8%e7%9a%84%e5%8d%95%e8%af%8d%e6%9b%bf%e6%8d%a2%e6%96%b9%e6%b3%95/

(2)
bfsbfs
上一篇 2021年11月29日 上午9:51
下一篇 2021年12月12日 下午9:56

相关推荐

  • 面向联邦基础模型的安全评测与防御方法研究

    聚焦IoRT/IIoT场景下联邦基础模型的安全评测与防御,概述联邦微调范式与隐蔽后门风险;重点介绍SecFFT频域一致性检测机制与长期意图建模相结合实现安全加权聚合,以及FL-ID…

    2025年12月22日
    881
  • 动态规划探究

          动态规划是用来解决多阶段决策过程最优化问题的一种方法,它的适用问题一般需要具备2个要素ー最优子结构与重叠子问…

    2018年10月22日
    976
  • 小样本命名实体识别

    NER一直是NLP领域中的研究热点。近年来,深度学习方法在特征抽取深度和模型精度上表现优异,已经超过了传统方法,但无论是传统机器学习还是深度学习方法都依赖大量标注数据来训练模型。然…

    2021年5月30日
    1.8K
  • Python对象探究

          探讨了语言的分类方式:编译型语言和解释型语言,动态类型语言和静态类型语言,以及Python对象是如何实现的,…

    2018年7月9日
    852
  • Dropout随机失活

    具有大量参数的深度神经网络是非常强大的机器学习系统。然而,在这样复杂的网络中,过拟合的问题难以解决。复杂的网络结构和缓慢的运行速度导致我们很难在测试时通过组合许多不同大型神经网络的…

    2022年1月21日
    718
  • 多人协作开发Git使用介绍

    本报告介绍多人协作开发中Git的使用,通过讲述版本控制的概念和比对不同版本控制的区别,详细阐述Git底层工作原理及Git多人协作流程和核心用法,掌握Git相关基本知识及Git的核心…

    2023年2月6日
    810
  • 小样本实体关系抽取方法

    信息抽取是自然语言处理中的重要组成部分,特别是在当今信息化社会中,从海量数据中抽取出有用的信息显得格外有意义。实体关系抽取是信息抽取的基础任务。现实生活中存在着长尾分布的问题,这导…

    2021年10月21日
    1.6K
  • 智能体的工具调用攻击

    本报告探讨了大语言模型智能体工具调用机制中的安全漏洞,重点分析了两种新型攻击方法。AMA攻击通过黑盒迭代优化恶意工具的元数据,使其在语义合法的前提下显著提升被智能体选择的概率,在多…

    2026年1月26日
    210
  • 深度生成模型

    近年,机器学习已经在计算机视觉、语音识别、语音合成以及自然语言处理(NLP)领域取得了突破性成果,在机器翻译和情感计算中展现的能力也颇令人期待。 其中机器学习方法可以分为生成方法(…

    2022年1月14日
    947
  • 假设检验(hypothesis testing)

      假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法,其基本思想是应用小概率原理。在假设检验中常见的P值是进行检验决策的依据之一,反映某一事件发生的可能性大小。比较常…

    学术报告 2017年10月13日
    1.0K