利用差分隐私噪声扰动的单词替换方法

在机器学习(ML)和人工智能(AI)时代,保护隐私的数据分析至关重要,在这个时代,一个可用性强的数据集可以提供比优化算法更高的收益。然而现有机制无法提供足够的隐私保障阻碍了自然语言处理(NLP)领域的发展,所以对敏感数据的计算和脱敏处理是近年来的一个重要目标。本报告介绍了数据脱敏的重要性和应用场景,简述了数据脱敏针对多元异构的输入数据所使用的方法,并重点描述利用差分隐私噪声扰动原理的文本数据脱敏方法。

利用差分隐私噪声扰动的单词替换方法-关业礼

原创文章,作者:bfs,如若转载,请注明出处:https://www.isclab.org.cn/2021/12/07/%e5%88%a9%e7%94%a8%e5%b7%ae%e5%88%86%e9%9a%90%e7%a7%81%e5%99%aa%e5%a3%b0%e6%89%b0%e5%8a%a8%e7%9a%84%e5%8d%95%e8%af%8d%e6%9b%bf%e6%8d%a2%e6%96%b9%e6%b3%95/

(2)
bfsbfs
上一篇 2021年11月29日 上午9:51
下一篇 2021年12月12日 下午9:56

相关推荐

  • 神经网络模型的覆盖测试

    人工智能系统在近年来取得丰硕的成果,其中神经网络在自动驾驶领域等图像处理方向应用较为广泛。但是神经网络存在安全隐患,容易受到攻击导致决策错误,比如对抗样本攻击和后门攻击。如何测试神…

    2022年1月4日
    1.6K
  • Not all bytes are equal Neural byte siev

          简单高效的漏洞检测方法一直是信息系统安全领域研究的热点,微软研究人员借助机器学习和深度神经网络开发出一种用于…

    2019年1月21日
    1.3K
  • Glibc内存管理1

          内存管理是指软件运行时对计算机内存资源的分配和使用的技术。其最主要的目的是如何高效,快速的分配,并且在适当的…

    2019年6月13日
    1.5K
  • 主题排序算法

        本次报告主要讲解了主题排序算法,通过对pagerank算法以及topic sensitive pagerank算法的原理介绍,引出了…

    学术报告 2018年3月6日
    1.6K
  • web项目开发方法

    本次报告介绍了web项目开发方法,展示了在web开发过程中前后端分离与前后端不分离两种开发模式的基本流程以及优缺点,然后大致介绍了前端与后端各自常用的web框架,最后具体介绍了对外…

    2022年12月19日
    1.5K
  • Web前端框架对比

    前端开发是创建WEB页面或APP等前端界面呈现给用户的过程,通过HTML,CSS及JavaScript以及衍生出来的各种技术、框架、解决方案,来实现互联网产品的用户界面交互。本次学…

    2021年5月27日
    1.6K
  • 聚类知识及其初始化问题

    聚类学习作为机器学习中最为常用的算法,已经广泛的应用于许多领域。本文主要介绍聚类的一些基础知识,并且以概率聚类模型为例,并讲解一个聚类算法:基于t分布的熵惩罚最大期望算法,使大家对…

    2019年8月24日
    1.6K
  • 案件文本分析

    案件文本分析包含多个子任务,比如罪名、刑期、法条裁决、相似案例匹配、Q&A等。人工智能在法律中的应用,其目标是充分提升法治效能,将法律工作者从繁杂的工作中解放出来。本次学术…

    2020年3月29日
    1.6K
  • 从赋能学习到知识追踪

    人工智能的发展,驱动新赋能方式,2018年国家自然科学基金首次在信息科学部下增设“教育信息科学与技术”的专门代码(F0701),同时《地平线报告(2022高等教育版)》智能学习分析…

    2022年9月19日
    1.7K