利用差分隐私噪声扰动的单词替换方法

bfs • 2021年12月7日下午2:47 • 学术报告 • 阅读 2766

在机器学习（ML）和人工智能（AI）时代，保护隐私的数据分析至关重要，在这个时代，一个可用性强的数据集可以提供比优化算法更高的收益。然而现有机制无法提供足够的隐私保障阻碍了自然语言处理（NLP）领域的发展，所以对敏感数据的计算和脱敏处理是近年来的一个重要目标。本报告介绍了数据脱敏的重要性和应用场景，简述了数据脱敏针对多元异构的输入数据所使用的方法，并重点描述利用差分隐私噪声扰动原理的文本数据脱敏方法。

利用差分隐私噪声扰动的单词替换方法-关业礼

利用差分隐私噪声扰动的单词替换方法-关业礼下载

原创文章，作者：bfs，如若转载，请注明出处：https://www.isclab.org.cn/2021/12/07/%e5%88%a9%e7%94%a8%e5%b7%ae%e5%88%86%e9%9a%90%e7%a7%81%e5%99%aa%e5%a3%b0%e6%89%b0%e5%8a%a8%e7%9a%84%e5%8d%95%e8%af%8d%e6%9b%bf%e6%8d%a2%e6%96%b9%e6%b3%95/

bfs

深度学习系统安全性测试及测试样本优先级排序

上一篇 2021年11月29日上午9:51

面向深度学习组件的漏洞挖掘

下一篇 2021年12月12日下午9:56

学术报告

文本生成大模型后门攻击研究

研究文本生成大模型的后门攻击，揭示了现有文本大模型的后门风险。本次学术报告详细介绍了现有文本生成模型的后门分类方法以及基准数据集，在文本大模型的多个下游任务实现了后门攻击，并总结了…

2025年3月24日
13.1K
学术报告

预训练加密流量表征方法-巩锟

本次报告从BERT框架入手，讲解基于预训练的加密流量表征方法。首先介绍加密流量分析的问题和挑战，在基本概念部分着重分析BERT输入表示、预训练过程中的MLM和NSP任务，然后以ET…

2023年8月7日
12.7K
学术报告

格式化字符串漏洞

介绍了格式化字符串漏洞的常见形式，以及在Windows32和Linux64下的两种利用思路，可以扩展到其他漏…

2018年7月15日
02.8K
学术报告

Linux应用软件安装使用原理扫盲

Linux系统是大多数人常见但又不熟悉的操作系统，其在软件安装于使用方法上与Windows有较大的差异。本次…

2018年12月17日
02.6K
学术报告

MySQL事务机制

事务是MySQL数据库用户保证一组sql操作的完整性的一种机制，确保一组操作能够全部成功或者全部失败，不会出…

2018年11月2日
02.5K
学术报告

基于深度学习的恶意流量检测方法

近年来，基于机器学习的算法在恶意流量检测领域中越来越流行，但此类算法通常使用浅层模型，在训练之前需要一组专家手工制作的特征来预处理数据。此类方法的主要问题是，在不同类型的场景下，手…

2020年12月27日
05.3K
Boosting Methods

　　集成学习是机器学习领域中提升单一模型学习效果的典型方法，而Boosting则是集成学习中常用且效果良好的算法之一。通过将Weak learner巧妙地组合成Strong lea…

学术报告 2017年9月14日
12.5K
学术报告

污点分析及其关键技术

目前针对二进制漏洞挖掘主要有三个研究方向：符号执行、污点分析和模糊测试。本次报告首先介绍了污点分析的三个重要…

2019年5月27日
83.8K
学术报告

词向量计算——word2vec算法理解

魏超2014.11.2

2014年11月4日
12.6K
学术报告

检索增强生成系统的知识投毒攻击

本报告围绕RAG系统知识投毒攻击展开：PoisonedRAG首次揭示知识库投毒攻击面，提出”检索条件+生成条件”的启发式分解框架；Joint-GCG在此基础…

2026年5月18日
0943

利用差分隐私噪声扰动的单词替换方法

相关推荐