数据挖掘中的数据清洗方法

admin • 2018年5月14日下午3:53 • 学术报告 • 阅读 1618

数据清洗是数据挖掘工作中很重要的一部分工作，目的是解决数据的质量问题，将“脏”数据变成标准的、干净的数据，更加适合挖掘。本次报告从预处理阶段、缺失值处理、重复数据清理、格式清洗、异常值处理、数据转化等6个方面详细介绍常用的数据清洗方法。

原创文章，作者：admin，如若转载，请注明出处：https://www.isclab.org.cn/2018/05/14/%e6%95%b0%e6%8d%ae%e6%8c%96%e6%8e%98%e4%b8%ad%e7%9a%84%e6%95%b0%e6%8d%ae%e6%b8%85%e6%b4%97%e6%96%b9%e6%b3%95/

admin

GBDT梯度提升决策树

上一篇 2018年5月7日上午9:27

梯度消失和梯度爆炸的原因及解决方案

下一篇 2018年5月21日上午10:03

学术报告

Weakness Identification of Binary Program Function of Pseudo-code by Incorporating Structure and Sequence Information with Attention-Residual Connections

The research objectives are toidentify weaknesses in binary program functions and combine …

2023年7月4日
01.4K
学术报告

用户画像建模

本次报告介绍了用户画像建模的相关基本概念，以及用于短文本处理的用户画像构建LDA-RCC组合模型。基本概念包过用户画像的作用、构建过程、分类等。LDA-RCC组合模型解决了传统文本…

2021年3月9日
41.4K
学术报告

http协议概览

HTTP 协议本身并不复杂，理解起来也不会花费太多学习成本，但很多前端工程师常常忽视了 HTTP 协议这部分基础内容。实际上，如果想要在专业技术道路上走得更坚实，绝对不能绕开学习 …

2020年4月25日
21.5K
学术报告

基于元学习的知识图谱补全技术

知识图谱补全是知识图谱技术研究热点。以前的知识图谱补全方法需要大量的训练实例，而知识图谱中普便存在“长尾数据”现象，大多关系无法提供大量样本数据。本次学术报告通过将元学习方法思想引…

2021年6月27日
02.2K
学术报告

针对文本嵌入模型的模型反演攻击方法研究

研究针对文本嵌入模型的模型反演攻击，揭示了自然语言处理领域面临的隐私泄露风险。本次学术报告介绍了关于文本嵌入模型模型反演攻击的最新方法，并指明了现有的缺陷和未来发展方向。

2024年11月5日
01.4K
学术报告

格式化字符串漏洞

介绍了格式化字符串漏洞的常见形式，以及在Windows32和Linux64下的两种利用思路，可以扩展到其他漏…

2018年7月15日
01.4K
学术报告

图半监督学习

图半监督学习是半监督学习中的一种，基于聚类假设和流形假设，利用少量的有标记样本和大量的未标记样本，提高训练得…

2018年9月3日
01.2K
学术报告

深度生成模型

近年，机器学习已经在计算机视觉、语音识别、语音合成以及自然语言处理（NLP）领域取得了突破性成果，在机器翻译和情感计算中展现的能力也颇令人期待。其中机器学习方法可以分为生成方法（…

2022年1月14日
01.4K
学术报告

基于突变的模糊测试

基于突变的模糊测试对于漏洞检测能力的开发和测试资源的利用较为重要，为了快速、高效地寻找到待测程序中的缺陷，需要提高模糊测试过程的测试效率。本次报告为大家介绍了基于突变的模糊测试的基…

2024年6月19日
11.1K
学术报告

基于视觉直觉的源代码表征

源代码表征是软件工程中的一个重要研究领域，主要关注如何有效地将源代码转化为可以支持各种软件工程任务（如代码搜索、克隆检测、代码自动生成等）的数学模型或数据结构。这些表征通常需要捕获…

2024年9月23日
01.1K

数据挖掘中的数据清洗方法

相关推荐