机器学习中的数据不平衡问题

admin • 2018年12月17日上午11:23 • 学术报告 • 阅读 3059

数据不平衡问题是指一个类别的数据个数远远少于另一个类别的数据个数，通常这种问题被称为“数据不平衡”问题，在这种情况下，机器学习分类器要从庞大的负面（不相关）样本中，寻找少量正面（相关）样本所蕴含的信息。本次报告简要介绍了数据不平衡问题的基本概念，解决该问题的几种方法，以及在不同情况下如何选择这些方法等。

附件-机器学习中的数据不平衡问题.pdf

原创文章，作者：admin，如若转载，请注明出处：https://www.isclab.org.cn/2018/12/17/%e5%ad%a6%e6%9c%af%e6%8a%a5%e5%91%8a-%e6%9c%ba%e5%99%a8%e5%ad%a6%e4%b9%a0%e4%b8%ad%e7%9a%84%e6%95%b0%e6%8d%ae%e4%b8%8d%e5%b9%b3%e8%a1%a1%e9%97%ae%e9%a2%98/

admin

Transformer中的Multi-Head Attention

上一篇 2018年12月17日上午11:08

Using Sentiment Representation Learning to Enhance Gender Classification for User Profiling

下一篇 2018年12月17日下午3:31

基于LSTM-CRF的序列标注算法

条件随机场（conditional random fields）是一种满足马尔可夫性质的条件概率图模型。它很好地解决了隐马尔可夫模型…

学术报告 2018年1月29日
03.8K
学术报告

基于深度学习的恶意软件检测

1.恶意软件检测发展历史2.深度学习在恶意软件检测上的应用3.恶意软件反检测技术

2020年9月27日
03.2K
学术报告

AI测试：历史与发展

本报告重点讲解了AI测试的发展历史，从2007年Murphy等人认为AI系统是不可测试到后续变形测试、差分测试、覆盖测试、突变测试等传统测试方法的引入，再到正确性、鲁棒性、隐私性、…

2022年8月23日
33.3K
学术报告

深度神经网络模型窃取防御方法

模型窃取防御技术能够促进深度神经网络的健康发展，推动数据交流与共享。本次报告从大范围的模型窃取防御领域，聚焦到一类算法，从数学公式上对算法进行详细的分析，并对实验结果进行详细解读，…

2023年9月27日
13.3K
学术报告

面向生成模型的模型窃取方法

针对判别模型窃取及防御方法的研究日趋成熟，近期的研究表明，生成模型同样面临模型窃取威胁。本次学术报告重点介绍了关于生成模型的窃取方法的原理，以及其与判别模型窃取方法、评价指标的区别…

2022年7月19日
13.5K
学术报告

AI幻觉陷阱与创造力

聚焦大模型生成中“幻觉”问题的原理、检测方法及其创造力价值。内容涵盖AI幻觉的定义与分类、典型案例、LLM-Check与Verify-and-Edit两种前沿算法的原理与实验评估，…

2025年6月9日
03.5K
学术报告

CVE-2013-2551漏洞成因与利用分析

1. 简介 VUPEN在Pwn2Own2013上利用此漏洞攻破了Win8+IE10，5月22日VUPEN在其博客上公布了漏洞的细节。它是一个ORG 数组整数溢出漏洞，由于此漏洞的特…

2014年11月19日
03.3K
学术报告

时序知识图谱推理方法

时序知识图谱推理根据历史时序知识图谱中已知事实，预测查询中缺失的实体或关系，避免知识图谱不完整性对知识驱动系统造成的影响。本次学术报告首先讲解了时序知识图谱推理基本概念，然后详细介…

2023年9月27日
03.3K
学术报告

群体认知诊断技术研究

智慧教育系统的不断发展促进了在线学习的用户数量爆炸式增长，对于学生认知水平诊断要求不断提高，群体认知诊断技术能够帮助平台挖掘学习群体的共性需求，增进教学效果。本次学术报告介绍了群体…

2025年10月11日
03.1K
学术报告

半监督学习研究综述

半监督学习(Semi-Supervised Learning，SSL)是模式识别和机器学习领域研究的重点问题，是监督学习与无监督学习相结合的一种学习方法。本次报告首先讲述了半监督学…

2020年3月3日
04.0K

机器学习中的数据不平衡问题

相关推荐