数据集不平衡评估方法

本报告围绕“数据集不平衡程度评估”展开,聚焦于如何科学量化多类数据中的结构性不平衡问题,突破传统以样本比例为核心的评估局限。报告系统回顾了不平衡评估的发展脉络,分析了现有方法在面对类别重叠、边界复杂等结构特征时的适应能力,并重点介绍了一种基于最小生成树的新型度量方法——MFII,能够联合考虑簇分布与类别混杂程度。通过在多种真实与合成数据集上的实证分析,验证了该方法在稳定性与解释性上的优势。报告最后,讨论了当前方法对高维复杂数据的适配性限制,并提出了未来在多视角建模、深度表示结合等方向的研究展望。

数据集不平衡评估-马西洋

原创文章,作者:bfs,如若转载,请注明出处:https://www.isclab.org.cn/2025/07/28/%e6%95%b0%e6%8d%ae%e9%9b%86%e4%b8%8d%e5%b9%b3%e8%a1%a1%e8%af%84%e4%bc%b0/

(0)
bfsbfs
上一篇 2025年7月25日 下午12:51
下一篇 2025年8月20日

相关推荐

  • 大模型指导的协议模糊测试

    本次报告围绕大模型指导的协议模糊测试技术展开,首先阐述了大模型指导的协议模糊测试的基本概念、研究背景和研究意义,然后介绍了传统协议模糊测试方法的特点与优劣势,并介绍了大模型指导的协…

    2025年5月19日
    609
  • Dropout随机失活

    具有大量参数的深度神经网络是非常强大的机器学习系统。然而,在这样复杂的网络中,过拟合的问题难以解决。复杂的网络结构和缓慢的运行速度导致我们很难在测试时通过组合许多不同大型神经网络的…

    2022年1月21日
    614
  • 基于T-Closeness的微聚集数据脱敏算法

    大数据时代的到来,同时也带来了隐私、敏感信息保护方面的棘手难题。数据脱敏措施层出不穷,K-Anonymity,L-Diversity,T-Closeness,以及相结合的微聚集算法…

    2021年4月6日
    1.3K
  • 污点分析及其关键技术

          目前针对二进制漏洞挖掘主要有三个研究方向:符号执行、污点分析和模糊测试。本次报告首先介绍了污点分析的三个重要…

    2019年5月27日
    1.8K
  • 基于输入输出扰动的模型窃取防御方法

    模型窃取防御技术能够促进深度神经网络的健康发展,推动数据交流与共享。本次报告从输入输出扰动的角度分析了模型窃取防御方法的框架,从数学角度给出了防御的基本原理以及优缺点,利用防御方法…

    2024年7月21日
    586
  • Android Hook 技术分析

      Hook技术就是在事件传送到终点前截获并监控事件的传输,像个钩子钩上事件一样,并且能够在钩上事件时,处理一些自己特定的事件。  附件-Android Hook 技术分析.pdf

    学术报告 2017年11月11日
    665
  • 表格数据隐私保护

    本次报告对表格数据的隐私保护方法展开介绍,介绍了目前常用的表格数据隐私保护方法,重点讲解生成对抗网络的基本原理及其和表格数据隐私保护间关系,详细阐述了经典的利用生成对抗网络生成新表…

    2022年5月25日
    556
  • 网络未知协议逆向技术

    网络协议逆向技术是指根据网络流量数据包进行静态分析,推断其所属协议的字段信息、报文格式、交互模式等信息。针对互联网中存在的大量未知(私有)协议进行逆向分析,发现潜在安全漏洞,对维护…

    2024年12月23日
    941
  • 序列标注模型

    背景知识 序列标注模型被广泛应用于文本处理相关领域,例如分词、词性标注、命名实体识别等方面。现有的序列标注模型主要有HMM,MEMM 以及 CRF,通过对这几种自然语言处理中常用的…

    2015年2月2日
    1.2K
  • Spectre攻击及检测

    2018年初,推测执行攻击Spectre的出现表明,一些软件尽管通过了如模糊测试、符号执行等技术的安全检测,但是在执行过程中,攻击者还是可以通过推测执行窃取重要信息。而且,推测执行…

    2022年8月12日
    1.1K