人工智能模型的公平性测试

人工智能技术发展迅速,不仅在图像领域,在决策系统等领域也发挥了重要作用。用于模型训练的数据集中含有显示或者隐式的敏感属性(如性别、种族等),模型往往会利用敏感属性的特征做出决策,这将导致人工智能模型在公平性方面出现偏差,产生严重的舆论影响和社会问题,因此需要测试模型的公平性并修复。本次学术报告介绍了人工智能模型公平性的定义和通用的歧视样本生成方法,并聚焦于两个最新的模型公平性修复方法。

网络安全2组-学术报告-人工智能模型的公平性测试-刘洧光-v1.0-2024.09.28

原创文章,作者:bfs,如若转载,请注明出处:https://www.isclab.org.cn/2024/09/29/%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e6%a8%a1%e5%9e%8b%e7%9a%84%e5%85%ac%e5%b9%b3%e6%80%a7%e6%b5%8b%e8%af%95/

(0)
bfsbfs
上一篇 2024年9月23日 下午2:39
下一篇 2024年9月30日 上午11:09

相关推荐

  • AI幻觉陷阱与创造力

    聚焦大模型生成中“幻觉”问题的原理、检测方法及其创造力价值。内容涵盖AI幻觉的定义与分类、典型案例、LLM-Check与Verify-and-Edit两种前沿算法的原理与实验评估,…

    2025年6月9日
    1.3K
  • 面向恶意软件检测系统的对抗样本攻击

    当下投入使用的恶意软件检测系统日益增多,但同时还带来了大量的安全问题,如何有效地提高恶意软件检测系统的鲁棒性变成当下重要的课题。在这里,从攻击者的角度入手,面向恶意软件检测系统,着…

    2020年5月24日
    2.3K
  • 函数级漏洞检测

    本次报告讲述漏洞检测相关基本概念,源码级漏洞检测的一般步骤,主要从关键点选取、代码切片、代码表示等几个方面讲解源码漏洞检测方法,主要针对泛化性、多类型漏洞检测问题进行研究。

    2022年10月30日
    1.2K
  • 图半监督学习

          图半监督学习是半监督学习中的一种,基于聚类假设和流形假设,利用少量的有标记样本和大量的未标记样本,提高训练得…

    2018年9月3日
    1.1K
  • 网络拓扑混淆技术

    这篇报告围绕网络拓扑混淆技术展开,首先阐述了网络拓扑脆弱性及攻击者推理真实结构的威胁,强调了混淆防御的重要性。报告详细介绍了AntiTomo和EigenObfu两种主流方法,包括各…

    2025年4月27日
    1.2K
  • web项目开发方法

    本次报告介绍了web项目开发方法,展示了在web开发过程中前后端分离与前后端不分离两种开发模式的基本流程以及优缺点,然后大致介绍了前端与后端各自常用的web框架,最后具体介绍了对外…

    2022年12月19日
    1.3K
  • 融合多模态交互及语义一致性建模的社交机器人检测

    社交机器人模仿人类在Twitter等社交平台上的行为。数以百万计的机器人通常基于平台API,通过自动化程序控制,通过模仿真实用户以实现恶意目标,检测社交机器人对于净化网络空间环境具…

    2023年7月14日
    1.4K
  • 基于深度学习的源代码漏洞挖掘

    安全漏洞的数量和复杂程度与日俱增,导致漏洞挖掘的成本也在不断升高。而近年对深度学习的研究使得机器具有分析学习能力,如何将深度学习算法应用漏洞挖掘技术成为研究热点。本次报告首先介绍了…

    2020年2月27日
    1.9K
  • 反序列化漏洞简介

          反序列化漏洞是指在服务端过滤不严格的情况下,攻击者通过构造恶意序列化结果,使服务端在反序列化过程中执行恶意代…

    2019年5月6日
    1.6K
  • App个人隐私安全检测技术

    本报告主要介绍了隐私数据类型,以及基本的隐私风险检测方法。第一篇论文侧重于分析APP整体的隐私数据泄露,并根据隐私泄露的风险程度给相应的App进行风险评级;第二篇侧重于研究APP中…

    2022年4月11日
    1.8K