人工智能模型的公平性测试

人工智能技术发展迅速,不仅在图像领域,在决策系统等领域也发挥了重要作用。用于模型训练的数据集中含有显示或者隐式的敏感属性(如性别、种族等),模型往往会利用敏感属性的特征做出决策,这将导致人工智能模型在公平性方面出现偏差,产生严重的舆论影响和社会问题,因此需要测试模型的公平性并修复。本次学术报告介绍了人工智能模型公平性的定义和通用的歧视样本生成方法,并聚焦于两个最新的模型公平性修复方法。

网络安全2组-学术报告-人工智能模型的公平性测试-刘洧光-v1.0-2024.09.28

原创文章,作者:bfs,如若转载,请注明出处:https://www.isclab.org.cn/2024/09/29/%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e6%a8%a1%e5%9e%8b%e7%9a%84%e5%85%ac%e5%b9%b3%e6%80%a7%e6%b5%8b%e8%af%95/

(0)
bfsbfs
上一篇 2024年9月23日 下午2:39
下一篇 2024年9月30日 上午11:09

相关推荐

  • 污点分析及其关键技术

          目前针对二进制漏洞挖掘主要有三个研究方向:符号执行、污点分析和模糊测试。本次报告首先介绍了污点分析的三个重要…

    2019年5月27日
    3.6K
  • 时序网络嵌入方法介绍

    网络嵌入(Network Embedding)是针对网络中节点进行特征学习的一项新兴的研究任务,它旨在将网络中的节点表示成低维、实值、稠密的向量形式,使得得到的向量形式可以在向量空…

    2020年11月16日
    3.1K
  • 深度学习模型公平性修复

    深度学习模型具有强大的特征提取能力,在决策领域得到广泛应用,但往往产生不公平的预测结果,造成不良的社会影响,现有的公平性修复方法往往会导致准确率下降。本次学术报告介绍了一种新的深度…

    2025年9月8日
    2.1K
  • 增强认知诊断结果的可解释性

    认知诊断通过挖掘学习者行为、心理和认知之间的关系,利用学习者的学习数据,对其认知状态进行综合评估和诊断,其输出结果,即学生对于不同知识概念的熟练程度应与实际情况相符,具有高度的可解…

    2024年10月17日
    2.4K
  • 面向生成模型的模型窃取方法

    针对判别模型窃取及防御方法的研究日趋成熟,近期的研究表明,生成模型同样面临模型窃取威胁。本次学术报告重点介绍了关于生成模型的窃取方法的原理,以及其与判别模型窃取方法、评价指标的区别…

    2022年7月19日
    2.8K
  • 基于GAN的表格数据生成

    生成式对抗网络(GAN, Generative Adversarial Networks )是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方法之一。本次学术报告将回顾关…

    2020年10月12日
    4.9K
  • cookie及cookie安全

          Cookie 是网站为辨别用户身份而储存在用户终端上的数据(通常经过加密),是绕开http无状态性的额外手段…

    学术报告 2018年4月23日
    2.6K
  • 爬虫中的攻与防

    爬虫技术是获取数据的利器,它避免了繁琐又低效的人工数据搜集。爬虫带来获取数据极大便利的同时,也催生了反爬技术的发展。学术报告以反爬措施以及对抗反爬的手段作为议题,详细介绍了5类反爬…

    2020年5月10日
    3.0K
  • 多元时间序列异常检测方法研究

    异常检测是时间序列分析中必不可少的任务,判断数据是否符合正态数据分布,不符合的部分称为异常。及时发出异常可以使系统维护人员主动进行维护,从而在欺诈检测、入侵检测和能源管理等实际应用…

    2024年12月19日
    2.6K
  • 模型窃取

    机器学习,尤其是神经网络,已广泛部署在行业环境中,模型通常被部署为预测服务。但是,具有对模型的查询访问权的对手可以窃取该模型以获得与远程目标模型基本一致的替代模型,这就是模型窃取攻…

    2021年5月10日
    4.8K