模型窃取防御:从被动溯源到主动防御

本次学术报告探讨模型窃取防御方法,重点介绍两种前沿防御方案。ModelShield采用自适应鲁棒水印技术,通过查询响应分布自动注入水印,实现被动溯源与版权验证;QUEEN则基于查询敏感度分析与输出扰动机制,动态反制攻击,实现主动防御。

模型窃取防御:从被动溯源到主动防御-杨树

原创文章,作者:bfs,如若转载,请注明出处:https://www.isclab.org.cn/2025/12/08/%e6%a8%a1%e5%9e%8b%e7%aa%83%e5%8f%96%e9%98%b2%e5%be%a1%ef%bc%9a%e4%bb%8e%e8%a2%ab%e5%8a%a8%e6%ba%af%e6%ba%90%e5%88%b0%e4%b8%bb%e5%8a%a8%e9%98%b2%e5%be%a1/

(0)
bfsbfs
上一篇 2025年12月1日 下午1:06
下一篇 2025年12月15日 下午4:22

相关推荐

  • 深度学习模型后门攻击检测

    本报告介绍了深度学习后门攻击基本概念及后门攻击检测发展历史和类型划分等背景知识,对2种基于模型演化策略的后门攻击检测算法进行了具体说明,阐述了深度学习后门攻击检测的发展趋势和未来前…

    2024年5月20日
    1.9K
  • 小样本命名实体识别

    在很多场景下,收集大量的有标签的数据是非常昂贵、困难、甚至不可能。因此在特定领域、小语种等缺乏标注资源的情况下,NER 任务往往得不到有效解决。为了解决少量标注数据的命名实体识别,…

    2023年8月30日
    1.1K
  • 动态规划算法简介

    1 基本概念 维基百科对动态规划(Dynamic programming,DP)的定义:它是一种在数学、计算机科学和经济学中使用的,通过把原问题分解为相对简单的子问题的方式求解复杂…

    2015年1月29日
    1.7K
  • 设计模式简介

          需求频繁变化是软件设计的基本特征,提升软件的可复用性、可维护性、可扩展性是软件设计的重要目标。以封装、继承和…

    2019年4月30日
    1.2K
  • 开放式信息抽取技术

    本报告介绍了开放式信息抽取(OIE)的基本概念,展示了Neural OIE的两大类方法原理,并分别讲述了基于Transformer的Nerual OIE技术和利用Meta-Lear…

    2023年5月4日
    1.4K
  • 机器学习常用的可解释方法

    可解释性对于建立用户与决策模型之间的信任关系至关重要,提高机器学习模型的可解释性和透明性是机器学习在现实任务中进一步发展和应用的关键。本次报告带大家了解机器学习常用的可解释方法的基…

    2020年10月25日
    1.6K
  • 机器学习模型后门攻击检测

    本次学术报告简要介绍了人工智能系统面临的各种安全威胁,通过将对抗样本与后门攻击进行多方面比较,从而引入了机器学习模型后门攻击的原理和检测方法,以及后门攻击技术的应用领域。

    2021年8月22日
    1.9K
  • 学术论文评审意见生成方法研究

    学术论文投稿数量的不断增长带来巨大审稿压力,而人工智能和大数据的发展为学术论文自动化评审提供了契机。本次学术报告介绍了学术论文评审意见生成的两种最新方法,为减轻审稿人负担、提高评审…

    2025年9月22日
    1.0K
  • 语义级代码克隆检测

    代码克隆(Code Clone),是指存在于代码库中两个及两个以上相同或者相似的源代码片段, 是软件开发中的常见现象。近年来,针对Ⅳ型克隆即语义级克隆的检测技术受到了广泛关注。主要…

    2022年10月11日
    1.7K