模型窃取防御:从被动溯源到主动防御

本次学术报告探讨模型窃取防御方法,重点介绍两种前沿防御方案。ModelShield采用自适应鲁棒水印技术,通过查询响应分布自动注入水印,实现被动溯源与版权验证;QUEEN则基于查询敏感度分析与输出扰动机制,动态反制攻击,实现主动防御。

模型窃取防御:从被动溯源到主动防御-杨树

原创文章,作者:bfs,如若转载,请注明出处:https://www.isclab.org.cn/2025/12/08/%e6%a8%a1%e5%9e%8b%e7%aa%83%e5%8f%96%e9%98%b2%e5%be%a1%ef%bc%9a%e4%bb%8e%e8%a2%ab%e5%8a%a8%e6%ba%af%e6%ba%90%e5%88%b0%e4%b8%bb%e5%8a%a8%e9%98%b2%e5%be%a1/

(0)
bfsbfs
上一篇 2025年12月1日 下午1:06
下一篇 2025年12月15日 下午4:22

相关推荐

  • Spectre攻击及检测

    2018年初,推测执行攻击Spectre的出现表明,一些软件尽管通过了如模糊测试、符号执行等技术的安全检测,但是在执行过程中,攻击者还是可以通过推测执行窃取重要信息。而且,推测执行…

    2022年8月12日
    1.1K
  • 大模型赋能的模糊测试用例生成技术

    随着大模型技术的兴起和发展,软件漏洞模糊测试方法在新技术的赋能下,可以实现更好的代码覆盖率和漏洞发现数量。本次学术报告针对结合大模型实现模糊测试用例生成的方法,介绍了Fuzz4Al…

    2024年9月3日
    1.0K
  • 面向深度学习软件库的API层的漏洞挖掘方法

    深度学习软件库作为构建和训练深度学习模型的基础,对深度学习软件库进行检测、挖掘软件库的代码漏洞,是保障深度学习模型的可靠性的基础之一。本次报告介绍了2种基于API层的深度学习软件库…

    2023年2月27日
    851
  • 提高对抗鲁棒性的特征降噪方法

    当深度学习以惊人的准确性执行各种各样任务的同时,在图像分类等领域的深度神经网络却容易受到对抗样本的攻击,从而输出错误的预测结果。本次学术报告首先说明了对抗攻防的主要方法分类和残差网…

    2021年4月19日
    1.0K
  • 缺失模态的情绪变化识别

    随着多模态情绪识别应用不断发展,真实场景中的模态缺失问题对模型鲁棒性提出了挑战。本次学术报告聚焦缺失模态下的情绪变化识别,介绍了基于单模态专家融合与难度感知课程学习的代表性方法,为…

    2025年12月30日
    404
  • 虚拟化平台操作系统内核级恶意攻击行为及其检测技术

          虚拟化技术的提出为操作系统内核安全的保护引入了新的思路和手段——虚拟机监视器( Virtual Machin…

    2019年5月20日
    778
  • 基于深度学习的恶意流量检测方法

    近年来,基于机器学习的算法在恶意流量检测领域中越来越流行,但此类算法通常使用浅层模型,在训练之前需要一组专家手工制作的特征来预处理数据。此类方法的主要问题是,在不同类型的场景下,手…

    2020年12月27日
    3.2K
  • 软件定义网络拓扑发现技术

    软件定义网络,作为一种可编程的新型网络架构,相比于传统网络具有许多的优点,在网络可视化、流量监控、访问控制等网络管理和运维领域中具有得天独厚的优势。而由于软件定义网络的控制器要求对…

    2020年7月26日
    918
  • 大语言模型调研

    针对大语言模型展开调研,介绍大语言模型发展背景和研究现状,通过讲解LLaMA2模型的预训练和微调步骤,全面讲解大语言模型的训练过程,随后对越狱攻击大语言模型的方法进行研究,通过讲解…

    2024年1月3日
    742