检索增强生成系统的知识投毒攻击

本报告围绕RAG系统知识投毒攻击展开:PoisonedRAG首次揭示知识库投毒攻击面,提出”检索条件+生成条件”的启发式分解框架;Joint-GCG在此基础上实现检索器与生成器的统一梯度联合优化,显著提升攻击效果并验证了跨模型可迁移性。

2026051813142014

原创文章,作者:bfs,如若转载,请注明出处:https://www.isclab.org.cn/2026/05/18/%e6%a3%80%e7%b4%a2%e5%a2%9e%e5%bc%ba%e7%94%9f%e6%88%90%e7%b3%bb%e7%bb%9f%e7%9a%84%e7%9f%a5%e8%af%86%e6%8a%95%e6%af%92%e6%94%bb%e5%87%bb/

(0)
bfsbfs
上一篇 2026年5月18日 下午12:12
下一篇 2026年5月31日

相关推荐

  • 对抗环境下的鲁棒机器学习

    对抗样本的存在表明现代神经网络是相当脆弱的。为解决这一问题,研究者相继提出了许多方法,其中使用对抗样本进行训练被认为是至今最有效的方法之一。 然而,经过对抗训练后神经网络对于正常样…

    2021年1月21日
    3.0K
  • Not all bytes are equal Neural byte siev

          简单高效的漏洞检测方法一直是信息系统安全领域研究的热点,微软研究人员借助机器学习和深度神经网络开发出一种用于…

    2019年1月21日
    2.4K
  • 大模型在微调阶段的后门攻击

    随着大语言模型的快速发展与广泛应用,其安全问题日益凸显,后门攻击便是主要威胁之一。本次报告介绍了两种针对大模型微调阶段的后门攻击方法,它们分别通过确定目标生成条件和改变Token,…

    2025年11月24日
    3.3K
  • 基于图神经网络的中文短文本匹配方法

    本次报告介绍一种基于图神经网络的中文短文本匹配模型,采用图结构的多粒度输入解决中文文本分词错误、不一致、歧义等问题造成的匹配性能下降问题。同时,报告介绍了文本匹配的研究现状,帮助大…

    2020年6月27日
    3.6K
  • 可解释的假新闻检测

    虚假新闻对社会产生了许多负面影响。现有假新闻检测方法按照输入条件,可分为基于新闻内容及其外部知识的方法,以及基于社交上下文的方法。最新的方法在检测假新闻方面取得了较高的精度,然而这…

    2022年11月14日
    3.1K
  • Glibc内存管理2

          内存管理是指软件运行时对计算机内存资源的分配和使用的技术。其最主要的目的是如何高效,快速的分配,并且在适当的…

    2019年6月19日
    2.7K
  • 代码变更表示学习技术

    代码变更表示学习技术通常将代码变更进行结构化或序列化的中间表示,并将中间表示输入到表示学习模型以获取代码变更中更细粒度的特征,是众多软件工程任务的重要环节之一。本次报告介绍了2类任…

    2023年10月23日
    2.5K
  • 基于网络一致性的对抗样本检测

    人工智能系统面临着多种安全威胁,其中对抗样本攻击被广泛应用于诸如计算机视觉、自然语言处理、音频处理以及恶意软件检测等多个领域。本文介绍了常见的对抗样本检测方法和原理。特别的,简单分…

    2020年12月20日
    3.0K
  • Automated Machine Learning

          机器学习是件很复杂的事情,在机器学习向更多领域扩展的时候,遇到了机器学习专家这一资源的限制。自动机器学习(A…

    2019年3月4日
    2.6K
  • 软件定义网络拓扑发现技术

    软件定义网络,作为一种可编程的新型网络架构,相比于传统网络具有许多的优点,在网络可视化、流量监控、访问控制等网络管理和运维领域中具有得天独厚的优势。而由于软件定义网络的控制器要求对…

    2020年7月26日
    2.8K