AI模型计量&图增强的幻觉检测

本次报告以小米SU7等案例引入AI模型计量,概述计量内涵、发展现状与指标体系,并梳理数据评测、算法评测与人工评测方法;进一步聚焦图增强幻觉检测,讲解LapEigvals注意力谱特征与语义图不确定性两类方法的原理、对比实验与未来展望。

2026030213402816

原创文章,作者:bfs,如若转载,请注明出处:https://www.isclab.org.cn/2026/03/02/ai%e6%a8%a1%e5%9e%8b%e8%ae%a1%e9%87%8f%e5%9b%be%e5%a2%9e%e5%bc%ba%e7%9a%84%e5%b9%bb%e8%a7%89%e6%a3%80%e6%b5%8b/

(0)
bfsbfs
上一篇 2026年3月1日 下午4:50
下一篇 2017年6月20日 下午5:09

相关推荐

  • 深度神经网络模型水印保护方法

    摘要:本报告介绍了深度神经网络模型水印的基本概念和嵌入方式,并讲述了两种深度神经网络模型水印保护方法,从水印嵌入、提取和验证三个角度分析了保护模型的原理,提升对模型知识产权保护的认…

    2023年3月12日
    1.4K
  • 成员推理攻击

    成员推理攻击(Membership Inference Attack)作为一种隐私攻击方法,其攻击对象是机器学习目标模型,攻击目标是推理一条或一批数据是否作为目标模型的训练集,以此…

    2022年10月16日
    3.8K
  • 协同训练

        协同训练是一种多视角学习方法,当数据充分时,在具有这种特征的数据集的任何一个视图上均可以利用一定的机器学习算法训练出一个强分类器。但…

    学术报告 2018年1月7日
    1.2K
  • 设计模式在Web开发中 的实践

    模式是一种可复用的解决方案,可用于解决软件设计中遇到的常见问题。本次报告带大家了解web开发中部分设计模式思想以及应用实例 ,以及了解消息中间件(异步、解耦、削峰)的简单使用。

    2020年10月19日
    1.2K
  • 智能体的工具调用攻击

    本报告探讨了大语言模型智能体工具调用机制中的安全漏洞,重点分析了两种新型攻击方法。AMA攻击通过黑盒迭代优化恶意工具的元数据,使其在语义合法的前提下显著提升被智能体选择的概率,在多…

    2026年1月26日
    899
  • web项目开发方法

    本次报告介绍了web项目开发方法,展示了在web开发过程中前后端分离与前后端不分离两种开发模式的基本流程以及优缺点,然后大致介绍了前端与后端各自常用的web框架,最后具体介绍了对外…

    2022年12月19日
    1.2K
  • Android APP共享库加固

        学术报告介绍了一种基于init节区的安卓共享库加固方式、一些防逆向工具和反调试的方法以及解释执行保护共享库的内容。 附件-Andro…

    学术报告 2017年12月11日
    1.1K
  • 智能化系统的安全测试方法

    智能化系统越来越多地部署在对安全性至关重要的领域中,包括无人驾驶汽车和恶意软件检测。在这些领域中,系统行为的正确性和可预测性对于极端案例输入是至关重要的。软件测试作为软件部署前的重…

    2021年3月23日
    1.7K
  • 强化学习基础与实战

    本报告介绍了强化学习领域基本概念,详细介绍了Q-Learning算法和Deep Q Learning算法的原理,简要梳理了了两种算法的发展脉络,以经典案例windy grid-wo…

    2022年3月28日
    1.2K
  • 内部威胁检测方法

    近年来,内部(insider)攻击,包括组织信息系统破坏、信息盗窃、电子欺诈等,具有很强的隐蔽性和破坏性,对个人、企业和国家安全构成了巨大的威胁。因此,我们应该更加关注内部威胁的研…

    2021年10月27日
    1.4K