缓解多模态大语言模型的幻觉问题

bfs • 2025年12月1日上午10:25 • 学术报告 • 阅读 1379

该研究针对多模态大语言模型生成内容与输入信息不符的“幻觉”问题，提出两种缓解方法：OPERA在推理阶段通过惩罚过信任与回溯重分配机制减少幻觉；HACL在训练阶段引入幻觉文本作为困难负样本进行对比学习，提升表示对齐能力。两种方法均显著降低幻觉率，并保持模型性能，为构建更可靠的多模态AI系统提供关键技术路径。

缓解多模态大语言模型的幻觉问题-王旭

缓解多模态大语言模型的幻觉问题-王旭下载

原创文章，作者：bfs，如若转载，请注明出处：https://www.isclab.org.cn/2025/12/01/%e7%bc%93%e8%a7%a3%e5%a4%9a%e6%a8%a1%e6%80%81%e5%a4%a7%e8%af%ad%e8%a8%80%e6%a8%a1%e5%9e%8b%e7%9a%84%e5%b9%bb%e8%a7%89%e9%97%ae%e9%a2%98/

bfs

2025年第22届信息安全与对抗技术竞赛“智能安全赛”获奖证书下载通知

上一篇 2025年11月25日下午12:00

ISCC2025获奖证书情况说明

下一篇 2025年12月1日下午1:06

学术报告

基于GNN的加密流量方法

本次报告围绕基于GNN的加密流量分类技术展开，首先阐述了基于GNN的加密流量分类的基本概念、研究背景和研究意义，然后介绍了传统加密流量识别方法的特点与优劣势，并介绍了利用GNN进行…

2025年6月4日
0951
学术报告

预训练语言模型GPT3

为了从网络上海量文本信息提取有价值信息，需要使用计算机处理文本数据，首要任务是将文本转换为计算机可以处理的向量化数据。单词是文本的最小单位，所以需要使用语言模型得到词向量表示成为文…

2021年2月19日
11.6K
学术报告

模型窃取防御：从被动溯源到主动防御

本次学术报告探讨模型窃取防御方法，重点介绍两种前沿防御方案。ModelShield采用自适应鲁棒水印技术，通过查询响应分布自动注入水印，实现被动溯源与版权验证；QUEEN则基于查询…

2025年12月8日
0900
学术报告

软件灰盒定向模糊测试技术

随着软件程序日益复杂化、功能多样化，传统的通用模糊测试已经不能满足高效、快速的测试程序中特定高风险区域的崩溃问题。灰盒定向模糊测试应用其特殊的距离计算方法及种子排序方法，将模糊测试…

2025年6月30日
0887
学术报告

面向深度学习模型的鲁棒性解释方法研究

深度学习模型的鲁棒性解释方法旨在提升模型在面对输入扰动或对抗攻击时的解释一致性，是增强模型可信性和应用价值的重要研究方向。本次学术报告介绍了该领域的研究背景与发展现状，重点阐述了M…

2024年12月19日
1992
学术报告

程序的链接

本次报告介绍了程序链接过程的基本概念，以及静态链接和动态链接中文件的结构和链接过程。基本概念包括程序构建（Build）过程、链接的历史和链接的作用等。链接的主要工作就是处理各个模块…

2021年3月15日
31.4K
学术报告

面向生成模型的模型窃取方法

针对判别模型窃取及防御方法的研究日趋成熟，近期的研究表明，生成模型同样面临模型窃取威胁。本次学术报告重点介绍了关于生成模型的窃取方法的原理，以及其与判别模型窃取方法、评价指标的区别…

2022年7月19日
11.3K
学术报告

隐私保护的领域自适应迁移学习方法

本报告讲述了隐私计算技术体系的整体架构及主要理论，给出了迁移学习及领域自适应问题的基本概念，通过详细介绍隐私保护政策下最新的去中心化无监督领域自适应论文以及基于隐私保护的模型联邦个…

2021年10月11日
21.3K
学术报告

LDA主题模型浅析

LDA主题模型可以将文档集中每篇文档的主题按照概率分布的形式给出。同时它是一种无监督学习算法，在训练时不需要…

2018年7月3日
01.2K
学术报告

即时缺陷预测技术研究

本报告讲述了即时软件缺陷预测领域的基本概念，通过详细介绍集成了专家特征和语义特征的变更级软件缺陷预测和缺陷定位模型，启发思考通过结合专家特征和代码行上下文语义特征，提高变更级软件缺…

2022年12月13日
01.3K

缓解多模态大语言模型的幻觉问题

相关推荐