大语言模型调研

针对大语言模型展开调研,介绍大语言模型发展背景和研究现状,通过讲解LLaMA2模型的预训练和微调步骤,全面讲解大语言模型的训练过程,随后对越狱攻击大语言模型的方法进行研究,通过讲解MASTERKEY算法,介绍了自动化生成越狱提示的方法,最后对大语言模型的未来发展分点解析。

大模型调研-徐程柯

原创文章,作者:bfs,如若转载,请注明出处:https://www.isclab.org.cn/2024/01/03/%e5%a4%a7%e8%af%ad%e8%a8%80%e6%a8%a1%e5%9e%8b%e8%b0%83%e7%a0%94/

(0)
bfsbfs
上一篇 2023年12月28日 下午4:28
下一篇 2024年1月17日 下午9:52

相关推荐

  • 成员推理攻击和防御

    机器学习已经演化为了一种服务模式,即机器学习即服务模式。互联网公司或提供模型训练接口,或提供模型预测接口给用户以提供相应的服务。但是,在提供服务的整个过程中,机器学习模型不可避免的…

    2021年6月24日
    3.7K
  • 强化学习中的信用分配

    本报告围绕强化学习中的“信用分配”难题,系统梳理了延迟/稀疏奖励场景下如何精准识别关键动作的研究脉络, 介绍LaRe与VinePPO两项新工作 ,分别利用大模型先验与无偏采样提升奖…

    2026年1月12日
    2.3K
  • 生成扩散模型

    受热力学的启发,扩散模型目前产生了最先进的图像质量:2021年,扩散模型在图像生成方面的效果击败了GAN。除了尖端的生成质量,扩散模型还不需要对抗性训练;在训练效率方面还具有可扩展…

    2022年9月13日
    2.4K
  • 缓解多模态大语言模型的幻觉问题

    该研究针对多模态大语言模型生成内容与输入信息不符的“幻觉”问题,提出两种缓解方法:OPERA在推理阶段通过惩罚过信任与回溯重分配机制减少幻觉;HACL在训练阶段引入幻觉文本作为困难…

    2025年12月1日
    2.8K
  • 第三方库检测技术研究

    第三方库检测技术是一个自动识别应用程序或二进制程序中,所包含的第三方库的技术。对二进制文件或APP进行分析,主要用于安全性评估、软件合规性检查以及漏洞管理。通过本次学术报告对第三方…

    2025年7月15日
    1.8K
  • 属性缺失异质图神经网络

    本报告主要介绍属性缺失异质图神经网络,探讨了异质图研究领域的发展历程,详细介绍了属性缺失异质图的基本概念、常用处理方法以及两种前沿的属性补全异质图神经网络。

    2025年2月20日
    1.7K
  • 扩散模型的后门攻击研究

    文本-图像生成模型在当今生活中有广泛应用,最新研究表明,这类多模态的生成模型也面临着安全风险,例如对抗样本攻击、成员推理攻击和后门攻击等。本次学术报告介绍了文本-图像生成模型最新的…

    2025年9月16日
    2.0K
  • 预训练加密流量分类方法

    本文介绍两种预训练加密流量分类方法:基于BERT和包头信息的分类系统,利用包头字段生成语义句子;YaTC模型采用MFR矩阵和注意力机制,结合MAE进行预训练。未来研究需优化模型效率…

    2025年2月10日
    2.3K
  • 音频事件识别参数优化方法

    目前音频处理领域各种系统的参数优化研究,通常把系统的各个层次(一般包括特征提取、特征向量生成、模型训练等)割裂开来进行相互独立的参数寻优,再将独立寻优结果进行简单组合,构成系统的参…

    2015年1月28日
    2.0K
  • 数据样本的质量评估方法

    本报告主要介绍数据样本的质量评估方法。随着数据规模的不断扩大,如何有效评估数据样本的贡献成为提升模型性能和效率的关键问题。报告分析了当前领域内的主要评估方法,讨论了不同评估标准对模…

    2025年2月24日
    2.1K