大语言模型调研

bfs • 2024年1月3日上午10:25 • 学术报告 • 阅读 1478

针对大语言模型展开调研，介绍大语言模型发展背景和研究现状，通过讲解LLaMA2模型的预训练和微调步骤，全面讲解大语言模型的训练过程，随后对越狱攻击大语言模型的方法进行研究，通过讲解MASTERKEY算法，介绍了自动化生成越狱提示的方法，最后对大语言模型的未来发展分点解析。

大模型调研-徐程柯

大模型调研-徐程柯下载

原创文章，作者：bfs，如若转载，请注明出处：https://www.isclab.org.cn/2024/01/03/%e5%a4%a7%e8%af%ad%e8%a8%80%e6%a8%a1%e5%9e%8b%e8%b0%83%e7%a0%94/

bfs

第21届信息安全与对抗技术竞赛筹备工作正式开启

上一篇 2023年12月28日下午4:28

DNN中的理论可解释性

下一篇 2024年1月17日下午9:52

学术报告

半监督学习研究综述

半监督学习(Semi-Supervised Learning，SSL)是模式识别和机器学习领域研究的重点问题，是监督学习与无监督学习相结合的一种学习方法。本次报告首先讲述了半监督学…

2020年3月3日
02.2K
学术报告

二进制代码补丁存在性测试

二进制代码补丁存在性测试（Patch Presence Test, PPT）旨在检测目标二进制文件是否已应用特定补丁，以确保安全性和合规性。希望在这次学术报告中，大家掌握二进制代…

2025年3月3日
01.3K
学术报告

计算机启动流程详解2

计算机从按下电源按钮到操作系统启动完成的过程其实相当复杂，大多数普通用户可能并不了解其中的过程和玄机。本次报…

2018年6月10日
01.5K
学术报告

超图对比学习

超图对比学习是一种利用超图结构来捕捉节点间复杂关系，并通过对比学习机制来优化节点表示的学习方法。本次报告通过两个算法，从超图增强技术、对比损失形式和对比训练策略三个方面介绍超图对比…

2024年8月19日
21.3K
长短期记忆网络

　　LSTM，全称为长短期记忆网络（Long Short-Term Memory networks），是一种深度神经网络，同时也是一种特殊的循环神经网络（RNN）。通过在RNN的网…

学术报告 2017年9月20日
01.7K
学术报告

结合溯源图的APT检测方法

APT攻击事件频发，严重危害着各国政府部门、组织、公司的网络信息安全。溯源图追踪日志之间的因果关系，保留了系统的丰富执行历史信息，便于检测长期且隐蔽的APT攻击。本次汇报首先讲解了…

2021年12月27日
12.9K
学术报告

词向量计算——word2vec算法理解

魏超2014.11.2

2014年11月4日
11.4K
学术报告

& Unsorted bin attack

简单介绍了堆的管理与分配，主要讲述了堆上两种典型的攻击方式，即fast bin attack 和 Unsor…

2019年1月15日
01.5K
学术报告

深度学习模型校准技术

深度学习模型校准技术是模型预测可靠性的重要保障手段之一，其通过正则化或后处理方法调节模型对样本实例上的置信度，使其与预测的真实概率良好匹配。本次报告介绍了深度学习模型校准的基本概念…

2024年7月2日
01.7K
学术报告

从任务划分就开始与众不同的元学习

meta-learning即元学习，也可以称为“learning to learn”。常见的深度学习模型，目的是学习一个用于预测的数学模型。而元学习面向的不是学习的结果，而是学习的…

2022年10月3日
11.4K

大语言模型调研

相关推荐