大语言模型调研

bfs • 2024年1月3日上午10:25 • 学术报告 • 阅读 3318

针对大语言模型展开调研，介绍大语言模型发展背景和研究现状，通过讲解LLaMA2模型的预训练和微调步骤，全面讲解大语言模型的训练过程，随后对越狱攻击大语言模型的方法进行研究，通过讲解MASTERKEY算法，介绍了自动化生成越狱提示的方法，最后对大语言模型的未来发展分点解析。

大模型调研-徐程柯

大模型调研-徐程柯下载

原创文章，作者：bfs，如若转载，请注明出处：https://www.isclab.org.cn/2024/01/03/%e5%a4%a7%e8%af%ad%e8%a8%80%e6%a8%a1%e5%9e%8b%e8%b0%83%e7%a0%94/

bfs

第21届信息安全与对抗技术竞赛筹备工作正式开启

上一篇 2023年12月28日下午4:28

DNN中的理论可解释性

下一篇 2024年1月17日下午9:52

学术报告

域自适应网络框架DANE

本次报告介绍一种域自适应网络嵌入框架DANE，该框架解决了嵌入空间偏移和嵌入分布偏移的问题。在DANE中，来自多个网络的节点通过一组共享的可学习参数被编码为向量，以便向量共享对齐的…

2021年3月1日
23.5K
学术报告

数据处理：飞一般的感觉

本次报告介绍了Python中数据读取和处理的优化方法，对比了csv、pkl、feather、json等数据存储格式的读写速度与空间占用，分析了各数据格式的具体应用场景，同时引入混合…

2022年12月26日
13.1K
学术报告

缺乏先验知识条件下的模型窃取方法

随着机器学习的快速发展，图像分类、恶意软件识别等多个领域都通过建立机器学习模型解决相应的问题。但由于一些训练出的模型可能涉及训练数据的隐私信息与模型的商业价值，所以其安全性一直备受…

2021年4月14日
23.3K
学术报告

深度半监督聚类技术

研究深度半监督聚类方法，首先利用自编码器对高维数据降维处理，同时提取构建三种范围的约束信息：主动构建的成对约束、带标签的种子约束、簇间大小比例约束；最后融合三种约束信息指导编码器训…

2023年4月23日
03.3K
学术报告

增强认知诊断结果的可解释性

认知诊断通过挖掘学习者行为、心理和认知之间的关系，利用学习者的学习数据，对其认知状态进行综合评估和诊断，其输出结果，即学生对于不同知识概念的熟练程度应与实际情况相符，具有高度的可解…

2024年10月17日
03.2K
学术报告

多视图聚类技术

多视图聚类技术旨在利用不同视图之间信息的互补性和一致性增强模型的鲁棒性，提高聚类准确率。本次报告首先讲述多视图聚类的基本概念，然后结合两篇算法对完全多视图聚类和不完全多视图聚类方法…

2023年12月27日
03.6K
学术报告

高斯混合模型及求解算法

高斯混合模型（Gaussian mixture model，GMM）用于对样本的概率密度分布进行估计，而估计…

2019年2月18日
12.9K
学术报告

图嵌入-GraphSAGE

现在大多数方法都是直推式学习，不能直接泛化到未知节点。这些方法是在一个固定的图上直接学习每个节点embedding，但是大多情况图是会演化的，当网络结构改变以及新节点的出现，直推…

2020年7月6日
03.7K
学术报告

DEEP-GAUSSIAN-MIXTURE-MODEL

近年来，尽管针对监督任务的深度模型取得了巨大成功，但机器学习和统计学界对深度聚类方法的研究有限。在这次学术报告中，我们将讨论深度高斯混合聚类，一个由经典高斯混合模型推广而来的强…

2019年10月27日
03.3K
学术报告

表格数据生成：GAN模型的演进与未来

表格数据生成能为深度学习扩充不平衡数据，同时也能避免隐私问题，研究如何生成高保真表格数据具有重要意义。本次报告分析了各个生成模型的优劣，以及GAN在表格数据领域的创新思路。

2023年8月15日
03.3K

大语言模型调研

相关推荐