LLM的强化学习

bfs • 2024年4月3日下午4:01 • 学术报告 • 阅读 3490

ChatGPT问世以来，LLM百花齐放，对我们的生活产生了巨大的影响。然而LLM生成的内容存在信息泄露、无中生有等诸多隐患。通过强化学习技术我们可以将生成内容与人类偏好对齐，控制LLM的生成方向。本次学术报告主要讲解了强化学习在LLM中应用的现状，然后在PPO-max算法中对RLHF流程进行分析，并在RL4F算法中拓展其应用场景，最后对强化学习在LLM中的未来发展和功能进行解析。

数据挖掘-学术报告-LLM中的强化学习—让生成内容更加可控-杨宗源

数据挖掘-学术报告-LLM中的强化学习—让生成内容更加可控-杨宗源下载

原创文章，作者：bfs，如若转载，请注明出处：https://www.isclab.org.cn/2024/04/03/llm%e7%9a%84%e5%bc%ba%e5%8c%96%e5%ad%a6%e4%b9%a0/

bfs

不规则多元时间序列预测研究

上一篇 2024年3月15日下午3:25

2024年第21届信息安全与对抗技术竞赛通知

下一篇 2024年4月3日下午9:00

学术报告

大模型在微调阶段的后门攻击

随着大语言模型的快速发展与广泛应用，其安全问题日益凸显，后门攻击便是主要威胁之一。本次报告介绍了两种针对大模型微调阶段的后门攻击方法，它们分别通过确定目标生成条件和改变Token，…

2025年11月24日
14.1K
学术报告

对抗性扰动下的后门防御方法

后门防御旨在使用神经元剪枝、知识蒸馏等手段消除模型中隐藏的后门，阻止攻击者使用触发器样本控制深度学习模型的输出。本次学术报告主要讲解了两种以对抗性扰动和后门攻击关系为基础的后门防御…

2024年1月17日
13.7K
学术报告

基于协同过滤的推荐算法

推荐系统在现在的生活中随处可见，淘宝天猫的商品推荐，音乐软件的每日歌曲推荐等，协同过滤就是一种很受欢迎的推荐…

2018年8月27日
03.2K
学术报告

源代码补丁正确性测试

源代码补丁正确性测试是自动程序修复（Automated Program Repair, APR）流程的最后一个环节，旨在验证APR所生成的补丁是否真正解决了目标缺陷且未引入新的问题…

2025年3月10日
13.3K
学术报告

基于图结构处理的文本生成

文本生成技术是自然语言处理中一个重要的研究领域，具有广阔的应用前景。传统文本生成的Seq2Seq框架不能有效地利用原始语料中的语义信息，而Graph2Seq模型可以丰富文本的语义知…

2022年2月28日
13.2K
学术报告

基于突变的模糊测试

基于突变的模糊测试对于漏洞检测能力的开发和测试资源的利用较为重要，为了快速、高效地寻找到待测程序中的缺陷，需要提高模糊测试过程的测试效率。本次报告为大家介绍了基于突变的模糊测试的基…

2024年6月19日
12.9K
学术报告

缓冲区溢出漏洞浅析

1.认识漏洞 1.1.漏洞的定义百度：漏洞是在硬件、软件、协议的具体实现或系统安全策略上存在的缺陷，从而可以使攻击者能够在未授权的情况下访问或破坏系统。 Wikip…

2014年10月21日
04.1K
学术报告

智能模型的不确定性估计

智能模型的不确定性是模型内生脆弱性问题的重要表征之一，反映了模型对输入数据预测结果的可信程度，包含了对数据和模型两方面缺陷的量化估计。本次报告介绍了模型不确定性估计工作基本概念，讲…

2023年11月6日
03.2K
学术报告

Not all bytes are equal Neural byte siev

简单高效的漏洞检测方法一直是信息系统安全领域研究的热点，微软研究人员借助机器学习和深度神经网络开发出一种用于…

2019年1月21日
02.8K
学术报告

卷积神经网络在图中的应用

卷积神经网络可以有效提取空间特征，但是它研究的对象还是限制在具有规则空间结构的欧几里得数据。本次学术报告重点…

2018年8月20日
03.6K

LLM的强化学习

相关推荐