LLM的强化学习

ChatGPT问世以来,LLM百花齐放,对我们的生活产生了巨大的影响。然而LLM生成的内容存在信息泄露、无中生有等诸多隐患。通过强化学习技术我们可以将生成内容与人类偏好对齐,控制LLM的生成方向。本次学术报告主要讲解了强化学习在LLM中应用的现状,然后在PPO-max算法中对RLHF流程进行分析,并在RL4F算法中拓展其应用场景,最后对强化学习在LLM中的未来发展和功能进行解析。

数据挖掘-学术报告-LLM中的强化学习—让生成内容更加可控-杨宗源

原创文章,作者:bfs,如若转载,请注明出处:https://www.isclab.org.cn/2024/04/03/llm%e7%9a%84%e5%bc%ba%e5%8c%96%e5%ad%a6%e4%b9%a0/

(0)
bfsbfs
上一篇 2024年3月15日 下午3:25
下一篇 2024年4月3日 下午9:00

相关推荐

  • 隐私保护的领域自适应迁移学习方法

    本报告讲述了隐私计算技术体系的整体架构及主要理论,给出了迁移学习及领域自适应问题的基本概念,通过详细介绍隐私保护政策下最新的去中心化无监督领域自适应论文以及基于隐私保护的模型联邦个…

    2021年10月11日
    1.9K
  • 对抗样本攻防的两种奇思妙想

    围绕图像对抗样本攻防这一核心主题,介绍以 Block Shuffle & Rotation(BSR) 为代表的迁移攻击增强策略,以及以 Delta Data Augment…

    2025年11月17日
    1.5K
  • 联邦学习及其后门攻击方法初探

    本次报告对联邦学习及其后门攻击方法展开介绍,阐述了联邦学习的发展脉络和三大主要框架,介绍了联邦学习安全性问题及后门攻击分类方法,重点讲解经典的集中式/分布式联邦后门攻击方法,启发思…

    2022年5月16日
    2.2K
  • APT攻击行为表示

    本报告介绍了APT攻击行为的基本概念,展示了APT攻击行为表示的方法原理,并分别讲述了面向恶意流量数据场景下的攻击行为检测技术和面向开源威胁情报场景下的攻击行为提取方法,最后简要梳…

    2024年5月19日
    1.8K
  • AI模型计量&图增强的幻觉检测

    本次报告以小米SU7等案例引入AI模型计量,概述计量内涵、发展现状与指标体系,并梳理数据评测、算法评测与人工评测方法;进一步聚焦图增强幻觉检测,讲解LapEigvals注意力谱特征…

    2026年3月2日
    922
  • 时空数据挖掘

    物联网技术和人工智能的快速发展,含时间、空间特性的数据指数增长。如何进行多源异构时空数据本身特性出发,和机器学习深度学习技术深入融合,实现数据实现知识发现和信息挖掘,服务于城市发展…

    2021年5月18日
    2.0K
  • 异质图神经网络

    异构图(HG)也称为异构信息网络,在现实世界中已变得无处不在;因此,HG嵌入(HG embedding)近年来受到了广泛关注,它旨在学习低维空间中的表示,同时保留下游任务的异构结构…

    2022年9月26日
    2.1K
  • 深度神经网络鲁棒性评估方法

    深度学习模型具有高度非线性和特征空间抽象等特性,内部决策逻辑难以解释,导致其实际应用严重受限。本次报告从深度神经网络可解释性的基本概念出发,对常见的解释方法进行简介,并介绍了一篇将…

    2023年11月30日
    1.7K
  • 基于深度学习的恶意软件检测

    1.恶意软件检测发展历史2.深度学习在恶意软件检测上的应用3.恶意软件反检测技术

    2020年9月27日
    1.8K
  • 群体认知诊断技术研究

    智慧教育系统的不断发展促进了在线学习的用户数量爆炸式增长,对于学生认知水平诊断要求不断提高,群体认知诊断技术能够帮助平台挖掘学习群体的共性需求,增进教学效果。本次学术报告介绍了群体…

    2025年10月11日
    1.5K