对抗环境强化学习

强化学习(Reinforcement learning ,RL )是机器学习领域之一,研究如何通过一系列的顺序决策来达成一个特定目标。本次报告从强化学习的基本框架开始,介绍了强化学习的基本思想;介绍了强化学习算法的三种主要类型:基于策略梯度(Policy Based)、基于值函数(Value Based)和基于模型(Model Based)的算法,并对其中基于值函数的一种经典算法Q-Learning的基本原理进行了详细说明;最后,介绍了一种对抗环境强化学习的算法。

2组-学术报告PPT-对抗环境强化学习-王逸洲-2019.12.08

原创文章,作者:admin,如若转载,请注明出处:https://www.isclab.org.cn/2019/12/17/%e5%af%b9%e6%8a%97%e7%8e%af%e5%a2%83%e5%bc%ba%e5%8c%96%e5%ad%a6%e4%b9%a0/

(0)
adminadmin
上一篇 2019年11月14日 下午2:47
下一篇 2019年12月18日 下午12:02

相关推荐

  • 特定安全领域中的对抗样本防御方法

    以深度学习为代表的人工智能技术正在悄然改变人们的生产生活方式,但深度学习模型的部署也带来了一定的安全隐患。对抗样本攻击能使深度学习模型系统进行误判,对各个人工智能应用领域造成了严重…

    2021年8月31日
    1.6K
  • App个人隐私安全检测技术

    本报告主要介绍了隐私数据类型,以及基本的隐私风险检测方法。第一篇论文侧重于分析APP整体的隐私数据泄露,并根据隐私泄露的风险程度给相应的App进行风险评级;第二篇侧重于研究APP中…

    2022年4月11日
    1.9K
  • 图神经网络可解释方法

    图神经网络模型的可解释性对于建立用户与决策模型之间的信任关系至关重要,为了安全、可信地部署图神经网络模型,需要提高图神经网络模型的可解释性和透明性。本次报告带大家了解图神经网络的可…

    2021年7月11日
    1.5K
  • 生成扩散模型

    受热力学的启发,扩散模型目前产生了最先进的图像质量:2021年,扩散模型在图像生成方面的效果击败了GAN。除了尖端的生成质量,扩散模型还不需要对抗性训练;在训练效率方面还具有可扩展…

    2022年9月13日
    1.8K
  • EM算法的应用——GMM的参数估计

            EM(Expectation-maximization)算法是机器学习十大算法之一。…

    2014年12月11日
    3.2K
  • active self-paced learning

          在机器学习中获得标注数据是一个重要的部分。但是在一些专业领域,标注成本高,成本高,导致了获得标注数据困难。主…

    2019年2月24日
    1.1K
  • 代码异味检测

    本次学术报告对以往实验室软件系统/代码质量评估的研究方向做了一个总结并引出新的概念:代码异味检测。针对代码异味概念,生成原因和研究最新的方向进行了探讨。同时结合两篇论文,从多异味检…

    2023年6月5日
    1.6K
  • 协同训练

        协同训练是一种多视角学习方法,当数据充分时,在具有这种特征的数据集的任何一个视图上均可以利用一定的机器学习算法训练出一个强分类器。但…

    学术报告 2018年1月7日
    1.4K
  • 注意力机制

          注意力机制应用在encoder-decoder模型中,可以使Decoder根据时刻的不同,让每一时刻的输入都…

    2018年10月8日
    1.5K
  • 深度学习模型后门攻击检测

    本报告介绍了深度学习后门攻击基本概念及后门攻击检测发展历史和类型划分等背景知识,对2种基于模型演化策略的后门攻击检测算法进行了具体说明,阐述了深度学习后门攻击检测的发展趋势和未来前…

    2024年5月20日
    1.9K