DQN深度强化学习算法

bfs • 2020年5月31日下午9:02 • 学术报告 • 阅读 2924

本次学术报告主要给大家详细的介绍DQN算法原理及其调参细节，并且进行举例说明和总结以加深大家的理解。

原创文章，作者：bfs，如若转载，请注明出处：https://www.isclab.org.cn/2020/05/31/dqn%e6%b7%b1%e5%ba%a6%e5%bc%ba%e5%8c%96%e5%ad%a6%e4%b9%a0%e7%ae%97%e6%b3%95/

bfs

面向恶意软件检测系统的对抗样本攻击

上一篇 2020年5月24日下午9:41

科研团队

下一篇 2020年6月4日上午1:19

学术报告

层次聚类算法

对聚类算法有一点点入门的时候就知道，几乎所有的“平面型”聚类算法都有一个共同的弱点-难以确定类别数（聚类停止条件），而层次聚类在一定程度上解决了这个问题（它算一种比较古老比较通用的…

2015年1月28日
23.1K
学术报告

XenAccess介绍

1.Xen虚拟平台 Xen Hypervisor 位于操作系统与硬件之间，为其上层运行的操作系统内核提供虚拟化的硬件环境。Xen采用混合模式（Hybrid Model），因此在Xe…

2014年10月21日
02.8K
学术报告

Padding–A CNN operation that cannot be ignored

本次报告主要讲述了padding的种类及其影响，介绍了卷积网络的基本概念和性质、使用padding的主要原因等，详细讲解了特征偏移和信息侵蚀的概念、表现及解决方案，最后对paddi…

2022年12月5日
12.5K
学术报告

超图对比学习

超图对比学习是一种利用超图结构来捕捉节点间复杂关系，并通过对比学习机制来优化节点表示的学习方法。本次报告通过两个算法，从超图增强技术、对比损失形式和对比训练策略三个方面介绍超图对比…

2024年8月19日
22.5K
学术报告

CVE-2013-2551漏洞成因与利用分析

1. 简介 VUPEN在Pwn2Own2013上利用此漏洞攻破了Win8+IE10，5月22日VUPEN在其博客上公布了漏洞的细节。它是一个ORG 数组整数溢出漏洞，由于此漏洞的特…

2014年11月19日
02.8K
学术报告

利用差分隐私噪声扰动的单词替换方法

在机器学习（ML）和人工智能（AI）时代，保护隐私的数据分析至关重要，在这个时代，一个可用性强的数据集可以提供比优化算法更高的收益。然而现有机制无法提供足够的隐私保障阻碍了自然语言…

2021年12月7日
22.7K
学术报告

面向深度学习软件库的API层的漏洞挖掘方法

深度学习软件库作为构建和训练深度学习模型的基础，对深度学习软件库进行检测、挖掘软件库的代码漏洞，是保障深度学习模型的可靠性的基础之一。本次报告介绍了2种基于API层的深度学习软件库…

2023年2月27日
12.8K
学术报告

基于网络一致性的对抗样本检测

人工智能系统面临着多种安全威胁，其中对抗样本攻击被广泛应用于诸如计算机视觉、自然语言处理、音频处理以及恶意软件检测等多个领域。本文介绍了常见的对抗样本检测方法和原理。特别的，简单分…

2020年12月20日
03.0K
HTTPS浅析

HTTPS(全称：Hyper Text Transfer Protocol over Secure Socket Layer)，是以…

学术报告 2018年3月18日
02.8K
深度学习优化算法概述

优化问题是机器学习的核心和本质。在深度学习中，即使有完全相同的数据集和模型框架，使用的优化算法不同，所得到的训练结果也可能不同。深度…

学术报告 2018年1月22日
02.6K

DQN深度强化学习算法

相关推荐