强化学习基础与实战

bfs • 2022年3月28日下午5:07 • 学术报告 • 阅读 1404

本报告介绍了强化学习领域基本概念，详细介绍了Q-Learning算法和Deep Q Learning算法的原理，简要梳理了了两种算法的发展脉络，以经典案例windy grid-world演示了Q-Learning算法应用过程，介绍了强化学习方法在网络空间安全、自然语言处理等领域的应用。

强化学习基础与实战-门元昊

强化学习基础与实战-门元昊下载

原创文章，作者：bfs，如若转载，请注明出处：https://www.isclab.org.cn/2022/03/28/%e5%bc%ba%e5%8c%96%e5%ad%a6%e4%b9%a0%e5%9f%ba%e7%a1%80%e4%b8%8e%e5%ae%9e%e6%88%98/

bfs

高准确率的鲁棒加密恶意流量实时检测方法

上一篇 2022年3月21日下午5:17

重点高校学科能力查询分析平台简介

下一篇 2022年3月30日

学术报告

面向深度学习组件的漏洞挖掘

人工智能软件系统的安全逐渐受到人们的重视，深度学习软件库存在的缺陷可能威胁到框架之上的模型和系统，目前仍然缺少深度学习软件库测试的系统方法。面对深度学习安全领域，针对深度学习软件库…

2021年12月12日
31.7K
学术报告

FNN模型正确性测试及测试样本生成

FNN模型被广泛应用于自动驾驶、医疗诊断等安全关键的领域，因此需要测试模型的正确性，及时发现模型的缺陷并进行模型的修复与再训练。本次学术报告介绍了FNN模型正确性测试中遇到的两个关…

2024年1月26日
01.4K
Android APP共享库加固

学术报告介绍了一种基于init节区的安卓共享库加固方式、一些防逆向工具和反调试的方法以及解释执行保护共享库的内容。附件-Andro…

学术报告 2017年12月11日
21.3K
主题排序算法

本次报告主要讲解了主题排序算法，通过对pagerank算法以及topic sensitive pagerank算法的原理介绍，引出了…

学术报告 2018年3月6日
01.6K
学术报告

网络爬虫技术介绍

网络爬虫，是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本，它们被广泛用于互联网搜索引擎或其他类似网…

2019年4月3日
01.4K
学术报告

贝叶斯网络

贝叶斯网络又称信度网络，是Bayes方法的扩展，是目前不确定知识表达和推理领域最有效的理论模型之一。从1988年由Pearl提出后，已经成为近几年来研究的热点.。

2020年6月21日
01.8K
学术报告

数据处理：飞一般的感觉

本次报告介绍了Python中数据读取和处理的优化方法，对比了csv、pkl、feather、json等数据存储格式的读写速度与空间占用，分析了各数据格式的具体应用场景，同时引入混合…

2022年12月26日
11.3K
学术报告

特定安全攻防场景中的对抗样本生成方法

最新的特定安全攻防场景可以细化为两个研究方向：匿名通信网络的网站指纹防御和僵尸网络的域名生成，以此来介绍对抗样本在防御任务和攻击任务中的应用。网站指纹攻击可以从网站中提取流量模式，…

2021年7月26日
21.9K
学术报告

从任务划分就开始与众不同的元学习

meta-learning即元学习，也可以称为“learning to learn”。常见的深度学习模型，目的是学习一个用于预测的数学模型。而元学习面向的不是学习的结果，而是学习的…

2022年10月3日
11.4K
学术报告

深度神经网络后门攻击

人工智能模型安全是人工智能应用落地需要考量的重要问题，后门攻击威胁是人工智能模型安全的重要议题。本次学术报告以深度神经网络为后门攻击的对象，从深度神经网络训练的内部机理出发，通过了…

2021年8月15日
32.0K

强化学习基础与实战

相关推荐