强化学习基础与实战

bfs • 2022年3月28日下午5:07 • 学术报告 • 阅读 2929

本报告介绍了强化学习领域基本概念，详细介绍了Q-Learning算法和Deep Q Learning算法的原理，简要梳理了了两种算法的发展脉络，以经典案例windy grid-world演示了Q-Learning算法应用过程，介绍了强化学习方法在网络空间安全、自然语言处理等领域的应用。

强化学习基础与实战-门元昊

强化学习基础与实战-门元昊下载

原创文章，作者：bfs，如若转载，请注明出处：https://www.isclab.org.cn/2022/03/28/%e5%bc%ba%e5%8c%96%e5%ad%a6%e4%b9%a0%e5%9f%ba%e7%a1%80%e4%b8%8e%e5%ae%9e%e6%88%98/

bfs

高准确率的鲁棒加密恶意流量实时检测方法

上一篇 2022年3月21日下午5:17

重点高校学科能力查询分析平台简介

下一篇 2022年3月30日

学术报告

网络爬虫技术介绍

网络爬虫，是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本，它们被广泛用于互联网搜索引擎或其他类似网…

2019年4月3日
02.9K
学术报告

差分隐私原理及应用

大数据时代隐私泄露成为了一个严重的问题，大量的个人信息在网上传播。另一方面大数据时代对数据的可用性也有一定的要求。因此当前如何在保障用户的隐私的同时，提供一定的可用性成为一个关键问…

2020年5月17日
14.4K
学术报告

认知扭曲识别研究

认知扭曲是认知行为治疗中的核心概念，与抑郁、焦虑等心理障碍的形成和维持密切相关，但现有很多研究主要关注情绪倾向或表层语义，难以刻画个体更深层的思维偏差与认知模式，同时认知扭曲往往存…

2026年4月8日
02.2K
学术报告

机器学习模型后门攻击检测

本次学术报告简要介绍了人工智能系统面临的各种安全威胁，通过将对抗样本与后门攻击进行多方面比较，从而引入了机器学习模型后门攻击的原理和检测方法，以及后门攻击技术的应用领域。

2021年8月22日
13.6K
学术报告

符号执行简介

符号执行（Symbolic Execution）是一种程序分析技术。其可以通过分析程序来得到让特…

2019年1月2日
03.2K
学术报告

联邦学习及其后门攻击方法初探

本次报告对联邦学习及其后门攻击方法展开介绍，阐述了联邦学习的发展脉络和三大主要框架，介绍了联邦学习安全性问题及后门攻击分类方法，重点讲解经典的集中式/分布式联邦后门攻击方法，启发思…

2022年5月16日
13.4K
学术报告

人工智能模型的公平性测试——既要公平，也要正确

人工智能技术在决策系统等领域发挥了重要作用。用于模型训练的数据集中含有显示或者隐式的敏感属性，模型往往会利用敏感属性的特征做出决策，导致人工智能模型在公平性方面出现偏差，产生严重的…

2025年3月31日
23.0K
学术报告

MySQL事务机制

事务是MySQL数据库用户保证一组sql操作的完整性的一种机制，确保一组操作能够全部成功或者全部失败，不会出…

2018年11月2日
02.7K
学术报告

检索增强生成系统的知识投毒攻击

本报告围绕RAG系统知识投毒攻击展开：PoisonedRAG首次揭示知识库投毒攻击面，提出”检索条件+生成条件”的启发式分解框架；Joint-GCG在此基础…

2026年5月18日
01.3K
学术报告

机器学习常用的可解释方法

可解释性对于建立用户与决策模型之间的信任关系至关重要，提高机器学习模型的可解释性和透明性是机器学习在现实任务中进一步发展和应用的关键。本次报告带大家了解机器学习常用的可解释方法的基…

2020年10月25日
03.3K

强化学习基础与实战

相关推荐