梯度消失和梯度爆炸的原因及解决方案

admin • 2018年5月21日上午10:03 • 学术报告 • 阅读 3349

在训练层数较多的神经网络的过程中，使用基于反向传播的梯度优化算法来优化参数有可能会遇到梯度消失或梯度爆炸的问题。本次报告从公式推导角度剖析深度学习中发生梯度消失和爆炸的原因，并介绍相应的七种解决方案。

原创文章，作者：admin，如若转载，请注明出处：https://www.isclab.org.cn/2018/05/21/%e6%a2%af%e5%ba%a6%e6%b6%88%e5%a4%b1%e5%92%8c%e6%a2%af%e5%ba%a6%e7%88%86%e7%82%b8%e7%9a%84%e5%8e%9f%e5%9b%a0%e5%8f%8a%e8%a7%a3%e5%86%b3%e6%96%b9%e6%a1%88/

admin

数据挖掘中的数据清洗方法

上一篇 2018年5月14日下午3:53

特征选择方法

下一篇 2018年5月28日上午10:18

学术报告

面向深度学习模型的鲁棒性解释方法研究

深度学习模型的鲁棒性解释方法旨在提升模型在面对输入扰动或对抗攻击时的解释一致性，是增强模型可信性和应用价值的重要研究方向。本次学术报告介绍了该领域的研究背景与发展现状，重点阐述了M…

2024年12月19日
12.6K
学术报告

如何优雅地阅读和复用代码

面对大型软件项目，如何准确、快速地找到目标代码的位置将会极大地加速我们的二次开发。本次报告以GUI程序为例介绍了软件源码查找、修改和使用的一般流程。对初学者的软件项目开发工作大有裨…

2020年1月2日
22.9K
学术报告

对抗样本攻防的两种奇思妙想

围绕图像对抗样本攻防这一核心主题，介绍以 Block Shuffle & Rotation（BSR）为代表的迁移攻击增强策略，以及以 Delta Data Augment…

2025年11月17日
02.6K
学术报告

深度神经网络后门攻击

人工智能模型安全是人工智能应用落地需要考量的重要问题，后门攻击威胁是人工智能模型安全的重要议题。本次学术报告以深度神经网络为后门攻击的对象，从深度神经网络训练的内部机理出发，通过了…

2021年8月15日
33.3K
学术报告

基于模型修改的深度学习后门攻击

本报告介绍了深度学习后门攻击的基本概念、类型划分等背景知识，对一种基于模型权重修改和一种基于模型结构修改的后门攻击算法进行了具体说明，阐述了对于深度学习后门攻击领域现状的未来发展的…

2023年3月20日
13.1K
学术报告

Cache侧信道攻击与防御

本报告讲述了cache侧信道攻击与防御基本分类及理论基础，给出了基于冲突和基于访问两类侧信道攻击和反制措施的基本概念，并对介绍基于映射随机化和基于隔离两类防御方法的文献进行了详细介…

2021年11月23日
84.0K
学术报告

Automated Machine Learning

机器学习是件很复杂的事情，在机器学习向更多领域扩展的时候，遇到了机器学习专家这一资源的限制。自动机器学习（A…

2019年3月4日
02.6K
学术报告

基于行为语义分析的android恶意软件分析方法

Android恶意软件对社会造成较大危害。为此，本文介绍了一种基于关联行为分析的Android恶意软件检测系统，该方法具有较强的行为表征能力，能有效的应对各种进化变异的恶意软件。

2019年8月13日
23.1K
学术报告

大模型赋能的模糊测试用例生成技术

随着大模型技术的兴起和发展，软件漏洞模糊测试方法在新技术的赋能下，可以实现更好的代码覆盖率和漏洞发现数量。本次学术报告针对结合大模型实现模糊测试用例生成的方法，介绍了Fuzz4Al…

2024年9月3日
33.0K
学术报告

从图视角理解多智能体系统安全

多智能体系统安全是当前人工智能研究中的重要方向，与系统稳定性、信息可信性及防御能力密切相关，但现有研究多集中于单智能体输入输出过滤或局部安全策略，难以刻画复杂交互网络中的全局风险传…

2026年4月13日
02.9K

梯度消失和梯度爆炸的原因及解决方案

相关推荐