动态规划算法简介

1 基本概念

维基百科对动态规划(Dynamic programming,DP)的定义:它是一种在数学、计算机科学和经济学中使用的,通过把原问题分解为相对简单的子问题的方式求解复杂问题的方法。 动态规划常常适用于有重叠子问题和最优子结构性质的问题,动态规划方法所耗时间往往远少于朴素解法。

动态规划是通过组合子问题的解而解决整个问题的,通过将问题分解为相互不独立的子问题(各个子问题包含有公共的子问题,也叫重叠子问题),对每个子问题求解一次,将其结果保存到一张辅助表中,避免每次遇到各个子问题时重新计算。动态规划通常用于解决最优化问题。

2 动态规划应用前提

什么时候可以使用动态规范方法解决问题呢?这个问题需要讨论一下,采用动态规范方法的最优化问题需具备三个要素:最优子结构性质、重叠子问题性质和无后效性。

2.1 最优子结构性质

最优子结构是指问题的一个最优解中包含了其子问题的最优解。在动态规划中,每次采用子问题的最优解来构造问题的一个最优解。寻找最优子结构,遵循的共同的模式:

  • 1 问题的一个解可以是做一个选择,得到一个或者多个有待解决的子问题。
  • 2 假设对一个给定的问题,已知的是一个可以导致最优解的选择,不必关心如何确定这个选择。
  • 3 在已知这个选择后,要确定哪些子问题会随之发生,如何最好地描述所得到的子问题空间。
  • 4 利用“剪贴”技术,来证明问题的一个最优解中,使用的子问题的解本身也是最优的。

最优子结构在问题域中以两种方式变化:

  • 1 利用“剪贴”技术,来证明问题的一个最优解中,使用的子问题的解本身也是最优的。
  • 2 在决定一个最优解中使用哪些子问题时有多少个选择。

动态规划按照自底向上的策略利用最优子结构,即:首先找到子问题的最优解,解决子问题,然后逐步向上找到问题的一个最优解。为了描述子问题空间,可以遵循这样一条有效的经验规则,就是尽量保持这个空间简单,然后在需要时再扩充它。

注意:

在不能应用最优子结构的时候,就一定不能假设它能够应用。 警惕使用动态规划去解决缺乏最优子结构的问题。使用动态规划时,子问题之间必须是相互独立的。可以这样理解,N个子问题域互不相干,属于完全不同的空间。

2.2 重叠子问题性质

用来解决原问题的递归算法可以反复地解同样的子问题,而不是总是产生新的子问题。重叠子问题是指当一个递归算法不断地调用同一个问题。动态规划算法总是充分利用重叠子问题,通过每个子问题只解一次,把解保存在一个需要时就可以查看的表中,每次查表的时间为常数。

由计算出的结果反向构造一个最优解:把动态规划或者是递归过程中作出的每一次选择都保存下来(保存的是每次作出的选择),在最后就可以通过这些保存的选择来反向构造出最优解

做备忘录的递归方法:这种方法是动态规划的一个变形,它本质上与动态规划是一样的,但是比动态规划更好理解!

 

  • 1 使用普通的递归结构,自上而下的解决问题。
  • 2 当在递归算法的执行中每一次遇到一个子问题时,就计算它的解并填入一个表中。以后每次遇到该子问题时,只要查看并返回表中先前填入的值即可。

 

2.3 无后效性

即子问题的解一旦确定,就不再改变,不受在这之后、包含它的更大的问题的求解决策影响。

3 动态规划设计步骤

动态规划问题设计步骤如下:

 

  • 1 描述最优解的结构。
  • 2 递归定义最优解的值。
  • 3 按自底向上的方式计算最优解的值。
  • 4 由计算出的结果构造出一个最优解。

 

第一步是选择问题的在什么时候会出现最优解,通过分析子问题的最优解而达到整个问题的最优解。在第二步,根据第一步得到的最优解描述,将整个问题分成小问题,直到问题不可再分为止,层层选择最优,构成整个问题的最优解,给出最优解的递归公式。第三步根据第二步给的递归公式,采用自底向上的策略,计算每个问题的最优解,并将结果保存到辅助表中。第四步骤是根据第三步中的最优解,借助保存在表中的值,给出最优解的构造过程。

4 应用举例

0-1背包问题,问题描述:给定n种物品和一背包。物品i的重量是Wi,其价值为Pi,背包的容量为j。问应如何选择装入背包的物品,使得装入背包中物品的总价值最大?

0-1背包的状态转换方程为: f[i,j] = Max{ f[i-1,j-Wi]+Pi( j >= Wi ), f[i-1,j] }。

其中f[i,j]表示在前i件物品中选择若干件放在承重为 j 的背包中,可以取得的最大价值。Pi表示第i件物品的价值。决策:为了背包中物品总价值最大化,第 i件物品应该放入背包中吗 ?

有编号分别为a,b,c,d,e的五件物品,它们的重量分别是2,2,6,5,4,它们的价值分别是6,3,5,4,6,现在给你个承重为10的背包,如何让背包里装入的物品具有最大的价值总和?

动态规划算法简介

只要能通过找规律手工填写出上面这张表就算理解了0-1背包的动态规划算法。

首先要明确这张表是自底向上,自左向右生成的。

为叙述方便,用e2单元格表示e行2列的单元格,这个单元格的意义是用来表示只有物品e时,有个承重为2的背包,那么这个背包的最大价值是0,因为e物品的重量是4,背包装不下。对于d2单元格,表示只有物品e和d时,承重为2的背包,所能装入的最大价值,仍然是0,因为物品e,d都不能装入背包。同理,c2=0,b2=3,a2=6。

对于承重为8的背包,a8=15,是怎么得出的呢?根据01背包的状态转换方程,需要考察两个值,一个是f[i-1,j],对于这个例子来说就是b8的值9,另一个是f[i-1,j-Wi]+Pi;在这里, f[i-1,j]表示我有一个承重为8的背包,当只有物品b,c,d,e四件可选时,这个背包能装入的最大价值,f[i-1,j-Wi]表示我有一个承重为6的背包(等于当前背包承重减去物品a的重量),当只有物品b,c,d,e四件可选时,这个背包能装入的最大价值,f[i-1,j-Wi]就是指单元格b6,值为9,Pi指的是a物品的价值,即6;由于f[i-1,j-Wi]+Pi = 9 + 6 = 15 大于f[i-1,j] = 9,所以物品a应该放入承重为8的背包;由此得到a8=15。

5 总结

动态规划的核心就是找到问题的最优子结构,在找到最优子结构之后的消除重复子问题。最后采用动态规划的自底向上的递推可以轻松的找出最优解的构造过程。

 

——————吕占斌,2015.01.30

原创文章,作者:admin,如若转载,请注明出处:https://www.isclab.org.cn/2015/01/29/%e5%8a%a8%e6%80%81%e8%a7%84%e5%88%92%e7%ae%97%e6%b3%95%e7%ae%80%e4%bb%8b/

(0)
adminadmin
上一篇 2015年1月28日 下午4:05
下一篇 2015年2月2日

相关推荐

  • 学术论文评审意见生成方法研究

    学术论文投稿数量的不断增长带来巨大审稿压力,而人工智能和大数据的发展为学术论文自动化评审提供了契机。本次学术报告介绍了学术论文评审意见生成的两种最新方法,为减轻审稿人负担、提高评审…

    2025年9月22日
    1.0K
  • 数据集不平衡评估方法

    本报告围绕“数据集不平衡程度评估”展开,聚焦于如何科学量化多类数据中的结构性不平衡问题,突破传统以样本比例为核心的评估局限。报告系统回顾了不平衡评估的发展脉络,分析了现有方法在面对…

    2025年7月28日
    1.1K
  • 走近特定音频识别(之三)—— 检索 Vs 识别

    在说明计算机如何进行特定音频识别这个问题之前,我们有必要对两个我们经常接触到的概念加以区分——“检索”和“识别”。     刚刚接触音频信号处理的朋友们常常会混淆这两个概念,本人刚…

    学术报告 2014年10月25日
    1.1K
  • 梯度消失和梯度爆炸的原因及解决方案

          在训练层数较多的神经网络的过程中,使用基于反向传播的梯度优化算法来优化参数有可能会遇到梯度消失或梯度爆炸的问…

    2018年5月21日
    1.8K
  • TCP之可靠数据传输

          TCP协议是面向连接的可靠数据传输协议,如何在不可靠协议IP协议的上层实现可靠数据传输,主要通过差错检验、分…

    学术报告 2018年4月10日
    1.3K
  • 归一化流在表格数据生成中的应用

    归一化流(Normalizing Flows)是一类生成模型,它利用一系列可逆变换将简单分布映射为复杂数据分布,具有精确计算概率密度的能力。在表格数据生成领域,归一化流的应用对于理…

    2024年4月17日
    1.7K
  • Deep Learning词向量生成–CBOW和Skip-gram

      Deep Learning词向量生成的方法通过神经网络模型让机器自动学习到每个词有效的特征表示,而CBOW模型和Skip-gram模型是目前最流行、常用的Deep learni…

    学术报告 2017年10月13日
    1.3K
  • 特定安全领域中的对抗样本防御方法

    以深度学习为代表的人工智能技术正在悄然改变人们的生产生活方式,但深度学习模型的部署也带来了一定的安全隐患。对抗样本攻击能使深度学习模型系统进行误判,对各个人工智能应用领域造成了严重…

    2021年8月31日
    1.6K
  • 表格数据隐私保护

    本次报告对表格数据的隐私保护方法展开介绍,介绍了目前常用的表格数据隐私保护方法,重点讲解生成对抗网络的基本原理及其和表格数据隐私保护间关系,详细阐述了经典的利用生成对抗网络生成新表…

    2022年5月25日
    1.1K
  • 时空数据挖掘

    物联网技术和人工智能的快速发展,含时间、空间特性的数据指数增长。如何进行多源异构时空数据本身特性出发,和机器学习深度学习技术深入融合,实现数据实现知识发现和信息挖掘,服务于城市发展…

    2021年5月18日
    1.6K