Dynamic Programming

最后更新于:2022-04-02 01:12:38

# Dynamic Programming - 动态规划 动态规划是一种「分治」的思想,通俗一点来说就是「大事化小,小事化无」的艺术。在将大问题化解为小问题的「分治」过程中,保存对这些小问题已经处理好的结果,并供后面处理更大规模的问题时直接使用这些结果。嗯,感觉讲了和没讲一样,还是不会使用动规的思想解题... 下面看看知乎上的熊大大对动规比较「正经」的描述。 > 动态规划是通过拆分问题,定义问题状态和状态之间的关系,使得问题能够以递推(或者说分治)的方式去解决。 以上定义言简意赅,可直接用于实战指导,不愧是参加过NOI的。 动规的思想虽然好理解,但是要真正活用起来就需要下点功夫了。建议看看下面知乎上的回答。 动态规划最重要的两个要点: 1. 状态(状态不太好找,可先从转化方程入手分析) 1. 状态间的转化方程(从题目的隐含条件出发寻找递推关系) 其他的要点则是如初始化状态的确定(由状态和转化方程得知),需要的结果(状态转移的终点) 动态规划问题中一般从以下四个角度考虑: 1. 状态(State) 1. 状态间的转移方程(Function) 1. 状态的初始化(Initialization) 1. 返回结果(Answer) 动规适用的情形: 1. 最大值/最小值 1. 有无可行解 1. 求方案个数(如果需要列出所有方案,则一定不是动规,因为全部方案为指数级别复杂度,所有方案需要列出时往往用递归) 1. 给出的数据不可随便调整位置 ### 单序列([DP_Sequence](# "单序列动态规划,通常使用 f[i] 表示前i个位置/数字/字母... 使用 f[n-1] 表示最后返回结果。")) 单序列动态规划的状态通常定义为:数组前 i 个位置, 数字, 字母 或者 以第i个为... 返回结果通常为数组的最后一个元素。 按照动态规划的四要素,此类题可从以下四个角度分析。 1. State: f[i] 前i个位置/数字/字母... 1. Function: f[i] = f[i-1]... 找递推关系 1. Initialization: 根据题意进行必要的初始化 1. Answer: f[n-1] ### 双序列([DP_Two_Sequence](# "一般有两个数组或者两个字符串,计算其匹配关系. 通常可用 `f[i][j]`表示第一个数组的前 i 位和第二个数组的前 j 位的关系。")) 一般有两个数组或者两个字符串,计算其匹配关系。双序列中常用二维数组表示状态转移关系,但往往可以使用滚动数组的方式对空间复杂度进行优化。举个例子,以题 [Distinct Subsequences](http://algorithm.yuanbin.me/zh-cn/dynamic_programming/distinct_subsequences.html) 为例,状态转移方程如下: ~~~ f[i+1][j+1] = f[i][j+1] + f[i][j] (if S[i] == T[j]) f[i+1][j+1] = f[i][j+1] (if S[i] != T[j]) ~~~ 从以上转移方程可以看出 `f[i+1][*]` 只与其前一个状态 `f[i][*]` 有关,而对于 `f[*][j]` 来说则基于当前索引又与前一个索引有关,故我们以递推的方式省略第一维的空间,并以第一维作为外循环,内循环为 j, 由递推关系可知在使用滚动数组时,若内循环 j 仍然从小到大遍历,那么对于 `f[j+1]` 来说它得到的 `f[j]` 则是当前一轮(`f[i+1][j]`)的值,并不是需要的 `f[i][j]` 的值。所以若想得到上一轮的结果,必须在内循环使用逆推的方式进行。文字表述比较模糊,可以自行画一个二维矩阵的转移矩阵来分析,认识到这一点非常重要。 小结一下,使用滚动数组的核心在于: 1. 状态转移矩阵中只能取 `f[i+1][*]` 和 `f[i][*]`, 这是使用滚动数组的前提。 1. 外循环使用 i, 内循环使用 j 并同时使用逆推,这是滚动数组使用的具体实践。 代码如下: ~~~ public class Solution { /** * @param S, T: Two string. * @return: Count the number of distinct subsequences */ public int numDistinct(String S, String T) { if (S == null || T == null) return 0; if (S.length() < T.length()) return 0; if (T.length() == 0) return 1; int[] f = new int[T.length() + 1]; f[0] = 1; for (int i = 0; i < S.length(); i++) { for (int j = T.length() - 1; j >= 0; j--) { if (S.charAt(i) == T.charAt(j)) { f[j + 1] += f[j]; } } } return f[T.length()]; } } ~~~ 纸上得来终觉浅,绝知此事要躬行。光说不练假把戏,下面就来几道DP的题练练手。 ### Reference 1. [什么是动态规划?动态规划的意义是什么? - 知乎](http://www.zhihu.com/question/23995189) - 熊大大和王勐的回答值得细看,适合作为动态规划的科普和入门。维基百科上对动态规划的描述感觉太过学术。 1. [动态规划:从新手到专家](http://www.hawstein.com/posts/dp-novice-to-advanced.html) - Topcoder上的一篇译作。
';