转载自:http://blog.csdn.net/speedme/article/details/24231197

1. 什么是动态规划

-------------------------------------------

dynamic programming is a method for solving complex problems by breaking them down into simpler subproblems. (通过把原问题分解为相对简单的子问题的方式求解复杂问题的方法)

咦,这不就是分而治之法吗?不,虽然它们的目的是一样的,但它们分解的子问题属性不同。

  • 分而治之将问题划分为互不相交的子问题。
  • 动态规划不同,动态规划应用于子问题重叠情况,即不同的子问题具有公共的子子问题。
动态规划解决的问题必须具备三个属性:最优子结构性质,无后效性,子问题重叠性质。
 
  • 最优子结构:如果问题的最优解所包含的子问题的解也是最优的,就称该问题具有最优子结构,即满足最优化原理。
  • 无后效性:即某阶段状态一旦确定,就不受这个状态以后决策的影响。也就是说,某状态以后的过程不会影响以前的状态,只与当前状态有关。
  • 重叠子问题:即子问题之间是不独立的,一个子问题在下一阶段决策中可能被多次使用到。(该性质并不是动态规划适用的必要条件,但是如果没有这条性质,动态规划算法同其他算法相比就不具备优势)
 
动态规划背基本思想:大致上,若要解一个给定问题,我们需要解其不同部分(即子问题),再合并子问题的解以得出原问题的解。 通常许多子问题非常相似,为此动态规划法试图仅仅解决每个子问题一次,从而减少计算量: 一旦某个给定子问题的解已经算出,则将其记忆化存储,以便下次需要同一个子问题解之时直接查表。 这种做法在重复子问题的数目关于输入的规模呈指数增长时特别有用。
 

2. 流水线调度问题

-----------------------------------------------
  1. Characterize the structure of an optimal solution.           (分析最优解的性质,并刻画其结构特征)
  2. Recursively define the value of an optimal solution.      (递归的定义最优解)
  3. Compute the value of an optimal solution in a bottom-up fashion.       (以自底向上或自顶向下的记忆化方式(备忘录法)计算出最优值)
  4. Construct an optimal solution from computed information.       (根据计算最优值时得到的信息,构造问题的最优解)
下面就根据算法导论上的流水线调度的例子来详解。
 
问题:有两条流水线,每条流水线分别有多个工作站,两个流水线的对应的同一个工作站之间可以传输要加工的产品,但需要一定时间记为ti,j,但单条流水线站之间传输要加工的产品时间可以忽略不计。现在要求工作一个产品所需要的最短时间。流程如下图。
e代表产品进入不同流水线的时间,a代表不同站加工产品所需时间,t代表不同流水线的不同站传递产品的时间。
 
分析:看题目中的图可能不够清楚,我们拿出一个有具体时间的图来分析。如下图:
图中带有阴影部分的箭头代表最优解。那么他们是怎样得出来的呢。下面我们就利用动态规划的步骤来解决这个问题。
 
2.1 构造最优解结构
我们从起点开始分析,首先 我们会选择哪条流水线开始呢,有人会说那肯定是第一条流水线开始啊,因为2+7<4+8.但其实并不是这样,算法导论这个例子举的不好,很容易产生这样的误解。其实不一定选择这条路径,因为你要保证下一条也时间最短,假设S11-S22的时间不是2是4的话,那么选择从第一条流水线开始就是错误的,因为2+7+4>4+8,这样就是第二条流水线到达S22的时间更快。(如果你觉得我这里说的混乱的话可以跳过这一段,没太大影响)。
 
知道这一点之后,我们继续。我们分别记录下达到S11和S21的时间,然后选择下一站,到达S12的路径有两条,到达S22的路径也有两条。我们就是分别从两条中选出最快的哪条作为到达S12和S22的最短时间存入表中。。。。这样一直走到末尾。
 
那么就可以把问题简化为计算通过S1,j 和S2,j 的最短时间路径:
我们知道到达S1,j 站的的路径只有两条:
  • the fastest way through station S1,j-1 and then directly through stationS1,j, or

  • the fastest way through station S2,j-1, a transfer from line 2 to line 1, and then through stationS1,j.

同理到达S2,j 的路径也只有两条:

  • the fastest way through station S2,j-1 and then directly through stationS2,j, or

  • the fastest way through station S1,j-1, a transfer from line 1 to line 2, and then through stationS2,j.

我们要做的工作就是分别得出两个站的最短时间,然后存入表中。

 
2.2 递归定义最优解
上一步中我们分析出了,最优解结构,下面就用递归式来表示得出最优解的过程。
我们用fi[j] 来表示到达Si,j 的最短时间。
首先我们计算出到达第一站的时间:
根据第一步骤中构造的最优解结构我们可以计算出达到S1,j和S2,j的时间:
 
总上所属我们可以写出最有解的递归式如下
 
2.3 以自底向上或自顶向下的记忆化方式(备忘录法)计算出最优值
这一步骤就是上一步中递归式的实现步骤了,下面我就不多说了,直接上伪代码,大家最好自己去实现一遍。
FASTEST-WAY(a, t, e, x, n)
1 f1[1] ← e1 + a1,1
2 f2[1] ←e2 + a2,1
3 for j ← 2 to n
4 do if f1[j - 1] + a1,j ≤ f2[j - 1] + t2,j-1 + a1,j
5 then f1[j] ← f1[j - 1] + a1, j
6 l1[j] ← 1
7 else f1[j] ← f2[j - 1] + t2,j-1 + a1,j
8 l1[j] ← 2
9 if f2[j - 1] + a2,j ≤ f1[j - 1] + t1,j-1 + a2,j
10 then f2[j] ← f2[j - 1] + a2,j
11 l2[j] ← 2
12 else f2[j] ∞ f1[j - 1] + t1,j-1 + a2,j
13 l2[j] ← 1
14 if f1[n] + x1 ≤ f2[n] + x2
15 then f* = f1[n] + x1
16 l* = 1
17 else f* = f2[n] + x2
18 l* = 2
2.4 根据计算得到的结果,构造出最优解(即输出最佳路径)
伪代码:
PRINT-STATIONS(l, n)
1 i ← l*
2 print "line " i ", station " n
3 for j ← n downto 2
4 do i ← li[j]
5 print "line " i ", station " j - 1
如例子中输出的结果为下:

line 1, station 6

line 2, station 5

line 2, station 4

line 1, station 3

line 2, station 2

line 1, station 1

 
 

3 矩阵链乘法

------------------------------------------------
可能大家现在还是有点模糊,下面我们再举一个例子来详细说明动态规划算法流程。
想必大家都学过线性代数,也熟悉矩阵,如果忘了的话也不要紧,下面的问题只涉及到矩阵的乘法。先看题。
 
问题:给定一个矩阵序列〈A1, A2, ..., An〉做乘法,求如何给他们添加上括号,使得操作数最少?
 
分析:可能你还有点看不懂题目,我们下面来解释下,先看看两矩阵A,B相乘的代码。
MATRIX-MULTIPLY(A, B)
1 if columns[A] ≠ rows[B]
2 then error "incompatible dimensions"
3 else for i ← 1 to rows[A] // rows[A]
4 do for j ← 1 to columns[B] // col[B]
5 do C[i, j] ← 0
6 for k ← 1 to columns[A] // col[A]
7 do C[i, j] ← C[i, j] + A[i, k] · B[k, j]
8 return C

从上面的代码中,我们可以看出两个矩阵AB相乘,他们的操作次数为rows[A]*col[B]*col[A].知道这一点之后,我们看下面:

给出三个矩阵:A是10*30,B是30*5,C是5*60,求(AB)C和A(BC)的操作次数。
(AB)C = (10×30×5) + (10×5×60) = 1500 + 3000 = 4500 operations
A(BC) = (30×5×60) + (10×30×60) = 9000 + 18000 = 27000 operations.
这下你应该清楚了题意吧。好,那我们下面想想怎么来减少它的次数。依然按照动态规划的算法流程来解决问题:
(下面,我不会讲的太细,只说些帮助你理解的东西,最好跟着算法导论一起来看,我看了两个多小时才看懂了,囧了。)
 
3.1 构造最优结构
算法导论中提到一个临界值K(就是这个弄瞎我的眼),如何来理解这个K值是什么呢?举个例子。A1*A2*A3三个矩阵相乘,
  • 当(A1*A2)*A3时,此时K=2,即表示分界点为A2.
  • 当A1*(A2*A3)时,此时K=1,即表示分界点为A1.
对于通用式,Ai*.....*Aj(i<j)  ,他们之间存在一个临界值K把他们分开,使得他们计算出来的结果最小。
即:(Ai*.....*Ak)*(Ak+1*.....*Aj)
知道K值是什么之后,我们就进入下一环节,递归求出最优解。
 
3.2 递归求最优解
上面我们知道了临界值K实质就是给一个方程式加括号,当方程式有三个一下值时,很好找到K值,但当方程含有三个以上值的时候该怎么办呢?那就是要利用递归的方法了。
 
对于Ai*.......*Aj  我们记m(i,j) 1 ≤ i ≤ j ≤ n 为方程的最小值。Px为行数或列数(0 ≤ ≤ n)
对于上面的方程你可能不理解,你随便取i和j的值代入进去试一下就懂了。如下:
m[1,2]=m[1,1]+m[2,2]+P0*P1*P2 = P0*P1*P2
上面的例子只要运算一次,下面的就要多次了。
m[1,3]=min{m[1,1]+m[2,3]+P0*P1*P3 , m[1,2]+m[2,3]+P0*P2*P3}
求的之前要先求m[2,3]和m[1,2]的最小值,求出来了之后,再求上面的最小值。
这下应该清楚了吧?如果还是晕晕乎乎的话,那就看下面的实现部分吧,跟着代码走一遍(我就是这样才理解的).
 
3.3 计算出最优解
上面我们得出了他的递归式,下面我们就来实现它。
伪代码:
MATRIX-CHAIN-ORDER(p)
1 n ← length[p] - 1
2 for i ← 1 to n
3 do m[i, i] ← 0
4 for l ← 2 to n ▹l is the chain length.
5 do for i ← 1 to n - l + 1
6 do j ← i + l - 1
7 m[i, j] ← ∞
8 for k ← i to j - 1
9 do q ← m[i, k] + m[k + 1, j] + pi-1 pkpj
10 if q < m[i, j]
11 then m[i, j] ← q
12 s[i, j] ← k
13 return m and s

解释一下:

2-3:将m[i,j],i=j时的值初始化为0.
4:     l其实就是j-i+1,即m[i,j]中元素的个数
5-7:同时移动i和j,保持i,j的距离
8-12:执行的就是递归式中的min()操作,寻找最小的K值,并保存下使得方程最小时,K的值
 
下面给出java代码,运行下。
 1 // Matrix Ai has dimension p[i-1] x p[i] for i = 1..n
2 MatrixChainOrder(int p[])
3 {
4 // length[p] = n + 1
5 n = p.length - 1;
6 // m[i,j] = Minimum number of scalar multiplications (i.e., cost)
7 // needed to compute the matrix A[i]A[i+1]...A[j] = A[i..j]
8 // cost is zero when multiplying one matrix
9 for (i = 1; i <= n; i++)
10 m[i,i] = 0;
11
12 for (L=2; L<=n; L++) { // L is chain length
13 for (i=1; i<=n-L+1; i++) {
14 j = i+L-1;
15 m[i,j] = MAXINT;
16 for (k=i; k<=j-1; k++) {
17 // q = cost/scalar multiplications
18 q = m[i,k] + m[k+1,j] + p[i-1]*p[k]*p[j];
19 if (q < m[i,j]) {
20 m[i,j] = q;
21 s[i,j]=k// s[i,j] = Second auxiliary table that stores k
22 // k = Index that achieved optimal cost
23
24 }
25 }
26 }
27 }
28 }
 
算法导论中还有个例子:

matrix

dimension


A1

30 × 35

A2

35 × 15

A3

15 × 5

A4

5 × 10

A5

10 × 20

A6

20 × 25

此时m[2,5]的计算过程如下。

3.4 得出最佳方案
得出最终的结果,无疑就是把方程式输出来,直接看伪代码:
 1 public class MatrixOrderOptimization {
2 protected int[][]m;
3 protected int[][]s;
4 public void matrixChainOrder(int[] p) {
5 int n = p.length - 1;
6 m = new int[n][n];
7 s = new int[n][n];
8 for (int i = 0; i < n; i++) {
9 m[i] = new int[n];
10 m[i][i] = 0;
11 s[i] = new int[n];
12 }
13 for (int ii = 1; ii < n; ii++) {
14 for (int i = 0; i < n - ii; i++) {
15 int j = i + ii;
16 m[i][j] = Integer.MAX_VALUE;
17 for (int k = i; k < j; k++) {
18 int q = m[i][k] + m[k+1][j] + p[i]*p[k+1]*p[j+1];
19 if (q < m[i][j]) {
20 m[i][j] = q;
21 s[i][j] = k;
22 }
23 }
24 }
25 }
26 }
27 public void printOptimalParenthesizations() {
28 boolean[] inAResult = new boolean[s.length];
29 printOptimalParenthesizations(s, 0, s.length - 1, inAResult);
30 }
31 void printOptimalParenthesizations(int[][]s, int i, int j, /* for pretty printing: */ boolean[] inAResult) {
32 if (i != j) {
33 printOptimalParenthesizations(s, i, s[i][j], inAResult);
34 printOptimalParenthesizations(s, s[i][j] + 1, j, inAResult);
35 String istr = inAResult[i] ? "_result " : " ";
36 String jstr = inAResult[j] ? "_result " : " ";
37 System.out.println(" A_" + i + istr + "* A_" + j + jstr);
38 inAResult[i] = true;
39 inAResult[j] = true;
40 }
41 }
42 }
 

4. 动态规划原理

-----------------------------------------
通过前面的两个例子,大家对动态规划有了初步的理解。下面我们从原理的解读来分析动态规划,标题1中我们讲到动态规划需要维持三种特性最优子结构,子问题重叠,无后效性。
 
4.1 最优子结构
如果一个问题的最优解包含其子问题的最优解,我们就称此问题具有最优子结构性质。

【例题1】余数最少的路径。
    如图所示,有4个点,分别是A、B、C、D,相邻两点用两条连线C2k,C2k-1(1≤k≤3)表示两条通行的道路。连线上的数字表示道路的长度。定义从A到D的所有路径中,长度除以4所得余数最小的路径为最优路径。
    求一条最优路径。

【分析】在这个问题中,如果A的最优取值可以由B的最优取值来确定,而B的最优取值为(1+3) mod 4 = 0,所以A的最优值应为2,而实际上,路径C1-C3-C5可得最优值为(2+1+1) mod 4 = 0,所以,B的最优路径并不是A的最优路径的子路径,也就是说,A的最优取值不是由B的最优取值决定的,即其不满足最优化原理,问题不具有最优子结构的性质。
    由此可见,并不是所有的“决策问题”都可以用“动态规划”来解决,运用“动态规划”来处理问题必须满足最优化原理。

4.2 重叠子问题

问题利用递归方法会反复地求解相同的子问题,而不是一直生成新的子问题,我们就成该问题是重叠子问题。

在分治方法中通常就每一步都生成全新的子问题,动态规划就是利用重叠子问题性质:对每个子问题球结一次,将解存入一个表中,当再次需要这个子问题时直接查表,每次查表的代价为常数时间。

4.3 无后效性

它是这样一种性质:某阶段的状态一旦确定,则此后过程的演变不再受此前各种状态及决策的影响,简单的说,就是“未来与过去无关”,当前的状态是此前历史的一个完整总结,此前的历史只能通过当前的状态去影响过程未来的演变。具体地说,如果一个问题被划分各个阶段之后,阶段I中的状态只能由阶段I-1中的状态通过状态转移方程得来,与其它状态没有关系,特别是与未发生的状态没有关系。从图论的角度去考虑,如果把这个问题中的状态定义成图中的顶点,两个状态之间的转移定义为边,转移过程中的权值增量定义为边的权值,则构成一个有向无环加权图,因此,这个图可以进行“拓扑排序”,至少可以按它们拓扑排序的顺序去划分阶段。

简单来说就是在状态i求解时用到状态j而状态j求解时用到状态k…..状态N。

而如果求状态N时有用到了状态i这样求解状态的过程形成了环就没法用动态规划解答了,这也是上面用图论理解动态规划中形成的图无环的原因。

也就是说当前状态是前面状态的完美总结,现在与过去无关。
当然,要是换一个划分状态或阶段的方法就满足无后效性了,这样的问题仍然可以用动态规划解。

动态规划问题还有还多,这里就不一一举例子了,如最长公子序列,背包问题,最有二叉搜索树。之后再添加上去,先把上面两个例子理解了。

不得不说动态规划问题好难啊,我ri。

看下这篇博客吧:最大子数组和

算法导论学习-Dynamic Programming的更多相关文章

  1. 算法导论学习---红黑树具体解释之插入(C语言实现)

    前面我们学习二叉搜索树的时候发如今一些情况下其高度不是非常均匀,甚至有时候会退化成一条长链,所以我们引用一些"平衡"的二叉搜索树.红黑树就是一种"平衡"的二叉搜 ...

  2. 动态规划算法详解 Dynamic Programming

    博客出处: https://blog.csdn.net/u013309870/article/details/75193592 前言 最近在牛客网上做了几套公司的真题,发现有关动态规划(Dynamic ...

  3. Python算法之动态规划(Dynamic Programming)解析:二维矩阵中的醉汉(魔改版leetcode出界的路径数)

    原文转载自「刘悦的技术博客」https://v3u.cn/a_id_168 现在很多互联网企业学聪明了,知道应聘者有目的性的刷Leetcode原题,用来应付算法题面试,所以开始对这些题进行" ...

  4. 算法导论学习-prim算法

    一. 关于最小生成树 对于无向连通图G=(V,E),其中V表示图的顶点,E表示图的边,对于每条边都有一个权值,可以理解为边a->b的权值C为从a走到b要走的路程为C.现在我们希望找到一个无回路的 ...

  5. 算法导论学习-RED-BLACK TREE

    1. 红黑树(RED-BLACK TREE)引言: ------------------------------------- 红黑树(RBT)可以说是binary-search tree的非严格的平 ...

  6. 算法导论学习-binary search tree

    1. 概念: Binary-search tree(BST)是一颗二叉树,每个树上的节点都有<=1个父亲节点,ROOT节点没有父亲节点.同时每个树上的节点都有[0,2]个孩子节点(left ch ...

  7. 算法导论学习之线性时间求第k小元素+堆思想求前k大元素

    对于曾经,假设要我求第k小元素.或者是求前k大元素,我可能会将元素先排序,然后就直接求出来了,可是如今有了更好的思路. 一.线性时间内求第k小元素 这个算法又是一个基于分治思想的算法. 其详细的分治思 ...

  8. [算法总结] 动态规划 (Dynamic Programming)

    本文组织结构如下: 前言 最长公共子序列(LCS) 最长不下降子序列(LIS) 最大连续子序列之和 最长回文子串 数塔问题 背包问题(Knapsack-Problem) 矩阵链相乘 总结 前言 在学过 ...

  9. 算法导论学习-heapsort

    heap的定义:如果数组a[1,....n]满足:a[i]>a[2*i] && a[i]>a[2*i+1],1<=i<=n/2,那么就是一个heap,而且是ma ...

随机推荐

  1. Nginx+uWSIG+Django+websocket的实现

    1.Django+websocket django-websocket dwebsocket django-websocket是旧版的,现在已经没有人维护,dwebsocket是新版的,推荐使用dwe ...

  2. hdu 3572 Task Schedule

    Task Schedule 题意:有N个任务,M台机器.每一个任务给S,P,E分别表示该任务的(最早开始)开始时间,持续时间和(最晚)结束时间:问每一个任务是否能在预定的时间区间内完成: 注:每一个任 ...

  3. mysql 导出导入数据库中所有数据

    导出数据库所有数据 >mysqldump -uroot -proot -all hzgajzyz>e:/hzgajzyz.sql 导入数据库所有数据 >source e:/hzgaj ...

  4. 2、分布式文件系统---HDFS

    1.HDFS设计前提与目标 (1)硬件错误是常态而不是异常.  错误检测并快速自动恢复是HDFS最核心设计目标 (2)流式数据访问.运行在HDFS上的应用主要是以流式数据读取为主,做批量处理而不是用户 ...

  5. Kinetic使用注意点--blob

    new Blob(config) 参数: config:包含所有配置项的对象. { points: "存放路径点的数组,可以用一层数组[a,b,c,d].二层数组[[a,b],[c,d]]或 ...

  6. 检测浏览器对HTML5和CSS3支持情况的利器——Modernizr

    Modernizr是什么? Modernizr 是一个用来检测浏览器功能支持情况的 JavaScript 库. 目前,通过检验浏览器对一系列测试的处理情况,Modernizr 可以检测18项 CSS3 ...

  7. button的相关属性

    设置自定义按钮的文字大小 [submit.titleLabel setFont:[UIFont boldSystemFontOfSize:16]]; 设置按钮选中状态的颜色 [btn setTintC ...

  8. CODEVS 1638 修复公路

    题目描述 Description A地区在地震过后,连接所有村庄的公路都造成了损坏而无法通车.政府派人修复这些公路. 给出A地区的村庄数N,和公路数M,公路是双向的.并告诉你每条公路的连着哪两个村庄, ...

  9. 我的PHP之旅--认识PHP

    PHP是什么? php是一个脚本语言,它运行在服务器端并会以纯文本的形式返回到服务器,它是免费的. php可以对数据库中的数据进行:增删改查,可以对数据进行加密,接收表单. php的文件后缀是.php ...

  10. protel dxp快捷键大全

    enter——选取或启动 esc——放弃或取消f1——启动在线帮助窗口tab——启动浮动图件的属性窗口pgup——放大窗口显示比例pgdn——缩小窗口显示比例end——刷新屏幕del——删除点取的元件 ...