Dynamic Progr amming I

(1)

amming I

Michael Tsai

2013/10/3

(2)

台大資訊鐵條回收公司

長度 1

2 3 4 5 6 7 8 9 10

價錢 1 5 8 9 10 17 17 20 24 30



回收鐵條 , 依長度算錢 .



假設你有一條很長的鐵條 , 長度為 n (n 為正整數 )



可以把長鐵條砍成長度為整數的短鐵條



請問如何砍才能夠用這條鐵條換到最多錢 ?

價目表

(3)

長度為 4 的鐵條

長度 1

2 3 4 5 6 7 8 9 10

價錢 1 5 8 9 10 17 17 20 24 30

價目表

9 1 8

5 5 1 1 1 1

1 1 5 1 5 1 5 1 1

8 1

(4)

長度為 n 的鐵條



長度為 n 的鐵條 , 共有幾種要檢查的 ?



每一整數的地方都可以選擇要切 , 或不切



共有 n-1 個”缺口”



因此需要檢查種組合



口吐白沫…

(5)

長度為 n 的鐵條



讓情況變少種一點



如果我們規定鐵條只能越砍越大或一樣 , 則需要檢查的不同方式可用 partition function 來表示



大約為種



仍然為指數 ( 比任何 n 的多項式都長得快 )



(6)

定義一些符號



: 長度為 i 的鐵條賣價 ( 不再繼續砍 )



: 長度為 n 的鐵條的最高賣價 ( 最佳化砍法 )



如果長度為 n 的鐵條最佳化砍法把鐵條砍成 k 段



(7)

類 divide-and-conquer 思維



“ 我請我的遞迴朋友們來解大小較小但同樣的問題”



“ 假設我知道比較小的問題答案 , 如何得出這個問題的答案 ?”

� _� =max ⁡( � _� , � ₁ + � _{�− 1} , � ₂ + � _�−2 , … , � _{�− 1} + � ₁ )

不砍刀這一刀砍在左邊數過來第 i 個

=?

最後再看哪個砍法為可得到最大值即為解 .

(8)

Optimal Substructure



Optimal solutions to a problem incorporat e optimal solutions to related subproblem s, which we may solve independently.

� _� =max ⁡( � _� , � ₁ + � _{�− 1} , � ₂ + � _�−2 , … , � _{�− 1} + � ₁ )

=?

(9)

稍微調整一下



把 subproblem 數目變少一點

�

_�

= max

1 ≤�≤ �

⁡( �

_�

+ �

_{�− �}

)

�

_� =?

這一段砍下來就不再砍

成更小的了 ( 拿去賣 ) 這一段是 subprogram, 找遞迴朋友去解

(10)

Cut-Rod v0.1 alpha

Cut_Rod(p,n) if n==0

return 0 q=-

for i=1 to n

q=max(q, p[i]+Cut_Rod(p,n-i)) return q



猜猜看 , 她會喜歡嗎 ?

n 每增加 1, 時間大約 x2

(11)

Recursion tree

4

3

2 1 0

1 0 0

0

2 1 0

1 0 0

0

同樣的事情做那麼多遍…浪費時間 !

(12)

遞迴式又來拉 ~



結果 :



( 如我們所料 )



<Homework when you have time> :P



Exercise 15.1-1



(13)

假如我們有點記性的話…

 空間換取時間

 做過的事情就不要再做

 “ 記得結果”就好 : 填表與查表

 Dynamic programming: 這裡的 programm ing 指填表 , 不是寫程式

 當

 所有不同的 subprogram 數目是 polynomia l, 及

 解掉 subprogram 的時間也是 polynomial, dynamic programming 方法可以在 pol ynomial time 內完成

(14)

Dynamic programming 的做法



Top-down with memoization

 還是用遞迴的方式來做

 但是每次做之前就先檢查是不是做過一樣的

 如果沒做過就遞迴下去 , 但是要記錄結果

 如果做過就用查表取得之前的結果



Bottom-up method

 把所有的 subprogram 從小排到大

 然後從小排到大來解

 解一個 subproblem 時候 , 所有它所需要的 subsub problem 都已經被解完了



請問哪一個快 ?



課本 p.365 有答案 .

(15)

Cut-Rod v0.1 beta (Top-down)

Memoized_Cut_Rod(p,n)

let r[0..n] be a new array for i=0 to n

r[i]=-

return Memoized_Cut_Rod_Aux(p,n,r)

Memoized_Cut_Rod_Aux(p,n,r) if

return r[n]

if n==0 q=0

else q=-

for i=1 to n

q=max(q,p[i]+Memoized_Cut_Rod_Aux(p,n-i,r)) r[n]=q

return q



_p: 價目表 n: 鐵條長度

p: 價目表 n: 鐵條長度 r: 存最佳解的陣列

(16)

Cut-Rod v0.1 gamma (Bottom-up)

Bottom_Up_Cut_Rod(p,n)

let r[0..n] be a new array r[0]=0

for j=1 to n q=-

for i=1 to j

q=max(q,p[i]+r[j-i]) r[j]=q

return r[n]



Θ

( _�

²

)

(17)

Subproblem graphs

4

3

2 1 0

1 0 0

0

2 1 0

1 0 0

0

4

3

2 1 0 Bottom-up method: Reverse

Topological Sort

Subproblem x 必須要考慮

subproblem 之 optimal solution

<x,y> directed edge

Top-down method: Depth First Search

(18)

Subproblem graphs



Subproblem graph 的大小讓我們可以估計 dyna mic programming 演算法的執行時間



大小 ?



我們指和 .



= 有幾個要解的 subproblem ( 因為有記結果 , 所以一個 subproblem 只要做一次 )



= 每個 subproblem 需要幾個比它小的 subprobl em 的結果



大致的估計 : 和和成線性



(19)

最後的小問題



剛剛的程式只把可以拿多少錢算出來



沒有真的印出要怎麼切



如何解決 ?



用另外一個陣列 ( 大小 ) 紀錄 optimal soluti on 應該切的大小 .



最後依序印出結果即可 .



課本 p. 369 有解答 .



(20)

連串矩陣相乘問題



Matrix multiplication is associative.



以上算出來答案都一樣



�

₁

�

₂

�

₃

�

₄ ……

�

_�

題目 : 求矩陣相乘之解 .

.cols=.rows

and are compatible.

(21)

連串矩陣相乘問題

Matrix-Multiply(A,B) if A.columns != B.rows

error “incompatible dimensions”

else let C be a new A.rows x B.cols matrix for i=1 to A.rows

for j=1 to B.cols

=0

for k=1 to A.cols return C



主要花費時間在這邊 !

�

p q

共花費 pqr 次乘法的時間

(22)

看一個例子



花費之乘法數目 =



花費之乘法數目 =



差十倍 !!



10

100 100 5

5

50

(23)

連串矩陣相乘問題 - 正式版



給一連串的矩陣 , 其中矩陣的大小為 (, 找出一種乘法可以使計算時的乘法數目最少



沒有真的要算結果 , 而只是找出能最快算出結果的方法 .



因為算”怎麼算比較快”多花的時間 , 比”用爛方法直接算”多花的時間少很多



(24)

暴力法有多暴力



全部到底有幾種算法呢 ?



用遞迴定義 :



(n) 之解為 Catalan numbers, , or is also



� (� )=

{

^{� =1}^{� − 1}

^∑ � (�) � (� −�) ¹

if

if .

假設先這樣分 :

(25)

所以不耍暴力了 .



使用 dynamic programming



正規步驟 :

1.

找出最佳解的”結構”

2.

使用遞迴來定義最佳解的花費

3.

計算最佳解的花費

4.

使用已經計算的資訊來構築最佳解

(26)

找出最佳解的”結構”

 總花費 = 的花費 + 的花費 + 把和乘起來的花費

 最佳解的結構 : 假設有的最佳解 , 此一方法為在 k 切一刀 . 則在此最佳解中 , 的相乘方法一定是的最佳相乘方法

 假設不是最佳解 , 則我們可以在中把換成更好的方法 , 則可以找到一個更好的的相乘方法矛盾 .

 子問題的最佳解可以導出大問題的最佳解 !

 最後結論 : 分成兩個子問題 , 並嘗試所有可以切分的地方 (k 值 )



�

_�

�

_{� +1}

… �

_�

�

_�+1

�

_{� +2}

… �

_�

�≤ �

�≤ �< �

在 k 切一刀

(27)

使用遞迴來定義最佳解的花費



遞迴定義 : 使用子問題最佳解的 cost 來定義大問題最佳解的 cost



定義 : 為所需花的最少乘法數



所花乘法數 =



�

_�..�

�

_{�+1.. �}

.rows=

.cols=

.rows=

.cols=

(28)

使用遞迴來定義最佳解的花費



但是我們不知道最佳解中的 k 的值



因此我們必須找所有



最後版本 :



� [ � , � ] =

{

� ≤ �< �

^min {� [ � , � ] + � [ �+1, � ⁰ ] + �

_{� −1}

�

_�

�

_�

}

if

if .

(29)

計算最佳解的花費



純 recursive 解法 : exponential time



使用前面教的 Bottom-up 填表方法 : 每個不同的 subprogram 僅需解 1 次



有幾個不同的問題 ?



, 幾個 i 和 j 的組合 ?



答案 :



�≠ �

�= �

(30)

計算最佳解的花費



如何決定填表的順序呢 ? ( 這次有 i,j 兩個變數 )

�

[

� , �

]

=

{

� ≤ �< �^min {�

[

� , �

]

⁺�

[

� +1, �⁰

]

⁺�_{� −1}�_�� _�}

if

if . 個矩陣相乘

個矩陣相乘

都小於個

我們可以把 j-i+1( 也就是要相乘的 matrix 個數 ) 當作 problem size 的定義

(31)

n=p.length-1

let m[1..n,1..n] and s[1..n-1,2..n] be new tables for i=1 to n

m[i,i]=0

for l=2 to n

for i=1 to n-l+1 j=i+l-1

m[i,j]=

for k=i to j-1

q=m[i,k]+m[k+1,j]+

if q<m[i,j]

m[i,j]=q s[i,j]=k

return m and s



大 problem 的解只會用到小 problem 的解 . 因此慢慢往上長 . 邊界條件先設好 .

把同樣 problem size 的所有 i,j 組合都依序做過

使用遞迴式找出最佳切點 k

Θ(�

³

)

(32)

計算最佳解的花費



用一個例子來 trace code 比較快

Matrix

Dimensi

on 30 x

35 35 x 15 15 x 5 5 x 10 10 x 20 20 x 25

Matrix

Dimensi

on 30 x

35 35 x 15 15 x 5 5 x 10 10 x 20 20 x 25

(33)

使用已經計算的資訊來構築最佳解



前面只印出了花費 , 不是真正的解



怎麼乘才是最後的解



使用 s 陣列的資訊

(34)

使用已經計算的資訊來構築最佳解

Print-Optimal-Parens(s,i,j) if i==j

print else

print “(“

Print-Optimal-Parens(s,i,s[i,j]) Print-Optimal-Parens(s,s[i,j]+1,j) print “)”



(35)

看了兩個例子以後…



問 : 一個問題要有什麼要件才能使用 dynamic programming?



答 :

1.

Optimal substructure

2.

Overlapping Subproblems

(36)

什麼是 Optimal substructure?



Definition: A problem exhibits optimal subst ructure if an optimal solution to the proble m contains within it optimal solutions to su bproblems.



怎麼尋找 optimal substructure 呢 ?

(37)

怎麼尋找 optimal substructure 呢 ?

1. 要得到問題的解答有許多選擇 ( 砍在哪邊 , 切在哪邊 ), 而做這個選擇之後 , 我們有一些 subpro blem 要解決 .

2. 我們假設對於一個問題 , 我們可以找到那個選擇

3. 知道這個選擇以後 , 我們找出哪個 subproblem 可以被拿來應用 , 及剩下的問題 ( 沒有對應到 subp roblem 的 ) 怎麼解決

4. 證明大問題的最佳解中可以直接應用 ( 剪下貼上 ) 子問題的最佳解 .

(38)

Optimal substructure 越簡單越好

=?

�

_� =?

這一段砍下來就不再砍

成更小的了 ( 拿去賣 ) 這一段是 subproblem, 找遞迴朋友去解

versus

(39)

Optimal substructure 越簡單越好

�

₁

�

_{�+ 1}

… �

_�

�

_�+1

�

_{� +2}

… �

_�

1 ≤

�

1 ≤

�< �

在 k 切一刀假設把問題定義成就好 ( 少一個變數 )

此為一個子問題此不為一個子問題 !

除非 k 一直都是 j-1, 否則…

(40)

Optimal substructure 的變化

1.

原始問題的最佳解用了多少個子問題

2.

大問題有多少選擇 ( 選擇用不同的子問題們來獲得最佳解 )

大略來說 , 以上兩者決定 dynamic programming a lgorithm 的執行時間 .

( 之前說的 Subproblem graphs 是另外一種算法 )

多少個子問題有多少選擇執行時間

鐵條資源回收 n

連串矩陣相乘 n-1

多少個子問題有多少選擇執行時間

鐵條資源回收 n

連串矩陣相乘 n-1

Dynamic Progr amming I

amming I

Michael Tsai

2013/10/3

台大資訊鐵條回收公司

2 3 4 5 6 7 8 9 10









長度為 4 的鐵條

2 3 4 5 6 7 8 9 10

長度為 n 的鐵條











長度為 n 的鐵條











定義一些符號









類 divide-and-conquer 思維





� � =max ⁡( � � , � 1 + � �− 1 , � 2 + � �−2 , … , � �− 1 + � 1 )

Optimal Substructure



� � =max ⁡( � � , � 1 + � �− 1 , � 2 + � �−2 , … , � �− 1 + � 1 )

稍微調整一下



�

= max

⁡( �

+ �

)

�

Cut-Rod v0.1 alpha



Recursion tree

遞迴式又來拉 ~











假如我們有點記性的話…

Dynamic programming 的做法

Top-down with memoization

Bottom-up method

請問哪一個快 ?

課本 p.365 有答案 .

Cut-Rod v0.1 beta (Top-down)



Cut-Rod v0.1 gamma (Bottom-up)



Θ

( �

)

Subproblem graphs

Subproblem graphs















最後的小問題









� _� =max ⁡( � _� , � ₁ + � _{�− 1} , � ₂ + � _�−2 , … , � _{�− 1} + � ₁ )

� _� =max ⁡( � _� , � ₁ + � _{�− 1} , � ₂ + � _�−2 , … , � _{�− 1} + � ₁ )

( _�

^∑ � (�) � (� −�) ¹

^min {� [ � , � ] + � [ �+1, � ⁰ ] + �