成大研發快訊 - 文摘 成大研發快訊 第二十八卷 第十期 - 2015年四月十日 [ http://research.ncku.edu.tw/re/articles/c/20150410/2.html ]
利用離散型粒子群優化演算法來尋找不規則實驗區域的
均 設計
陳瑞彬
1,*,
許彥文
2,
洪瑛
3,
王偉仲
4 1國立成功大學統計學系 2 國立台灣大學數學系 3 美國紐澤西州立羅格斯大學統計暨生物統計系 4 國立台灣大學應用數學科學所 rbchen@stat.ncku.edu.twComputational Statistics and Data Analysis, 72, 282-297.
有
效率的實驗設計在現今科學研究中扮演了一個重要的角色。主要是現今的科學 實驗多為高維度的情形且實驗花費非常高,故不可能將實驗區域中所有的格子點(用以 代表實驗因子的組合)均做過一次。而均 設計(uniform design, Fang, 1980)是一個常見 的實驗設計方法,因為均 設計是將其實驗點均 地散 在整個實驗區域中。 傳統的均 設計只設定在實驗區域為一個立方體的結構。然而現今實驗中,這種立方 體的實驗區域假設是不一定會成立,例如:Ranjan et al. (2008); Hung et al. (2010);Hung (2011)。針對不是立方體的實驗區域,Chuang and Hung (2010)提出了一個新的均 設計準則並將其命 名為”中心組合差異”(central composite discrepancy, CCD)。其CCD的中心思想是將實驗區域分割成數個小區 域,則對於均 設計而言其每個區域內的合適實驗區域體積比應會和區域內實驗點比例近似。 在這論文中,中心組合差異準則(CCD)是我門用來評估一個實驗設計是否為均 設計的標準。在此我們只 考慮離散型的中心組合差異準則而且實驗區域內的格子點才是我們所會考量的實驗點。所以我們可以將這 均 設計的問題轉換成一個離散型的極值問題,其目標函數如下: MinP∈Z(n,qK ) CCD(P), 其中Z(n, qK) 表示在實驗區域中所有的n點設計組合。在本論文中,我們專注於如何有效率地利用數值計算 的方法找出合適的CCD均 設計,主要是因為CCD均 設計的數值計算問題尚未被完全解決。 考量本論文是要解決一個高維度離散型的極值問題。我們引入了粒子群優化演算法的想法,因為粒子群優 化演算法曾經成功地應用於解決高維度的極值問題上。但是基於離散型極值問題的特性,我們將傳統的粒 子群優化演算法進行修正並提出一個離散型的粒子群優化演算法。除此之外,我們亦針對CCD準則計算進 行相關的計算複雜度分析,發現其計算量將會隨著維度的增加而快速遞增,所以我們引入平行計算的做法 並利用圖形處理單元(GPU)來加速計算。為了展現本論文所提出的計算方法的效力。首先在低維度的問題 上,我們有與其他方法就所選取到的設計進行數值比較。並有展現所提出的離散型粒子群優化演算法在高 維度問題上的數值計算結果。基本上所有結果均可呈現出所提方法的優勢。最後亦應用於一個資料中心溫 度資料收集的問題上(Hung et al., 2010; Hung, 2011)。除了找出針對這資料中心的最佳均 設計外,亦能顯 現出所提數值方法是極具彈性,因為可以依據相關實驗上的需求進行演算法上的修正。
參考文獻:
1. Chuang, S.C., Hung, Y.C., 2010. Uniform design over general input domains with applications to target 1 of 2
成大研發快訊 - 文摘
region estimation in computer experiments. Computational Statistics & Data Analysis 54, 219–232 2. Fang, K.-T., 1980. The uniform design: application of number-theoretic methods in experimental design.
Acta Mathematical Application Sinica 3, 363–372.
3. Hung, Y., 2011. Adaptive probability-based latin hypercube designs. Journal of the American Statistical Association 106 (493), 213–219.
4. Hung, Y., Amemiya, Y., Wu, C.F.J., 2010. Probability-based latin hypercube designs for slid-rectangular regions. Biometrika 97 (4), 961–968.
5. Ranjan, P., Bingham, D., Michailidis, G., 2008. Sequential experiment design for contour estimation from complex computer codes. Technometrics 50 (4), 527–541.