• 沒有找到結果。

資料特性對類神經網路預測效果影響之研究

N/A
N/A
Protected

Academic year: 2021

Share "資料特性對類神經網路預測效果影響之研究"

Copied!
6
0
0

加載中.... (立即查看全文)

全文

(1)

行政院國家科學委員會補助專題研究計畫成果報告

計畫名稱

資料特性對類神經網路預測效果影響之研究

A Study on the Effect of Data Characteristics on the Prediction Performance of Artificial Neural Networks 計畫類別: 個別型計畫 計畫編號: NSC 90-2416-H-004-037 執行期間: 90 年 8 月 1 日至 91 年 7 月 31 日 計畫主持人: 陳春龍(政治大學資訊管理系教授) 共同主持人: 吳忠敏(台北科技大學商業自動化與管理研究所) 計畫參與人員: 呂倩如(政治大學統計研究所) 楊雅媛(政治大學統計研究所) 王治平(政治大學資訊管理研究所) 黃萱懿(政治大學資訊管理研究所) 黃文杰(政治大學資訊管理研究所) 陳嘉芳(政治大學資訊管理研究所) 執行單位: 國立政治大學資訊管理系 Chencl@mis.nccu.edu.tw 中華民國 91 年 10 月 31 日

(2)

資料特性對類神經網路預測效果影響之研究 陳春龍 國立政治大學資訊管理系 一、摘要 迴歸分析與類神經網路是預測的兩種 主要技術。過去幾年來已有超過 50 篇以上 的論文比較兩者在不同領域之應用及其預 測效果。大部分的研究皆認為類神經網路 的效果較佳,但是完整的比較則尚缺乏。 本論文嘗試在線性迴歸模式及非線性迴歸 模式的條件下,隨機產生不同特性的資料 以完整探討資料特性對迴歸分析與類神經 網路之預測效果的影響。這些特性包括常 態 分 配 、 偏 態 分 配 、 非 均 等 變 異 、 Michaelis-Menten 關係模式及指數迴歸模 式。 再者,我們使用區域搜尋法(local search ) 中 的 演 化 策 略 法 (evolution strategies,ES) 來當作類神經網路的學 習(learning)方法以提高其預測功能。 我們稱這種類型的類神經網路為 ESNN。 研究結果顯示資料特性確實會影響迴 歸分析與類神經網路的預測效果。本研究 歸納出一些規則以幫助使用者在面對資料 時可以選擇適當的預測方法。此外,結果 顯示 ES 確實可提高類神經網路的預測效 果。 關鍵詞:迴歸分析,類神經網路,區域搜 尋法,演化策略法類神經網路 Regression analysis and artificial neural networks are two main techniques for prediction. During the past few years, more than fifty technical papers have been published for comparing the predictive performance of their applications in different

artificial neural networks outperformed regression analysis; however, a more thorough comparison was lacking. In this research, we tried to randomly generate different types of data, so as to completely explore the effect of data characteristics on the predictive performance of regression analysis and artificial neural networks. The data characteristics include normal distribution, skew distribution, unequal variances, Michaelis-Menten relationship model and exponential regression model.

In addition, we used the evolution strategies, one of the local search methods, to train artificial neural networks to further improve its performance. We named this type of artificial neural networks ESNN.

Computational results indicate that data characteristics indeed affect the predictive performance of regression analysis and artificial neural networks. Several rules have been summarized to help user select suitable predictive methods for different types of data. The results also show that ES is able to enhance the predictive performance of artificial neural networks.

Keywords: Regression Analysis, Artificial Neural Networks, Local Search Methods,Evolution strategies neural network,

(3)

二、計畫緣由與目的 迴歸分析多年來在研究的領域與實務 的應用上一直扮演重要的角色。在 SSCI 資料庫的搜尋中發現,自 1996 年到 2001 年 5 月為止,主題與迴歸分析有關的文 獻,至少可以找到一萬多篇。它的應用領 域則從網際網路、商學、工程、管理、社 會、政治、教育、心理學到醫學等方面, 幾乎無所不包。迴歸分析的主要功能之一 為預測,但是不同於迴歸分析的其他預測 工具,在這些年間也相繼被提出。其中, 類神經網路是最受重視的一支。九零年代 初期已有研究是在探討類神經網路與迴歸 分析之關係(Masters [8])。 在 SSCI 的期刊中,自 1996 年至今可 以找到超過 50 篇論文比較兩者在不同領 域之應用及其預測效果。例如:英國的臭 氧濃度[10]、鋼鐵輸送管彎曲成本之比較 [9]、股票報酬率及債券指數之效能[2]、 旅遊人數[5]、機器排程之安排[3]、市場 發展[11]、開發軟體所需時間[6]。大體而 言,這些論文有以下共同的特點: (1)類神經網路的預測效果比迴歸分析 準確。 (2)類神經網路都是使用前授型網路架 構(feed forward structure)和監 督型學習(supervised learning)。 結構的建構大多採取試誤法,而學習 (learning)方式則是使用倒傳遞 (back propagation)之方法。 (3)沒有探討資料本身的特性,例如檢驗 資料是否滿足迴歸分析的模式假定。 這些研究的結果提供兩個值得深入的 研究課題。第一、類神經網路的預測效果 是否一定比迴歸分析的預測效果準確?不 同的資料特性會不會影響兩者的預測效 果?第二、有沒有一個系統性的方法可決 定類神經網路的結構與學習的方法,以改 善類神經網路的預測效果? 針對第一個問題,Markham 和 Rakes [7] 曾在符合簡單線性迴歸的模式假定之 下,亦即誤差項滿足常態性(normality)、 均等變異性(equal variance)及隨機性, 以模擬的方式探討樣本數的大小與變異數 的大小對類神經網路與簡單線性迴歸之預 測效果的影響。他們的結論與我們直覺上 地推論相當一致,當在樣本數夠多與變異 數夠小的情況下,簡單線性迴歸的預測效 果比類神經網路為佳;反之,則類神經網 路的預測效果較佳。當然,這類研究仍有 可以擴充的空間。因為實際的問題中常有 多個自變數,而且實際的資料不見得會完 全滿足線性迴歸的假定。 針對第二個問題,由文獻探討知,常 用來與迴歸分析做比較的 BPNN(back propagation neural networks),其結構 與學習的方法是不盡理想的。相關的論文 (Chen 等[1])已証實區域搜尋法(local search methods)確實可以取代 BP 學習法 來提高類神經網路的預測效果。常被用以 幫助類神經網路學習的區域搜尋法包括基 因演算法(genetic algorithms),模擬退 火法(simulated annealing)等。不過, 當初開發這些區域搜尋法的目的都是在解 決間斷性變數的問題,而類神經網路的權 數卻是連續變數,因此在使用這些這方法 時都必須對權數值作修正而影響其精確 度。為改善這個問題,本研究選擇以求解 連續變數最佳化問題為主的區域搜尋法, 演化策略法(evolution strategies,ES) 來訓練類神經網路。在本研究中,我們稱 此種類神經網路為 ESNN。 因此,本研究的主要目的有二: 一、探討不同資料特性對迴歸分析與類神 經網路之預測效果的影響。這些資料

(4)

特性主要包括一般迴歸分析的假設 條件如變異數之大小、誤差項之分 配、誤差項之變異數的均等性等。我 們希望能針對資料特性找出一些規 則以幫助使用者選擇適當的分析方 法,迴歸分析或類神經網路。 二、使用來訓練類神經網路以提高其預測 功能。 三、結果與討論 本研究所隨機產生的問題包括以下幾 類: 1、 滿足線性、常態、均等變異的假設下, 將自變數設為兩個,模擬產生樣本數 分別為 50,100,200,與誤差項標準 差分別為 20,80,共計六種不同組合 的資料形態。對每一組資料,將其中 一半用於建模,另一半用於驗証模式 以比較線性迴歸、ESNN 與 BPNN 的 預測效果。預測效果的衡量則是以其 RMS 值及 MAPE 值為依據。上述的 每一實驗會被重複 20 次。 2、 滿足線性、常態、非均等變異假設下, 模擬 100 筆資料,將其中一半用於建 模,另一半用於驗証模式以比較線性 迴歸、加權最小平方法 (WLS) 、 ESNN 與 BPNN 的預測效果。每一實 驗也重複 20 次。 3、 滿足線性、偏態、均等變異的假設下, 產生具韋伯分配的資料 100 筆,並重 覆執行 20 次,分別計算這 20 組資料 的偏度及檢定統計量,再依線性迴 歸、韋伯迴歸、ESNN 及 BPNN 四種 方法估計的預測值計算 RMS 值與 MAPE 值。 4、 滿足非線性、常態、均等變異的假設 下,根據 Michaelis-Menten 關係模式 與指數迴歸模式產生 100 筆資料,再 依線性迴歸、非線性迴歸、ESNN 及 BPNN 四種方法估計的預測值計算 RMS 值與 MAPE 值。每一實驗也重 複 20 次。 針對每一類型問題的實驗結果,我們 使用變異數分析與 Duncan 多重全距檢定 來檢定不同預測方法的差異。對第一種類 型的問題,若取顯著水準為 0.05,則三 種預測方法並無顯著差異。若取顯著水 準為 0.1,則有數組有顯著差異。以 RMS 值而言,在 (樣本數 50,標準差 80)這組, 以 ESNN 表現最佳,而 ESNN 與 BPNN 有 顯著差距。在(樣本數 100,標準差 80)、(樣 本數 200,標準差 20)這兩組,以線性迴歸 與 ESNN 預測結果較佳,且無顯著差異。 BPNN 則與這兩個方法則有顯著差異。在 (樣本數 200,標準差 80)這組,則是線性 迴歸表現最佳,且與 BPNN 有顯著差距。 以 MAPE 值而言,則在 (樣本數 200,標 準差 20)這組,以 ESNN 表現最佳,而 ESNN 與 BPNN 有顯著差距。 在第二種類型的問題中,在顯著水準 0.05 的假設檢定下,四種預測方法並無顯 著的差異。在第三種類型的問題中,RMS 值的檢定結果顯示 ESNN 與韋伯迴歸預測 的結果最佳,且沒有顯著差異。但 ESNN 則與 BPNN 和線性迴歸有顯著差異。而 MAPE 值的檢定也顯示相同結果。對第四 種類型的問題,就 Michaelis-Menten 關係 模式而言,不論是 RMS 值或是 MAPE 值 的檢定結果皆為:非線性迴歸法與 ESNN 預測的結果沒有顯著差異,但與 BPNN 和 線性迴歸有顯著差異。就指數迴歸模式: RMS 值的檢定結果為四種預測方法皆有 顯著差異,以非線性迴歸法為最佳。而以 MAPE 值的檢定結果則為非線性迴歸法與 ESNN 預測的結果沒有顯著差異,但與 BPNN 和線性迴歸則有顯著差異。

(5)

綜合本以上分析的結果,可知 ESNN 確實可以取代 BPNN,成為類神經網路的 新選擇。再者,針對不同特性的資料,探 討究竟該選擇 ESNN 或者是迴歸方法做預 測,我們歸納出幾點結論與建議: 一、 面對一堆資料,開始著手分析時, 可依據先驗知識,考慮適當的迴歸模 式。不論決定採用何種模式做應用, 皆需以圖形表示法或統計檢定方法 做檢定,檢查模式之傾向。 二、如果原始的資料適合以常態線性迴歸 模式配適,則使用者可考慮使用線性 迴歸做預測。雖然對於此種資料形 態,ESNN 的預測結果與迴歸方法無 顯著差異,但是因為類神經網路在結 構的確定與資料的訓練上,十分耗 時;且由迴歸方法的理論背景,可得 到更多的訊息。 三、如果原始的資料適合用常態線性迴歸 模式配適,但是經由圖形分析或由檢 定方法得知誤差項不符合假設時, 如:資料違反誤差項為均等變異之假 設時,類神經網路 (ESNN、BPNN) 與 迴 歸 方 法 的 預 測 結 果 亦 無 顯 著 差 異。但如果資料呈現韋伯偏態分佈 時,則可考慮使用 ESNN 與韋伯迴歸 方法。因為本研究在模擬偏態資料 時,考慮韋伯分配,得到的結論是 ESNN 與韋伯迴歸方法的預測結果較 好。但是,在實際領域中應用時,往 往無法確切掌握資料的分配,雖然可 以 運 用 適 當 的 轉 換 技 巧 做 資 料 轉 換,再利用迴歸方法做預測,然而, 轉換的技巧亦是一大學問。 四、 當資料適合以非線性迴歸模式做配 適時,可考慮非線性迴歸法或 ESNN 做預測。 但需注意的是,非線性迴歸中常用於 求解參數的高斯牛頓 (Gauss-Newton) 法,其起始值的抉擇非常重要,因為 較差的抉擇會因為收斂速度減緩而 造成局部最佳解,甚至會造成發散的 狀況,而得不到較佳的迴歸函數估計 值。本研究在模擬非線性迴歸模式該 章節中,使用非線性迴歸所求之解 (預測結果之 RMS 值、MAPE 值),可 以作為一個用來與其他三種預測 (線 性迴歸、ESNN、BPNN) 方法比較的 基準 (benchmark),因為我們在求解 的初始值設定上,已經有十足的把 握;然而,實務上,並不一定可以找 到一個好的初始值。 由本研究中,發現 ESNN 對於所舉的 兩個非線性模式之預測可以達到與非 線性迴歸無顯著之差異,所以我們建 議使用者,如果原始的資料適合用非 線性迴歸模式配適,則可考慮使用 ESNN , 因 為 如 果 使 用 非 線 性 迴 歸 法,尚需考慮初始值的問題。 四、計畫結果自評 1. 與原計畫相符程度、達成預期目標情 況:本研究原計畫比較七種方法:一般 線 性 迴 歸 、 加 權 迴 歸 、 韋 伯 迴 歸 、 BPNN、GANN、SANN、ESNN,在三 種不同類型資料上的預測效果。但是在 一些測試問題中發現可能因為前述 ES 的 特 性 , ESNN 所 產 生 的 結 果 都 比 GANN 和 SANN 好。所以就將方法集 中於 ESNN,但是將題目的類型擴大到 非線性迴歸的問題。因此,本研究的結 果應該是與原計畫相符、且達成預期目 標。 2. 研究成果的學術或應用價值:本研究完 整的探討資料特性對迴歸分析與類神 經網路預測效果之影響,且提供幾點選

(6)

擇適當預測方法的原則。個人認為這些 原則對大部分從事預測研究或實務的 人應該很有價值。此外本研究也開發一 個新的分析工具,ESNN。個人認為對 資料分析與類神經網路的研究人員它 應該也是一個值得深入的課題。 3. 是否適合在學術期刊發表:本研究有一 些新的想法與好的結果。部分結果已發 表在今年的統計年會。完整的結果將儘 快整理投到國際期刊,如 Computers &OR。 五、參考文獻

1. Chen, C. L., Kaber, D. B. and Dempsey, P. G. (2000).“ A new approach to applying feedforward neural networks to the prediction of musculoskeletal disorder risk, ”Applied Ergonomics,

vol.31, pp.269-282.

2. Desai, V. S. and Bharati, R.(1998). “The efficacy of neural networks in predicting returns on stock and bond indices”, Decision Sciences, vol.29(2),

Spring, pp.405-425.

3. El-Bouri, A., Balakrisknan, S. and Popplewell, N. (2000). “Sequencing jobs on a single machine: A neural network approach”, European Journal of Operational Research, vol.126(3),

pp. 474-490.

4. Freeman, J. A. and Skapura, D. M. (1991). Neural Networks: Algorithms, Applications, and Programming Technique, Addison-Wesley, Reading, M.A.

5. Law R. (2000). “ Back-propagation learning in improving the accuracy of neural network-based tourism demand forecasting,” Tourism Management,

vol.21, pp.331-340.

6. Lind, M. R.and Sulek, J. M. (2000). “ A methodology for forecasting knowledge work projects,”Computers and Operations Research,” vol.27,

pp.1153-1169.

7. Markham, I. S. and Rakes, T. R. (1998). “ The effect of sample size and variability of data on the comparative performance of artificial neural networks and regression”, Computers Operations Research, vol.25(4), pp.251-263.

8. Masters, T., (1993). Practical Neural Networks Recipes in C++. Academic Press, New York.

9. Shtub, A., and Versano, R. (1999). “ Estimating the cost of steel pipe bending ” , Internation Journal of Production Economics, vol.62, pp.201-207.

10. Spellman, G. (1999).“An application of artificial neural networks to the prediction of surface ozone concentrations in the United Kingdom ” , Applied Geography,

vol.19, pp.123-261.

11. Wang, S.,(1999). “ An adaptive approach to market development forecasting ” , Neural Computing & application, vol.8(1), pp. 3-8.

參考文獻

相關文件

由於資料探勘 Apriori 演算法具有探勘資訊關聯性之特性,因此文具申請資 訊分析系統將所有文具申請之歷史資訊載入系統,利用

決定隱藏層神經元數,對一層隱藏層觀察神經元數 1~10 個之測試 範例誤差均方根 RMS 最小者,結果取隱藏層觀察神經元數為 10

本研究將針對 TFT-LCD 產業研發單位主管與研發人員進行 探討,並就主管於研發人員對職能重視程度作差異性分析。因此

4.1 多因子變異數分析 多因子變異數分析 多因子變異數分析 多因子變異數分析與線性迴歸 與線性迴歸 與線性迴歸 與線性迴歸 4.1.1 統計軟體 統計軟體 統計軟體 統計軟體 SPSS 簡介 簡介

個變量上有顯著性的差異。由各變量的平均數亦可看出重視績效 群在各變量上均高於不重視績效群。至「年資輩份」未達顯著性

東港溪流域之地面水資源利用農業用水,包括灌溉用水、養殖 用水及畜牧用水,每年用水量約 8,568

本研究藉由分類和迴歸樹(Classification and Regression Tree, C&RT)進 行變數間之類別合併以及決定連續型變數之切割點。C&RT 的全名是「分類 和迴歸樹」

本研究計畫之目的是要以 MPEG-7 之 ART