• 沒有找到結果。

決策樹結合複迴歸模型預測氣溫與雨量

N/A
N/A
Protected

Academic year: 2021

Share "決策樹結合複迴歸模型預測氣溫與雨量"

Copied!
86
0
0

加載中.... (立即查看全文)

全文

(1)國立臺灣師範大學電機工程學系 碩士論文. 指導教授:呂藝光博士 決策樹結合複迴歸模型預測氣溫與雨量 Decision Tree Combined Multiple Linear Regression Model to Forecast Temperature and Rainfall. 研究生:林宇恆 撰. 中 華 民 國 一 百 零 五 年 八 月.

(2) 決策樹結合複迴歸模型預測氣溫與雨量. 學生:林宇恆. 指導教授:呂藝光 博士. 國立臺灣師範大學電機工程學系碩士班. 摘. 要. 本論文發展一以決策樹為基礎的氣溫與雨量之預測模型。由於傳統決 策樹都是以區間化輸出為主,因此該預測模型將線性複迴歸模型整合至決 策樹以達成數值化輸出。本論文利用該預測模型來預測領前 1 至 7 天的氣 溫與雨量,並針對預測值給予一定信賴水準的信賴區間。為了說明此預測 模型的效能,該預測模型與其他時間序列的預測方法進行比較,其中時間 序列的預測方法包括自迴歸、移動平均法、自迴歸差分整合移動平均法。 關鍵字: 決策樹、預測、線性複迴歸模型. i.

(3) Decision Tree Combined Multiple Linear Regression Model to Forecast Temperature and Rainfall. Student : Yu-Heng Lin. Advisor : Dr. Yih-Guang Leu. Department of Electrical Engineering National Taiwan Normal University. ABSTRACT Based on decision tree, the purpose of this thesis is to develop a forecast model for temperature and rainfall. Because the traditional decision tree generates interval output, the forecast model integrates the multiple linear regression model into the decision tree in order to achieve the goal of numeric output. In this thesis, the seven days ahead temperature and rainfall are predicted by using the forecast model, and their confidence intervals are given at a confidence level. In order to demonstrate the effectiveness of the forecast model, we compare the forecast model with some different time series methods, such as autoregressive (AR), moving average(MA), autoregressive integrated moving average (ARIMA). Keywords:Decision Tree, forecast, multiple linear regression model.. ii.

(4) 誌 謝 在臺灣師範大學研究所的這兩年一下子就過去了,想當初大學就讀應 用電子科技學系,到現在電機工程研究所,加上大學四年也在這間學校待 了六年,過程中也受到許多教授與同學的教導與幫忙,特別感謝指導教授 呂藝光博士在碩士這兩年的教導,不僅傳授許多專業知識,更提醒我們做 人處事的道理,從剛開始進入碩士還不知道研究方向,到現在碩二論文順 利的完成,過程中提供我許多研究的方向與發展,並在我困難時提醒我方 向,解決問題更進一步,老師不厭其煩的指導,才能完成此論文,在此致 上最真誠的謝意。 在研究的過程中,要感謝學校提供好的研究環境以及不同領域教授們 的教導,讓我在研究中融合不同的想法來完成論文,感謝仕勳、苹源、拱 北、典融等學長的經驗傳承以及研究上的幫忙,也感謝研究所期間一同修 課以及不同實驗室同學們互相討論課業相關的事物,也讓我在這期間認識 到許多的朋友,還要特別感謝仕華、冠東、則宇、君達、銘偉、孟哲等好 友們,在我遇到困難時可以適時給予援助,也要感謝電機系辦的工作人員, 在研究所的期間給予協助。 最後,要感謝我的家人在背後支持我,讓我可以專注在研究的路上, 順利完成論文,在未來,我會更努力的充實自己,並用認真的態度完成每 一項事物。. 林宇恆 中華民國 105 年 8 月. iii. 謹誌.

(5) 目 摘. 錄. 要 .............................................................................................................. i. ABSTRACT ........................................................................................................ ii 誌. 謝 ............................................................................................................ iii. 目. 錄 ........................................................................................................... iiv. 圖 目 錄 ........................................................................................................... vii 表 目 錄 ............................................................................................................. x 第一章 緒論 ...................................................................................................... 1 1.1 研究背景與動機 .............................................................................. 1 1.2 研究方法 .......................................................................................... 2 1.3 研究目的 .......................................................................................... 3 1.4 各章節簡述 ...................................................................................... 5 第二章 文獻探討與回顧 ................................................................................... 6 2.1 天氣預測 .......................................................................................... 6 2.2 資料探勘 .......................................................................................... 5 2.3 常見的預測方法 .............................................................................. 7 2.3.1 自迴歸模型 ................................................................................. 7 2.3.2 移動平均模型 ............................................................................. 8 2.3.3 自迴歸差分整合移動平均模型 ................................................. 8 2.3.4 決策樹 ......................................................................................... 9 2.4 決策樹 ............................................................................................ 10 2.4.1 疊代二元樹 3 代 ....................................................................... 10 2.4.2 C4.5 ............................................................................................ 10 2.4.3 CART ......................................................................................... 11 2.4.4 模糊決策樹 ............................................................................... 12 2.5 複迴歸模型 .................................................................................... 13 iv.

(6) 第三章 決策樹與複迴歸預測方法................................................................. 15 3.1 資料處理 ........................................................................................ 15 3.1.1 天氣資料集 ............................................................................... 15 3.1.2 資料前處理 ............................................................................... 17 3.2 決策樹分析 .................................................................................... 20 3.3 複迴歸分析 .................................................................................... 21 3.4 評估 ................................................................................................ 21 3.4.1 平均絕對誤差 ........................................................................... 21 3.4.2 均方根誤差 ............................................................................... 21 3.4.3 平均絕對百分比誤差 ............................................................... 21 3.4.4 皮爾森相關係數 ....................................................................... 22 3.4.5 信賴區間 ................................................................................... 23 第四章 實驗與討論 ......................................................................................... 27 4.1 資料的相關性分析 ........................................................................ 27 4.1.1 氣溫的相關性分析 ................................................................... 27 4.1.2 雨量的相關性分析 ................................................................... 27 4.2 建立決策樹 .................................................................................... 28 4.2.1 氣溫的決策樹建立 ................................................................... 28 4.2.2 雨量的決策樹建立 ................................................................... 29 4.3 複迴歸分析 .................................................................................... 31 4.3.1 氣溫複迴歸分析 ....................................................................... 31 4.3.2 雨量複迴歸分析 ....................................................................... 33 4.4 評估預測好壞 ................................................................................ 37 4.4.1 氣溫迴歸決策樹預測 ............................................................... 37 4.4.2 雨量迴歸決策樹預測 ............................................................... 54 第五章 結論與未來展望 ................................................................................. 70 v.

(7) 5.1 結論 ................................................................................................. 70 5.2 未來展望 ......................................................................................... 70 參考文獻 ........................................................................................................... 71. vi.

(8) 圖目錄 圖 1-1. 研究流程 .................................................................................... 4. 圖 2-1. 決策樹 ........................................................................................ 9. 圖 3-1. 香港天文台 .............................................................................. 15. 圖 3-2. R 軟體決策樹分析流程圖....................................................... 20. 圖 4-1. 氣溫決策樹 .............................................................................. 28. 圖 4-2. 雨量決策樹 .............................................................................. 29. 圖 4-3. 氣溫迴歸決策樹 ...................................................................... 33. 圖 4-4. 雨量迴歸決策樹 ...................................................................... 36. 圖 4-5. 領前一天氣溫預測 .................................................................. 37. 圖 4-6. 領前一天氣溫預測值與實際值的誤差 .................................. 37. 圖 4-7. 領前一天的其中一週預測效果 .............................................. 38. 圖 4-8. 領前一天的其中一週預測值與實際值的誤差 ...................... 38. 圖 4-9. 領前二天氣溫預測 .................................................................. 39. 圖 4-10. 領前二天氣溫預測值與實際值的誤差 .................................. 39. 圖 4-11. 領前二天的其中一週預測效果 .............................................. 40. 圖 4-12. 領前二天的其中一週預測值與實際值的誤差 ...................... 40. 圖 4-13. 領前三天氣溫預測 .................................................................. 41. 圖 4-14. 領前三天氣溫預測值與實際值的誤差 .................................. 41. 圖 4-15. 領前三天的其中一週預測效果 .............................................. 42. 圖 4-16. 領前三天的其中一週預測值與實際值的誤差 ...................... 42. 圖 4-17. 領前四天氣溫預測 .................................................................. 43. 圖 4-18. 領前四天氣溫預測值與實際值的誤差 .................................. 43. 圖 4-19. 領前四天的其中一週預測效果 .............................................. 44. 圖 4-20. 領前四天的其中一週預測值與實際值的誤差 ...................... 44 vii.

(9) 圖 4-21. 領前五天氣溫預測 .................................................................. 45. 圖 4-22. 領前五天氣溫預測值與實際值的誤差 .................................. 45. 圖 4-23. 領前五天的其中一週預測效果 .............................................. 46. 圖 4-24. 領前五天的其中一週預測值與實際值的誤差 ...................... 46. 圖 4-25. 領前六天氣溫預測 .................................................................. 47. 圖 4-26. 領前六天氣溫預測值與實際值的誤差 .................................. 47. 圖 4-27. 領前六天的其中一週預測效果 .............................................. 48. 圖 4-28. 領前六天的其中一週預測值與實際值的誤差 ...................... 48. 圖 4-29. 領前七天氣溫預測 .................................................................. 49. 圖 4-30. 領前七天氣溫預測值與實際值的誤差 .................................. 49. 圖 4-31. 領前七天的其中一週預測效果 .............................................. 50. 圖 4-32. 領前七天的其中一週預測值與實際值的誤差 ...................... 50. 圖 4-33. 氣溫信賴區間 .......................................................................... 52. 圖 4-34. 氣溫信賴區間 .......................................................................... 52. 圖 4-35. 領前一天雨量預測 .................................................................. 54. 圖 4-36. 領前一天雨量預測值與實際值的誤差 .................................. 54. 圖 4-37. 領前一天的其中一週預測效果 .............................................. 55. 圖 4-38. 領前一天的其中一週預測值與實際值的誤差 ...................... 55. 圖 4-39. 領前二天雨量預測 .................................................................. 56. 圖 4-40. 領前二天雨量預測值與實際值的誤差 .................................. 56. 圖 4-41. 領前二天的其中一週預測效果 .............................................. 57. 圖 4-42. 領前二天的其中一週預測值與實際值的誤差 ...................... 57. 圖 4-43. 領前三天雨量預測 .................................................................. 58. 圖 4-44. 領前三天雨量預測值與實際值的誤差 .................................. 58. 圖 4-45. 領前三天的其中一週預測效果 .............................................. 59 viii.

(10) 圖 4-46. 領前三天的其中一週預測值與實際值的誤差 ...................... 59. 圖 4-47. 領前四天雨量預測 .................................................................. 60. 圖 4-48. 領前四天雨量預測值與實際值的誤差 .................................. 60. 圖 4-49. 領前四天的其中一週預測效果 .............................................. 61. 圖 4-50. 領前四天的其中一週預測值與實際值的誤差 ...................... 61. 圖 4-51. 領前五天雨量預測 .................................................................. 62. 圖 4-52. 領前五天雨量預測值與實際值的誤差 .................................. 62. 圖 4-53. 領前五天的其中一週預測效果 .............................................. 63. 圖 4-54. 領前五天的其中一週預測值與實際值的誤差 ...................... 63. 圖 4-55. 領前六天雨量預測 .................................................................. 64. 圖 4-56. 領前六天雨量預測值與實際值的誤差 .................................. 64. 圖 4-57. 領前六天的其中一週預測效果 .............................................. 65. 圖 4-58. 領前六天的其中一週預測值與實際值的誤差 ...................... 65. 圖 4-59. 領前七天雨量預測 .................................................................. 66. 圖 4-60. 領前七天雨量預測值與實際值的誤差 .................................. 66. 圖 4-61. 領前七天的其中一週預測效果 .............................................. 67. 圖 4-62. 領前七天的其中一週預測值與實際值的誤差 ...................... 67. 圖 4-63. 雨量信賴區間 .......................................................................... 68. 圖 4-64. 雨量信賴區間 .......................................................................... 68. ix.

(11) 表 目 錄 表 3-1. 氣溫資料 .................................................................................. 16. 表 3-2. 雨量資料 .................................................................................. 16. 表 3-3. 氣溫影響參數 .......................................................................... 17. 表 3-4. 雨量影響參數 .......................................................................... 17. 表 3-5. 氣溫區間化 .............................................................................. 18. 表 3-6. 雨量區間化 .............................................................................. 18. 表 3-7. 氣溫區間化資料 ...................................................................... 19. 表 3-8. 雨量區間化資料 ...................................................................... 19. 表 3-9. MAPE 的預測效果 .................................................................. 22. 表 3-10. 相關係數的相關效果 .............................................................. 23. 表 4-1. 氣溫相關性分析 ...................................................................... 27. 表 4-2. 雨量相關性分析 ...................................................................... 28. 表 4-3. 氣溫迴歸數學模型 .................................................................. 31. 表 4-4. 雨量迴歸數學模型 .................................................................. 33. 表 4-5. 預測模型比較 .......................................................................... 52. 表 4-6. 氣溫迴歸決策樹信賴區間表 .................................................. 53. 表 4-7. 預測模型比較 .......................................................................... 69. 表 4-8. 雨量迴歸決策樹信賴區間表 .................................................. 69. x.

(12) 第一章. 緒論. 本章節將說明為何氣候預測對於現在生活有很大的重要性,由於地球 的氣候變遷越來越劇烈,造成許多地區災害頻傳。而氣候預測一直是個很 重大的議題,因為氣候的影響因素很複雜,所以氣候預測也是一個很大的 挑戰,故成為研究的動機,最後本章將清楚的說明研究方法和論文大綱。. 1.1 研究背景與動機 在現今的社會中,隨著科技不斷的發展進步,人類對環境的破壞,使 得全球氣候變遷的情況逐漸加重。氣候變遷的影響導致溫度與雨量的預測 更顯複雜,現階段的預測精確度大約在 60~70%左右[1][2],很多時候預測 的數據跟實際的數據落差很大,導致許多人輕忽了威力,而造成生命財產 的損害。因此全球都在致力發展氣候預測的模型,希望可以使預測更加精 確,讓大家都能在事前充分的來作防範。 溫度與雨量的預測與許多因子有關,例如:月份、大氣壓力、濕度、 雲量等交互作用下的結果[3][4]。在氣候變遷的情況下,這些因子交互關係 變得更加複雜,這種關係無法用一般的數學關係式來描述,也很難用經驗 法則來作思考,因為這些因素增加了預測的困難度。在全球氣候變遷下災 害頻傳的年代,發展這方面的研究更顯得重要。 在現在大數據的年代,怎麼樣從每天數以千計的資料中萃取可用的資 料並分析是很重要的。統計學方面有許多預測模型常被用來預測氣候,例 如:自迴歸模型、移動平均模型、自迴歸移動平均模型等等。資料探勘也有 許多預測模型常被用來預測氣候,例如:決策樹、類神經網路、貝式分類器、 支持向量機等等。而這些方法都有各自的好處也有各自的限制,使得許多 1.

(13) 人會結合不同的方法來作預測,效果也會有明顯的增加。 決策樹是一種預測與分類的模型,形狀像是一棵樹從上到下生成,其 決策的結果可以很容易的讓使用者清楚了解,但其缺點就是輸出不能太多 單一數值化輸出,這樣會導致生成的樹因為要讓每個數值輸出而導致生成 的樹太大,那一個單一節點就只有一個資料,會導致過度適應的問題。複 迴歸模型因由不同輸入資料而有不同的單一數值輸出,其缺點就是因為輸 入資料的差別太大,他的輸出又算是平均後的結果,導致會偏向一方面的 數值。所以本論文希望結合決策樹的分類與複迴歸模型的不同輸入對應不 同數值輸出這兩個優點,來預測氣溫與雨量的數值輸出,這就是促成本論 文的研究動機。. 1.2 研究方法 本研究是使用決策樹結合複迴歸模型來預測氣溫與雨量,首先是先把 資料做些前處理,然後把處理後的資料進行決策樹分析,藉由決策樹分析 來把相似的資料放在一起,做出決策樹,再利用複迴歸分析找出每個葉節 點的迴歸數學式,並把數學式與決策樹結合,就建好我們的預測模型,當 模型建置好,之後把預測的資料輸入進來,利用決策規則找出資料歸屬於 哪個葉節點的迴歸數學式,當資料進入葉節點後,進行迴歸數學式的運算 後,就可把預測的結果輸出。 本研究的訓練資料是使用香港天文台[5]的歷史資料來訓練,因為香港 天文台的歷史資料有從 1884 年到 2016 年的歷史資料,資料量相當的充沛, 而本研究的歷史資料是用了四年共 1461 筆的資料來做訓練,決策樹的軟 體是 R 軟體[6]來做決策數的分析,此軟體是一種開放原始碼而且免費的, 複迴歸分析是利用 Excel 裡的迴歸來處理,最後再把 R 軟體做出來的決策 樹模型與 Excel 算出的複迴歸數學模型結合成為本論文使用模型。 2.

(14) 1.3 研究目的 本論文的研究目的在於建置氣溫與雨量的預測模型,訓練與測試的資 料是從香港天文台裡的氣象歷史資料,因為香港天文氣象台的氣象歷史資 料豐富,可以使訓練資料更加多元。本論文提出利用決策樹結合複迴歸模 型來預測氣溫與雨量,利用決策樹的分類與複迴歸的數值輸出這兩個技術 應用於預測領前 1 至 7 天的氣溫與雨量。由於為了不讓決策樹生長過大, 一般的決策樹預測都是以區間化的範圍輸出來呈現。而本論文採用結合複 迴歸的技術來使區間化後的範圍可以對應出不同的數值輸出,提供使用者 準確的數值。最後還會與一些時間序列的預測方法來進行比較,驗證此方 法是可行的。希望有了這模型,可讓預測的準確性有更好的提升。研究流 程圖如圖 1-1 所示:. 3.

(15) 研究目的. 決策樹+複迴歸模型. 文獻探討. 氣溫與雨量領前1~7天預 測. 氣溫與雨量資料收集. 預測效果比較分析. 氣溫與雨量資料前處理. 研究結論. 圖 1-1 研究流程. 4.

(16) 1.4 各章節簡述 本論文總共分為五個章節,主要內容包括: 第一章 緒論: 此章節說明本論文的研究背景與動機、方法以及目的。 第二章 文獻探討與回顧: 此章節先簡介資料探勘的意義與背景,接著介紹 過去天氣預測所 使用的方法,再對於時間序列常使用的預測模型方面作相關文獻 的探討,以及本論文所使用的決策樹與複迴歸方法進行簡單的整 理與說明。 第三章 研究方法: 此章節是針對本論文所使用的方法進行詳細說明,首先先介紹資 料的來源以及資料的前處理,接著說明決策樹與複迴歸的方法以 及如何將兩者合併成為本論文的模型,最後說明如何用統計方法 來驗證此模型的好壞。 第四章 實驗與結果 此章節是針對本論文所選取的訓練資料,進行決策樹的建立,再 利用此決策樹分類後的資料來做複迴歸分析找出數學模型,最後 將決策樹模型與複迴歸所算出的合併成為本論文的模型,並利用 一年共 365 筆的測試資料來做驗證,以及使用其他方法優劣比較。 第五章 結論與未來展望 此章節是針對本論文說明研究發現與整體結論,並對未來研究的 方向提出改進以及建議,希望讓此方法在之後能有更好的發展。. 5.

(17) 第二章. 文獻探討與回顧. 本章節說明資料探勘、天氣預測、常見的氣候預測方法以及決策樹的 理論架構。. 2.1 天氣預測 現在天氣預測的方法大部分用衛星雲圖、氣象雷達圖、地面觀測資料、 高空觀測資料,地面及高空觀測資料所繪製成的氣象圖相互對應[7],輸入 電腦進行複雜的運算,再由專業的氣象人員根據電腦計算完的結果進行修 正或判斷,做出現在與未來天氣的預測,但因為每天的天氣無時無刻都在 改變,加上天氣的影響因子太多太複雜,所以很難用一般的數學模型模擬 天氣變化[8]。一般的氣象預報都會根據最新的觀測資料不斷的修正更新, 以讓預報結果能更加準確[9]。現在電腦運算科技發達,可以將過去與目前 的天氣利用電腦運算後可獲得較精確的預測,但也無法保證預測的與實際 的狀況能百分之百符合,所以現在預測都用下雨機率百分比來報導。例如: 今天降雨機率為 70%,這表示著有 70%的機率會下雨,30%的機率不會下 雨,不會很斷定一定會下雨或一定不會下雨。而百分比是指下雨的機率, 不是指下雨的大小,讓需求者自行判斷要不要帶傘。目前精確度大約在 60~70%左右,因此各國家也都致力發展天氣預測的方法,讓預測能更加的 精確。. 2.2 資料探勘 資料探勘(Data mining)[10][11][12][13]是從大量的資料裡應用一些技 術,從資料中萃取一些知識與訊息可以供我們了解這資料並加以應用,而 且可以發現一些新奇以及有用的模式,這些知識是之前所未知的。資料探 6.

(18) 勘 主 要 分 為 分 類 (Classification) [14][15][16] 、 關 聯 分 析 (Association Analysis)[17][18]、分群(Cluster)[19][20]與異常偵測(Anomaly Detection)[21] 這 4 個議題。因為以前電腦科技還沒有那麼發達而電腦處理速度也沒那麼 快,資訊量取得相對較少而且容易觀察與處理,但在電腦網路科技越來越 進步且成本低廉的情況下,使得龐大的資料量無法有效的處理與利用,傳 統的資料分析工具以及技術是無法處理大量資料,甚至連有些資料量小的 資料庫,無法很容易的取得參數特徵值,也無法用傳統資料分析方法去分 析,因此最近才有資料探勘這議題的出現,從大量的資料中取得訊息、知 識來解決現代許多的議題。目前資料探勘的技術已用在許多領域,如市場 決策、天氣預測、異常偵測、品質控制等等。. 2.3 常見的預測方法 2.3.1 自迴歸模型 自迴歸模型(Autoregressive model,簡稱 AR 模型)[22],是一種處理時 間序列的方法,用過去同一個變數,例如 X 的之前資料,來預測未來的同 一個變數,亦即 X1 至 Xt-1 來預測 Xt,並假設它們是一個線性關係,建立 迴歸方程式進行預測,不是用 X 預測 Y,而是用 X 預測 X(自己預測自己), 所以稱為自迴歸。此方法的優點就是需要的過去資料不多就能進行預測, 但是這種方法需要變數彼此相關,只適合用於有時間序列趨勢相關的經濟 或天氣,並不適合用於變化過大的資料群來做預測,對於受社會因素影響 較大的經濟現象也不宜採用自迴歸[23]。自迴歸模型可用式(2-1)來表示: p. X t  c   i X t i   t. (2-1). i 1. 其中 Xt 是當前的數值, i ,…,  p 是迴歸參數,X1,…, Xt-1 是過去幾天的數 值,c 是常數,  t 是白雜訊。自迴歸模型已被廣泛運用在經濟學、信息學、 7.

(19) 自然資訊的預測上。 2.3.2 移動平均模型 移動平均模型(Moving average model,簡稱 MA 模型)[24],是一種處 理時間序列的方法,最近的實際數據值來預測未來一期或幾期內的資料, 此模型利用過去幾期的資料相加平均後,來預測下一筆的資料,可以作為 長期的趨勢預測。移動平均法適用即期預測,當資料需求既不快速增加也 不快速下降,且不存在季節性因素時。此方法的優點是可以消除掉過去資 料突然變動造成預測結果的影響,但如果期數選的過大,會導致預測的結 果對真實的變動變得不敏感,而有預測不準的現象發生。移動平均模型可 用式(2-2)來表示: q. X t  c    q X t i   t. (2-2). i 1. 其中 Xt 是當前的數值, 1 ,…,  q 是移動平均期數,X1,…, Xt-1 是過去幾天的 數值,c 是常數,  t 是白雜訊。 2.3.3 自迴歸差分整合移動平均模型 自 迴 歸 差 分 整 合 移 動 平 均 模 型 (Autoregressive integrated moving average model,簡稱 ARIMA)[25]是一種處理時間序列的重要方法,結合自 迴歸模型與移動平均模型為基礎混合的方法,此模型將預測對象以時間推 移的方式視為一序列,並用數學模型來近似這個序列,主要的步驟在於差 分項,可以平穩序列,這樣就可以用過去的資料來預測未來值。此方法常 用於經濟或天氣方面的長期預測,而這方法現在也被一些產業用來進行未 來的預測。自迴歸差分整合移動平均模型可用式(2-3)來表示: p. q. i 1. i 1. (1   i Li )(1  L) d X t  (1    q Li ) t. 其中 L 是滯後運算子(Lag operator), d  Z,d  0 。. 8. (2-3).

(20) 2.3.4 決策樹 決策樹(Decision tree,簡稱 DT)[26][27][28][29]是一種決策或預測的 模型,在數據探勘的分類領域裡很常被使用,例如文字辨識、醫療問題診 斷、專家系統等等。決策樹用樹狀的圖形來表示,學習過程是用監督式學 習,經由輸入與輸出的關係找出最好的來做分割,一般都是上往下生成, 最根本的節點叫做根結點,最後生長完的樹末節點稱為葉節點,如圖 2-1。 樹狀的大小取決於輸入資料的大小,輸入資料越多樹長的越大,輸入資料 少樹長的越小,但因為過度適應的問題,會導致葉節點的資料量過少而呈 現單一化的趨勢,所以樹的長的越大不一定是好。因此在樹長好後有些修 剪的步驟讓樹變小,以避免過度適應的問題。 根節點. 葉節點. 葉節點. 葉節點. 葉節點. 圖 2-1 決策樹 而決策樹具有以下幾個優點: 1.. 決策樹形成的樹狀圖形是很容易讓人了解的決策模型。. 2.. 計算量相對的較小,可以了解到輸入資料對於決策的重要性關係,而 決策樹在建立完成後,對以後測試資料分類也會很快速。最差的情況 下,複雜度為 O(h),其中 h 為決策樹深度。. 3.. 節點關聯性都是以最高的關聯作為分割,所以節點彼此關聯性很高。. 4.. 決策樹演算法可降低雜訊,也可以避免過度適應的問題產生。 9.

(21) 在現在大數據的時代裡,決策樹也被廣泛的應用在各大領域,快速建 模加上樹狀結構的過程容易了解,可以幫助使用者快速的進行決策判斷, 這些決策樹演算法通常是用貪婪策略(Greedy strategy)來建立決策樹,包含 了 ID3、C4.5、CART、CHAID、QUEST 等等演算法。而本論文使用的是 CART 演算法。. 2.4 決策樹 2.4.1 疊代二元樹 3 代 疊代二元樹 3 代(Iterative. dichotomiser 3,簡稱 ID3)[30][31]是由 Ross. Quinlan 於 1986 年 發 明 用 於 決 策 樹 的 演 算 法 , 這 方 法 是 用 獲 利 值 (Information gain)的大小來決定決策樹分割的基準,先計算未分割前的熵 (Entropy)值,再計算每個輸入參數與輸出值的熵值,兩個相減就是該節點 的獲利值,獲利值最大的就用那個輸入參數來當作分割點,分割完後再拿 其他輸入參數與輸出值計算獲利值,再用計算出最大的值最為分割點,以 此類推不斷疊代後就產生了樹狀結構的決策樹。熵的可用式(2-4)來表示: 熵  i 1 p(i | t ) log 2 p(i | t ) m. (2-4). 其中熵為資料的亂度值, p(i | t ) 表示在節點 t 中屬於類別 i 的資料比例,有 時候會忽略節點 t,直接用 pi 來表示比例。獲利值的可用式 (2-5)來表示: 獲利值  Parent   i 1 m. N( vi ) I( v i ) N. (2-5). 其中 Parent 是指還沒分割前的熵值,N 是父節點所有的資料量,m 是指有 幾個輸入參數, N ( v i ) 是跟子節點 v i 有關聯的資料。 2.4.2 C4.5 C4.5 演算法[32]是由 Ross Quinlan 於 1993 年對之前開發的 ID3 演算法 的一種改良,這方法是用獲利率(Gain ratio)的大小來決定決策樹分割的基 10.

(22) 準,獲利率就是獲利值再除以分割資訊(Split information),C4.5 演算法主 要是改進之前 ID3 對於分割的葉節點太單一化的問題,例如:如果這個分 割點是班上學生的學號,因為學號的獲利值計算出來的值都會很低,造成 ID3 決策樹生成的樹會有每個葉節點都只有單一個學號,而造成過度適應 的問題,這樣生成的樹就會很不好又會很大,所以 C4.5 計算獲利值後還會 再除以節點數來降低節點單一化的問題,這樣的分割參考就是獲利率,獲 利率可用式(2-6)來表示:. 獲利率 . 獲利值 分割資訊. (2-6). 其中分割資訊可用式(2-7)來表示: 分割資訊   i 1 m. ni n log 2 i n n. (2-7). 如果屬性所產生的分割點太多時,其分割資訊也會跟著變大,這樣反而可 以降利獲利率的值,以避免決策樹都偏向資料點少的獲利值去生長。 2.4.3 CART 分類與迴歸樹(Classification and regression tree,簡稱 CART)[33]是由 Brieman 等人於 1984 年發明出來用於決策樹的演算法,這方法是用 Gini index 來做為分割的基準,計算每個輸入參數與輸出值的 Gini index,Gini index 最小的就用那個輸入參數來當作分割點,分割完後再拿其他輸入參 數與輸出值計算 Gini index,再用計算出最小的值最為分割點,以此類推, 最後就可以生成決策樹。CART 在計算過程比 ID3 與 C4.5 還來的快也可以 降低過度適應的這問題以避免樹成長的過大。Gini index 可用式(2-8)來表 示:. Gini index  1  i1[p(i | t ) 2 ] m. 11. (2-8).

(23) 2.4.4 模糊決策樹 模糊決策樹(Fuzzy decision tree,簡稱 FDT)[34]是現在非常普遍的決策樹。 因為它有很高的可讀性,但最大的的缺點是正確性還不是太高。因為真實 世界的數據不可能找出很精確的訓練資料[35],所以希望藉由模糊規則的 概念來避免樹狀結構過大。當有外來的雜訊干擾時,也可以抵抗避免使樹 狀結構變得複雜。Crisp decision tree[36]是模糊決策樹的一種,屬於二分法 的一種決策樹。往左邊分割可用式(2-9)來表示:.  L  (c i  x  a i ). (2-9). 其中 c i 是常數, a i 是門檻值。而右邊分割可用式(2-10)來表示:. R  1  (ci  x  a i )  (a i  ci  x). (2-10). 輸出的數值可用式(2-11)來表示:. yi . 1 Ni.  n 1 i (x n ) y n N train. (2-11). Crisp 決策樹的輸入訓練資料是精確的,使得如果有雜訊就會使樹狀結構變 得複雜。在式(2-11)可看出,Crisp 決策樹對於數值屬性的輸出是種平均化 後的數值,所以對於如果是天氣預測這方面的大範圍的數值變化,剛開始 分類錯誤的話,會導致預測輸出的數值與實際的數值差異過大,也就是預 測結果會有不準的現象。模糊決策樹會先讓輸入的資料模糊化,這樣可以 抵抗外來雜訊,之後找出分割的門檻值進行分割,最後解模糊化來找出數 值輸出。但為了使模糊決策樹的計算時間減少,模糊決策樹的分割有可能 只是找出區域最佳值而不適全域最佳值,如果剛開始分類錯誤的話,會導 致預測輸出的數值與實際的數值差異過大,也就是預測結果會有不準的現 象。本論文剛開始區間化的方式就是用最簡單的固定值進行區間化,利用 窮舉法來找出最佳數值的分割,窮舉法的好處在於全部的數值都會找一次, 12.

(24) 所以一定會找出全域最佳的分割點。再把訓練資料用決策樹進行分類找出 每個葉節點的資料集,再利用複迴歸找出每個葉節點的複迴歸數學模型, 把原本的葉節點用複迴歸數學模型取代掉。用複迴歸的好處就是如果真的 分類錯誤的話,雖然數學模型有所不同,但因為輸入資料的關係,也可以 算出跟實際結果有所相近的數值,可以有修正的效果。. 2.5 複迴歸模型 當自變數的數量超過 1 個時,就用複迴歸模型(Multiple linear regression, 簡稱 MLR)[37]來代替一般的線性迴歸模型,我們假設預測值的線性迴歸模 型可用式(2-12)來表示:. xˆ i  w 0  w 1a 1,i  w 2 a 2,i    w k a k ,i  w 0   j1 w ja j,i k. (2-12). xˆ i 為預測值, a1,i a k ,i 為自變數, w 0 為截距, w1  w k 為迴歸係數。為了. 去決定迴歸係數 w1 w k,所以使用最小平方估測(Least square estimation, 簡稱 LSE)這方法來找出實際值與預測值的最小誤差 e,e 可用式(2-13)表 示:. e  i 1 ( x i  xˆ i ) 2  i 1 ( x i  w 0   j1 w ja j,i ) 2 n. n. k. (2-13). x i 為實際值。忽略截距 w 0 ,先看 k=1,式(2-13)可以變成式(2-14): e  i ( x i  wa i ) 2   i ( x i 2  2 wx i a i  w 2 a i 2 ). (2-14). 對 e 作偏微,找出迴歸係數 w,可以變成式(2-15):. e  i (2x i a i  2wa i 2 )  2i x i a i  2w i a i 2 w. (2-15). 希望誤差等於 0,所以式(2-15)左邊等於 0 可以變成式(2-16): 0  2i x i a i  2 w i a i 2 13. (2-16).

(25) 上式整理後,最後變成,就求出迴歸係數 w,如式(2-17):. w. i x i a i i a i 2. 14. (2-17).

(26) 第三章. 決策樹與複迴歸預測方法. 3.1 資料處理 本論文的資料來源以及資料前處理以下將介紹。 3.1.1 天氣資料集 本論文的資料是從香港天文台的網站中取得,網站的外觀如圖 3-1:. 圖 3-1 香港天文台 預報氣溫與雨量的訓練資料是從歷史資料隨機抽取四年的過去資料來做 訓練,共 1461 筆,將資料整理在 Excel 裡,表 3-1 為氣溫資料,表 3-2 為 雨量資料。因為資料量比較大,所以這裡都只貼前 15 筆資料表示:. 15.

(27) 表 3-1 氣溫資料. 表 3-2 雨量資料. 16.

(28) 其輸入參數單位如表 3-3、3-4 所示: 表 3-3 氣溫影響參數 氣溫影響參數. 單位. 月份. 月. 平均氣壓. 百帕斯卡(hPa). 平均相對溼度. %. 平均相對雲量. %. 總雨量. 毫米(mm) 表 3-4 雨量影響參數. 雨量影響參數. 單位. 平均氣壓. 百帕斯卡(hPa). 最高氣溫. 攝氏度(℃). 平均相對溼度. %. 平均風速. 公里/小時(km/h). 3.1.2 資料前處理 因為氣溫與雨量的數值的範圍很大,如果要讓決策樹的葉節點都要符 合每個數值的輸出會造成樹成長的過大而每個節點都只有單一個資料的 問題,所以要先把輸出的數值區間化(Interval),而氣溫與雨量區間化的範 圍如表 3-5 與表 3-6 所示:. 17.

(29) 表 3-5 氣溫區間化 氣溫區間化 氣溫(℃). 區間化參數. 10~14. a. 15~19. b. 20~24. c. 25~29. d. 30~35. e 表 3-6 雨量區間化 雨量區間化. 雨量(mm). 區間化參數. 0. a. 1~100. b. 100 以上. c. 而將前處理完的氣溫與雨量的 Excel 檔資料,整理成表 3-7 與表 3-8。表 3-7 為氣溫區間化資料,表 3-8 為雨量區間化資料。因為資料量比較大,所以 這裡都只貼前 15 筆資料表示:. 18.

(30) 表 3-7 氣溫區間化資料. 表 3-8 雨量區間化資料. 19.

(31) 3.2 決策樹分析 將整理好的 Excel 資料輸入 R 軟體在使用 rpart toolbox 進行決策樹分 析與建模,rpart 的決策樹演算法是利用 CART,因為 CART 的計算速度比 較快並且可以降低過度適應的這問題以避免樹成長的過大,在建模過程會 計算輸入參數與輸出參數的 Gini index 值以最小的來做分割,一直疊代就 可以生成樹狀模型,所以每個分割點都是最好的。決策樹分析的流程圖如 圖 3-2 所示:. 開始訓練. R軟體程式執行. 還沒超過. 判斷決策樹分類是否超過門 檻值. 讀取氣溫或雨量資料. 超過. 將分類結果呈現出來. 決定預測方法. R軟體程式結束. 圖 3-2 R 軟體決策樹分析流程圖. 20.

(32) 3.3 複迴歸分析 決策樹建立好後,將訓練資料用決策樹建立好的決策規則將 Excel 的 輸入資料進行分類,每個葉節點都有不同分類的資料集,再利用 Excel 的 迴歸分析將每個葉節點的資料集進行複迴歸分析找出複迴歸數學模型,最 後把複迴歸數學模型取代每個葉節點區間參數完成複迴歸決策樹模型。. 3.4 評估 3.4.1 平均絕對誤差 平均絕對誤差(Mean absolute error,簡稱 MAE),平均絕對誤差如式 (3-1)表示:. 平均絕對誤差 . 1 n  x i  xˆ i n i 1. (3-1). x i 為實際值, xˆ i 為預測值,n 為資料總數。 3.4.2 均方根誤差 均方根誤差(Root mean square error,簡稱 RMSE),均方根誤差如式 (3-2)表示:. i 1 (x i  xˆ i ) 2 n. 均方根誤差 . n. (3-2). x i 為實際值, xˆ i 為預測值,n 為資料總數。 3.4.3 平均絕對百分比誤差 平均絕對百分比誤差(Mean absolute percentage error,簡稱 MAPE) , 平均絕對百分比如式(3-3)表示:. 21.

(33) 平均絕對百分比誤差 . 1 n x i  xˆ i  100%  n i 1 x i. (3-3). x i 為實際值, xˆ i 為預測值,n 為資料總數。表 3-9 為平均絕對百分比誤差 的預測效果。 表 3-9 平均絕對百分比誤差的預測效果 平均絕對百分比誤差(%). 預測效果. <10. 高準確預測. 10~20. 優良預測. 20~50. 合理預測. >50. 不準確預測. 3.4.4 皮爾森相關係數 皮爾森相關係數(Pearson correlation coefficient)由兩個變項與其各自 的平均數差的成績總和除以與各自均方根之成績總和,用來進一步驗證兩 變項的直線關係,皮爾森相關係數如式(3-4)來表示:. i 1 ( xˆ i  x i )( yi  yi ) n n i 1 ( xˆ i  x i )2 i 1 ( yi  yi )2 n. 皮爾森相關係數 . (3-4). 其中 xˆ i 為預測值, yi 為實際值,n 為樣本數, x i 與 y i 分別為預測值和實際 值的平均數。皮爾森相關係數的數值範圍從-1 到+1,沒有單位。表 3-10 為皮爾森相關係數的相關性效果。. 22.

(34) 表 3-10 皮爾森相關係數的相關性效果 皮爾森相關係數. 相關性. 1. 完全相關. 0.7~0.99. 高度相關. 0.4~0.69. 中度相關. 0.1~0.39. 低度相關. 0.001~0.09. 接近無相關. 0. 無相關. -0.001~-0.09. 接近無相關. -0.1~-0.39. 低度負相關. -0.4~-0.69. 中度負相關. -0.7~-0.99. 高度負相關. -1. 完全負相關. 3.4.5 信賴區間 信賴區間(Confidence Interval)[38]是一種樣本對總母群的區間估計,這 所代表的是實際值會有多少筆會落在樣本估計值的估計區間裡,也可以說 是參數的實際值在預測值的區間所具有的可信程度,都會要求一定機率的 信賴區間,而這個機率也可以稱作信心水準。例如:一般信賴區間的要求 會是 90%、95%跟 99%,這機率就代表實際值會有 90%、95%跟 99%落在 預測的估計區間裡。信賴區間可以用來表示這預測模型的好壞,因應不同 領域會產生出不同的信賴區間表示方法,本論文會使用複迴歸的信賴區間 來說明此預測方法的好壞程度。 23.

(35) (1)氣溫預測信賴區間 氣溫的輸入參數有 5 個,月份、壓力、濕度、雲量跟雨量,把它寫成 複迴歸的數學方程式如式(3-5)所示:. Ti  0  1Mi  2 Pi  3Hi  4Ci  5R i. (3-5). 上列式子的複迴歸統計信賴區間如式(3-6)所示:. Tˆ 0  t n 6, / 2STˆ. (3-6) 0. 其中 Tˆ 0 為預測值,t 為 T 檢定,n-6 是因為要減去 0 到 5 的 6 個自由度,α 為自己所需的信賴區間機率值,因為我們不知母體的標準差,所以要用 STˆ. 0. 預測的標準差來估計, STˆ 如式(3-7)所示: 0. 1 STˆ  ST|MPHCR 2 [k  ] n. (3-7). 0. 其中 ST|MPHCR 2 如式(3-8)所示:. (T  Tˆ i ) 2  i 1 i  n. ST|MPHCR. 2. (3-8). n 6. 其中 Ti 為實際值。k 如式(3-9)所示:. k. M 0 2 ( P HCR ) 2  P0 2 ( M HCR ) 2  H 0 2 ( M PCR ) 2  C 0 2 ( M PCR ) 2. M P H C R 2. 2. 2. 2. 2.  ( M P HCR ) 2.  R 0 2 ( M P HC) 2  2M 0 P0 H 0 C 0 R 0  M P HCR. M P H C R 2. 2. 2. 2. 2.  ( M P H CR ). 2. (3-9). 其中 M0、P0、H0、C0、R0 為其中一筆資料的資料值, M 、 P 、 H 、 C 、 R 為各資料整體平均值。但因為本論文是要用來預測,所以式(3-7)變成式 (3-10) 24.

(36) STˆ  ST|MPHCR 2 [k  0. 1  1] n. (3-10). 因為式子中括號裡的數值用來預測時會很小,所以在預測方面要在中括號 裡再加個 1,才能讓出來數值有比較明顯的區間。 (2)雨量預測信賴區間 氣溫的輸入參數有 4 個,壓力、溫度、濕度跟風速,把它寫成複迴歸 的數學方程式如式(3-11)所示:. R i  0  1Pi  2Ti  3Hi  4 Wi. (3-11). 上列式子的複迴歸統計信賴區間如式(3-12)所示:. Rˆ 0  t n 5, / 2SRˆ. (3-12) 0. 其中 Rˆ 0 為預測值,t 為 T 檢定,n-6 是因為要減去 0 到  4 的 5 個自由度,α 為自己所需的信賴區間機率值,因為我們不知母體的標準差,所以要用 SRˆ. 0. 預測的標準差來估計, S Rˆ 如式(3-13)所示: 0. 1 SRˆ  S R |PTHW 2 [k  ] n. (3-13). 0. 其中 SR|PTHW 2 如式(3-14)所示:. (R i  Rˆ i ) 2  i 1  n. SR|PTHW. 2. (3-14). n 5. 其中 R i 為實際值。k 如式(3-15)所示:. k. P0 2 ( T H W ) 2  T0 2 ( P H W ) 2  H 0 2 ( PT W ) 2. P T H W 2. 2. 2. 2.  ( PT H W ) 2.  W0 2 ( PTH) 2  2P0 T0 H 0 W0  PTHW. P T H W 2. 2. 2. 25. 2.  ( PT H W ). 2. (3-15).

(37) 其中 P0、T0、H0、W0 為其中一筆資料的資料值, P 、 T 、 H 、 W 為各資 料整體平均值。但因為本論文是要用來預測,所以式(3-13)變成式(3-16). SRˆ  SR |PTHW 2 [k  0. 1  1] n. (3-16). 因為式子中括號裡的數值用來預測時會很小,所以在預測方面要在中括號 裡再加個 1,才能讓出來數值有比較明顯的區間。. 26.

(38) 第四章. 實驗與討論. 4.1 資料的相關性分析 4.1.1 氣溫的相關性分析 在建立決策樹模型之前,先對氣溫的輸入參數與輸出參數作相關性分 析,在之後可以驗證相關性高的比較容易在決策樹分割的數值裡取得較高 的分割係數,表示可以用那個輸入參數來進行分割決策樹的依據,氣溫的 輸入參數有月份、平均氣壓、平均相對溼度、平均相對雲量、總雨量這 5 個,輸出的參數為氣溫,表 4-1 為這 5 個輸入參數對輸出參數的相關係數 分析。 表 4-1 氣溫相關性分析 輸入參數. 皮爾森相關係數. 相關性效果. 月份. 0.75. 高度相關. 平均氣壓. 0.82. 高度相關. 平均相對溼度. 0.47. 中度相關. 平均相對雲量. 0.62. 中度相關. 總雨量. 0.21. 低度相關. 4.1.2 雨量的相關性分析 在建立決策樹模型之前,先對雨量的輸入參數與輸出參數作相關性分 析,在之後可以驗證相關性高的比較容易在決策樹分割的數值裡取得較高 的分割係數,表示可以用那個輸入參數來進行分割決策樹的依據,氣溫的 輸入參數有平均氣壓、最高氣溫、平均相對溼度、平均風速這 4 個,輸出 27.

(39) 的參數為雨量,表 4-2 為這 4 個輸入參數對輸出參數的相關係數分析。 表 4-2 雨量相關性分析 輸入參數. 皮爾森相關係數. 相關性效果. 平均氣壓. 0.82. 高度相關. 最高氣溫. 0.67. 中度相關. 平均相對溼度. 0.92. 高度相關. 平均風速. 0.86. 高度相關. 4.2 建立決策樹 4.2.1 氣溫的決策樹建立 氣溫的訓練資料共有 1461 筆,依據學習訓練資料集產生 CART 氣溫 決策樹模型,所得到的氣溫決策樹模型如圖 4-1 所示: Pressure 1014. Pressure 1019. Month<3.5 Month<3.5. 節點一: c. 節點二: c. 節點三: d. 節點四: d. 節點五: e. 圖 4-1 氣溫決策樹 圖 4-1 的氣溫決策樹可以寫成 5 條決策規則: then(Temperature 20~24o). 1.. If(Pressure. 2.. If(1014 Pressure 1019)and(Month 3.5 28. then(Temperature 20~24o).

(40) then(Temperature 25~29o). 3.. If(1014 Pressure 1019)and(Month 3.5. 4.. If(Pressure 1014)and(Month 3.5. then(Temperature 25~29o). 5.. If(Pressure 1014)and(Month 3.5. then(Temperature 30~34o). 從 4-1 圖可以看出,平均氣壓是根節點,也就是說剛開始算 Gini index 值 是最小的,所以先用平均氣壓分割決策樹。而這決策樹也驗證了表 4-1 的 氣壓相關性分析,在表 4-1 說明了平均氣壓與氣溫的相關性是最高的,而 決策樹建立出來的也是先以平均氣壓為根節點,所以可以兩相驗證達到決 策樹建立的正確性。雖然輸入參數有 5 個,但決策樹建立不一定會 5 個輸 入參數都會用完,只要把資料都可以分割好,決策樹也就會停止不在生長, 以避免決策樹生長過大的問題。 4.2.2 雨量決策樹建立 雨量的訓練資料共有 1461 筆,依據學習訓練資料集產生 CART 雨量 決策樹模型,所得到的雨量決策樹模型如圖 4-2 所示: Humidity<82.5. Windspeed<18.7. Humidity<74.5. Pressure 1012 Pressure 1008 節點十: 節點一: Humidity<88.5 Temperature 16.25 Windspeed<15.15 c a 節點九: Pressure 1004 節點七: 節點八: b 節點二: 節點三: 節點六: a b a b 節點四: 節點五: b a b. 圖 4-2 雨量決策樹 圖 4-2 的雨量決策樹可以寫成 10 條決策規則: 1.. If(Humidity 74.5). then(Rainy=0mm). 2.. If(74.5 Humidity 82.5)and(Pressure 1008)and(Temperature 16.25) then(rainy 0mm) 29.

(41) 3.. If(74.5 Humidity 82.5)and(Pressure 1008)and(Temperature 16.25) then(0<Rainy 100mm). 4.. If(74.5 Humidity 82.5)and(74.5 Pressure 1008)and(Windspeed 15.1 5) then(Rainy 0mm). 5.. If(74.5. Humidity. 82.5)and(Pressure. 1004)and(Windspeed. 15.15). 1004)and(Windspeed. 15.15). then(0<Rainy 100mm) 6.. If(74.5. Humidity. 82.5)and(Pressure. then(0<Rainy 100mm) 7.. If(82.5. Humidity. 88.5)and(Windspeed. 18.7)and(Pressure. 1012). then(0<Rainy 100mm) 8.. If(humidity. 88.5)and(Windspeed. 18.7) and(Pressure. 1012). 18.7) and(Pressure. 1012). then(0<Rainy 100mm) 9.. If(humidity. 82.5)and(Windspeed. then(0<Rainy 100mm) 10. If(humidity 82.5)and(Windspeed 18.7) then(Rainy 100mm) 從 4-2 圖可以看出,平均相對溼度是根節點,也就是說剛開始算 Gini index 值是最小的,所以先用平均相對溼度分割決策樹。而這決策樹也驗證了表 4-2 的氣壓相關性分析,在表 4-2 說明了平均相對溼度與氣溫的相關性是最 高的,而決策樹建立出來的也是先以平均相對溼度為根節點,所以可以兩 相驗證達到決策樹建立的正確性。雖然輸入參數有 4 個,但決策樹建立不 一定會 4 個輸入參數都會用完,只要把資料都可以分割好,決策樹也就會 停止不在生長,以避免決策樹生長過大的問題。. 30.

(42) 4.3 複迴歸分析 4.3.1 氣溫複迴歸分析 建立好氣溫決策樹後,把決策規則用在訓練資料裡進行分類,可以找 出每個節點的資料集,這些資料集再利用式(2-17)進行迴歸分析,找出每 個節點的迴歸數學模型,氣溫複迴歸數學模型如式(4-1)。表 4-3 為各節點 的迴歸數學模型:. Temperature  Month  M  Pr essure  P  Humidity  H  Cloudy  C  Rainfall  R  Intercept. (4-1). 其中 Month, Pressure, Humidity, Cloudy 與 Rainfall 為各參數的迴歸係數, M, P, H, C 與 R 為各參數的當前值,Intercept 為截距。 表 4-3 氣溫迴歸數學模型 節點一 Month. 0.274137. Pressure. -0.6624. Humidity. 0.018124. Cloudy. -0.02909. Rainfall. -0.01987. Intercept. 693.34 節點二. Month. 0.878843. Pressure. -0.41793. Humidity. 0.053418. Cloudy. -0.04613. 31.

(43) Rainfall. -0.03231. Intercept. 440.5675 節點三. Month. 0.273032. Pressure. -0.66164. Humidity. 0.019544. Cloudy. -0.02916. Rainfall. -0.019994. Intercept. 692.4347 節點四. Month. 0.893109. Pressure. -0.42882. Humidity. +0.050562. Cloudy. -0.0465. Rainfall. -0.02309. Intercept. 451.8819 節點五. Month. 0.272722. Pressure. -0.66175. Humidity. 0.019409. Cloudy. -0.02915. Rainfall. -0.01993. Intercept. 692.5546. 32.

(44) 最後把迴歸數學模型代回各節點後,就可以變成圖 4-3,也就是最後氣溫 迴歸決策樹的模型。 Pressure 1014. Pressure 1019. Month<3.5 Month<3.5. 節點一: Temperature= 0.274137M -0.66243P +0.018124H -0.02909C -0.01987R +683.34. 節點二: Temperature= 0.878843M -0.417393P +0.053418H -0.04613C -0.03231R +440.5675. 節點三: Temperature= 0.273032M -0.66164P +0.019544H -0.02916C -0.01994R +692.4347. 節點四: Temperature= 0.893109M -0.42882P +0.050562H -0.0465C -0.02309R +451.8819. 節點五: Temperature= 0.272722M -0.66175P +0.019409H -0.02915C -0.01993R +692.5546. 圖 4-3 氣溫迴歸決策樹 4.3.2 雨量迴歸分析 建立好雨量決策樹後,把決策規則用在訓練資料裡進行分類,可以找 出每個節點的資料集,這些資料集再利用式(2-17)進行迴歸分析,找出每 個節點的迴歸數學模型,雨量複迴歸數學模型如式(4-2)。表 4-4 為各節點 的迴歸數學模型:. Rainfall  Pr essure  P  Temperature  T  Humidity  H  Windspeed  W  Intercept. (4-2). 其中 Pressure, Temperature, Humidity 與 Windspeed 為各參數的迴歸係數, P, T, H 與 W 為各參數的當前值,Intercept 為截距。 表 4-4 雨量迴歸數學模型 節點一 Pressure. 0 33.

(45) Temperature. 0. Humidity. 0. Windspeed. 0. Intercept. 0 節點二. Pressure. 0. Temperature. 0. Humidity. 0. Windspeed. 0. Intercept. 0 節點三. Pressure. -0.94526. Temperature. -0.49264. Humidity. 0.587499. Windspeed. 0.383156. Intercept. 923.44 節點四. Pressure. 0. Temperature. 0. Humidity. 0. Windspeed. 0. Intercept. 0 節點五. Pressure. -0.94019 34.

(46) Temperature. -0.61296. Humidity. 0.743725. Windspeed. 0.401149. Intercept. 908.7269 節點六. Pressure. -1.1382. Temperature. -0.61637. Humidity. 0.717244. Windspeed. 0.503909. Intercept. 1110.166 節點七. Pressure. 0. Temperature. 0. Humidity. 0. Windspeed. 0. Intercept. 0 節點八. Pressure. -0.92274. Temperature. -0.457533. Humidity. 0.567187. Windspeed. 0.378446. Intercept. 901.3223 節點九. Pressure. -1.1695 35.

(47) Temperature. -0.65471. Humidity. 0.707421. Windspeed. 0.500343. Intercept. 1143.624 節點十. Pressure. -1.23034. Temperature. -0.73753. Humidity. 0.642799. Windspeed. -0.497356. Intercept. 1212.581. 最後把迴歸數學模型代回各節點後,就可以變成圖 4-4,也就是最後雨量 迴歸決策樹的模型。 Humidity<82.5. Windspeed<18.7. Humidity<74.5 Pressure 1008. Pressure 1012. Windspeed<15.15 Pressure 1004. Temperature 16.25 節點一: Rainfall=0 節點二: 節點三: 節點四: Rainfall=0 Rainfall= Rainfall=0 -0.94526P -0.49264T +0.587499H +0.383156W +923.44. 節點五: Rainfall= -0.94019P -0.61296T +0.7433725H +0.4001149W +908.7269. 節點六: Rainfall= -0.11382P -0.61637T +0.717244H +0.503909W +1110.166. Humidity<88.5 節點九: 節點七: 節點八: Rainfall= -1.1695P Rainfall=0 Rainfall= -0.922274P -0.65471T -0.45653T +0.707421H +0.567187H +0.599343W +0.378446W +1143.624 +901.3223. 圖 4-4 雨量迴歸決策樹. 36. 節點十: Rainfall= -1.23034P -0.73753T +0.642799H +0.4973356W +1212.581.

(48) 4.4 評估預測好壞 4.4.1 氣溫迴歸決策樹預測 測試資料是拿香港天文氣象台一整年共 365 筆的資料來做測試。領前 一天氣溫的預測效果如圖 4-5 所示,圖 4-6 為領前一天氣溫預測值與實際 值的誤差: 領前一天氣溫預測 36. 溫度(℃). 30 24 18 12 6 1. 61. 121. 181. 241. 301. 361. 日 Actualtemperature. DT+MLR. AR. MA. ARIMA. 圖 4-5 領前一天氣溫預測 領前一天氣溫預測誤差 2.5. 溫度(℃). 2 1.5 1 0.5 0 1. 61. 121. 181. 241. 301. 日 DT+MLR. AR. MA. ARIMA. 圖 4-6 領前一天氣溫預測值與實際值的誤差. 37. 361.

(49) 圖 4-7 為領前一天氣溫資料中的其中一週預測效果,圖 4-8 為領前一 天氣溫資料中其中一週預測值與實際值的誤差: 領前一天的其中一週預測效果 22. 溫度(℃). 20 18 16 14 12 10 8 1. 2. 3. 4. 5. 6. 7. 日 Actualtemperature. DT+MLR. AR. MA. ARIMA. 圖 4-7 領前一天的其中一週預測效果 領前一天的其中一週預測值與實際值的誤差 2.5. 溫度(℃). 2 1.5 1 0.5 0 1. 2. 3. 4. 5. 6. 日 DT+MLR. AR. MA. ARIMA. 圖 4-8 領前一天的其中一周預測值與實際值的誤差. 38. 7.

(50) 領前二天氣溫的預測效果如圖 4-9 所示,圖 4-10 為領前二天氣溫預測 值與實際值的誤差: 領前二天氣溫預測 36. 溫度(℃). 30 24 18 12 6 1. 61. 121. 181. 241. 301. 361. 日 Actualtemperature. DT+MLR. AR. MA. ARIMA. 圖 4-9 領前二天氣溫預測 領前二天氣溫預測誤差 3.5. 溫度(℃). 3 2.5 2 1.5 1 0.5 0 1. 61. 121. 181. 241. 301. 日 DT+MLR. AR. MA. ARIMA. 圖 4-10 領前二天氣溫預測值與實際值的誤差. 39. 361.

(51) 圖 4-11 為領前二天氣溫資料中的其中一週預測效果,圖 4-12 為領前 二天氣溫資料中其中一週預測值與實際值的誤差: 領前二天的其中一週預測效果 24. 溫度(℃). 22 20 18 16 14 12 10 1. 2. 3. 4. 5. 6. 7. 日 Actualtemperature. DT+MLR. AR. MA. ARIMA. 圖 4-11 領前二天的其中一週預測效果 領前二天的其中一週預測值與實際值的誤差 3. 溫度(℃). 2.5 2 1.5 1 0.5 0 1. 2. 3. 4. 5. 6. 7. 日 DT+MLR. AR. MA. ARIMA. 圖 4-12 領前二天的其中一周預測值與實際值的誤差. 40.

(52) 領前三天氣溫的預測效果如圖 4-13 所示,圖 4-14 為領前三天氣溫預 測值與實際值的誤差: 領前三天氣溫預測 36. 溫度(℃). 30 24 18 12 6 1. 61. 121. 181. 241. 301. 361. 日 Actualtemperature. DT+MLR. AR. MA. ARIMA. 圖 4-13 領前三天氣溫預測. 溫度(℃). 領前三天氣溫預測誤差 4 3.5 3 2.5 2 1.5 1 0.5 0 1. 61. 121. 181. 241. 301. 日 DT+MLR. AR. MA. ARIMA. 圖 4-14 領前三天氣溫預測值與實際值的誤差. 41. 361.

(53) 圖 4-15 為領前三天氣溫資料中的其中一週預測效果,圖 4-16 為領前 三天氣溫資料中其中一週預測值與實際值的誤差: 領前三天的其中一週預測效果. 溫度(℃). 22 20 18 16 14 12 10 1. 2. 3. 4. 5. 6. 7. 日 Actualtemperature. DT+MLR. AR. MA. ARIMA. 圖 4-15 領前三天的其中一週預測效果 領前三天的其中一週預測值與實際值的誤差 3.5. 溫度(℃). 3 2.5 2 1.5 1 0.5 0 1. 2. 3. 4. 5. 6. 7. 日 DT+MLR. AR. MA. ARIMA. 圖 4-16 領前三天的其中一周預測值與實際值的誤差. 42.

(54) 領前四天氣溫的預測效果如圖 4-17 所示,圖 4-18 為領前四天氣溫預 測值與實際值的誤差: 領前四天氣溫預測 36. 溫度(℃). 30 24 18 12 6 1. 61. 121. 181. 241. 301. 361. 日 Actualtemperature. DT+MLR. AR. MA. ARIMA. 圖 4-17 領前四天氣溫預測 領前四天氣溫預測誤差 5. 溫度(℃). 4 3 2 1 0 1. 61. 121. 181. 241. 301. 日 DT+MLR. AR. MA. ARIMA. 圖 4-18 領前四天氣溫預測值與實際值的誤差. 43. 361.

(55) 圖 4-19 為領前四天氣溫資料中的其中一週預測效果,圖 4-20 為領前 四天氣溫資料中其中一週預測值與實際值的誤差: 領前四天的其中一週預測效果 24. 溫度(℃). 22 20 18 16 14 12 10 1. 2. 3. 4. 5. 6. 7. 日 Actualtemperature. DT+MLR. AR. MA. ARIMA. 圖 4-19 領前四天的其中一週預測效果 領前四天的其中一週預測值與實際值的誤差 3.5. 溫度(℃). 3 2.5 2 1.5 1 0.5 0 1. 2. 3. 4. 5. 6. 7. 日 DT+MLR. AR. MA. ARIMA. 圖 4-20 領前四天的其中一周預測值與實際值的誤差. 44.

(56) 領前五天氣溫的預測效果如圖 4-21 所示,圖 4-22 為領前五天氣溫預 測值與實際值的誤差: 領前五天氣溫預測 36. 溫度(℃). 30 24 18 12 6 1. 61. 121. 181. 241. 301. 361. 日 Actualtemperature. DT+MLR. AR. MA. ARIMA. 圖 4-21 領前五天氣溫預測 領前五天氣溫預測誤差 5. 溫度(℃). 4 3 2 1 0 1. 61. 121. 181. 241. 301. 日 DT+MLR. AR. MA. ARIMA. 圖 4-22 領前五天氣溫預測值與實際值的誤差. 45. 361.

(57) 圖 4-23 為領前五天氣溫資料中的其中一週預測效果,圖 4-24 為領前 五天氣溫資料中其中一週預測值與實際值的誤差: 領前五天的其中一週預測效果 24. 溫度(℃). 22 20 18 16 14 12 10 1. 2. 3. 4. 5. 6. 7. 日 Actualtemperature. DT+MLR. AR. MA. ARIMA. 圖 4-23 領前五天的其中一週預測效果 領前五天的其中一週預測值與實際值的誤差 3.5. 溫度(℃). 3 2.5 2 1.5 1 0.5 0 1. 2. 3. 4. 5. 6. 7. 日 DT+MLR. AR. MA. ARIMA. 圖 4-24 領前五天的其中一周預測值與實際值的誤差. 46.

(58) 領前六天氣溫的預測效果如圖 4-25 所示,圖 4-26 為領前六天氣溫預 測值與實際值的誤差: 領前六天氣溫預測 36. 溫度(℃). 30 24 18 12 6 1. 61. 121. 181. 241. 301. 361. 日 Actualtemperature. DT+MLR. AR. MA. ARIMA. 圖 4-25 領前六天氣溫預測 領前六天氣溫預測誤差 5. 溫度(℃). 4 3 2 1 0 1. 61. 121. 181. 241. 301. 日 DT+MLR. AR. MA. ARIMA. 圖 4-26 領前六天氣溫預測值與實際值的誤差. 47. 361.

(59) 圖 4-27 為領前六天氣溫資料中的其中一週預測效果,圖 4-28 為領前 六天氣溫資料中其中一週預測值與實際值的誤差: 領前六天的其中一週預測效果 24. 溫度(℃). 22 20 18 16 14 12 10 1. 2. 3. 4. 5. 6. 7. 日 Actualtemperature. DT+MLR. AR. MA. ARIMA. 圖 4-27 領前六天的其中一週預測效果 領前六天的其中一週預測值與實際值的誤差 5. 溫度(℃). 4 3 2 1 0 1. 2. 3. 4. 5. 6. 7. 日 DT+MLR. AR. MA. ARIMA. 圖 4-28 領前六天的其中一周預測值與實際值的誤差. 48.

(60) 領前七天氣溫的預測效果如圖 4-29 所示,圖 4-30 為領前七天氣溫預 測值與實際值的誤差: 領前七天氣溫預測. 溫度(℃). 36 30 24 18 12 6 1. 61. 121. 181. 241. 301. 361. 日 Actualtemperature. DT+MLR. AR. MA. ARIMA. 圖 4-29 領前七天氣溫預測 領前七天氣溫預測誤差. 溫度(℃). 5 4 3 2 1 0 1. 61. 121. 181. 241. 301. 日 DT+MLR. AR. MA. ARIMA. 圖 4-30 領前七天氣溫預測值與實際值的誤差. 49. 361.

(61) 圖 4-31 為領前七天氣溫資料中的其中一週預測效果,圖 4-32 為領前 七天氣溫資料中其中一週預測值與實際值的誤差: 領前七天的其中一週預測效果 24. 溫度(℃). 22 20 18 16 14 12 10 1. 2. 3. 4. 5. 6. 7. 日 Actualtemperature. DT+MLR. AR. MA. ARIMA. 圖 4-31 領前七天的其中一週預測效果. 溫度(℃). 領前七天的其中一週預測值與實際值的誤差 4.5 4 3.5 3 2.5 2 1.5 1 0.5 0 1. 2. 3. 4. 5. 6. 7. 日 DT+MLR. AR. MA. ARIMA. 圖 4-32 領前七天的其中一周預測值與實際值的誤差. 50.

(62) 利用式(3-6)可算出氣溫的信賴區間,圖 4-33、4-34 為其中兩筆資料 領前七天的氣溫信賴區間圖,紅色線是用決策樹結合複迴歸模型的預測值, 都會落在 95%的上下限裡面。. 溫度(℃). 氣溫信賴區間 17 16 15 14 13 12 11 10 9 8 一. 二. 三. 四. 五. 六. 七. 領前天數 Actualtemperature. 下限95%. DT+MLR. 上限95%. 圖 4-33 氣溫信賴區間 氣溫信賴區間 22. 溫度(℃). 21 20 19 18 17 16 15 一. 二. 三. 四. 五. 六. 七. 領前天數 Actualtemperature. DT+MLR. 下限95%. 上限95%. 圖 4-34 氣溫信賴區間 表 4-5 為本論文方法與 AR、MA、ARIMA 三種時間序列的預測方法比較. 表。AR 是用式(2-1)找出預測值,參數 p 是選擇 4,也就是 AR(4)。MA 是 式(2-2)來找出預測值,參數 q 不宜選擇過大,不然會使得預測值變化不明 顯,所以最後 q 是選擇 3,也就是 MA(3)。ARIMA 是用式(2-3)找出預測值, 51.

(63) p 與 q 分別選擇 4 與 3,而差分項 d 選擇 1,也就是 ARIMA(4,3,1)。由表 4-5 可以看出本論文的方法都有比其他三種來的好。表 4-6 為整年的信賴區 間表,在式(3-6)中,tn-6 用查表法找出值約為 1.96。STˆ 可用式(3-10)算出, 0. 在式(3-10)中, ST|MPHCR 2 為訓練資料的標準誤差,也就是式(3-8)所算出的 值。k 可用式(3-9)算出。表 4-6 說明了整年領前七天幾乎都有 95%以上的 資料會落在計算出來的信賴區間裡。 表 4-5 預測模型比較 MAE(℃) Day1. Day2. Day3. Day4. Day5. Day6. Day7. AR. 1.582934. 1.849379. 2.384739. 2.593713. 2.743682. 3.283642. 3.683912. MA. 1.859302. 2.348593. 2.853922. 3.483921. 3.859287. 4.198837. 4.893821. ARIMA. 1.098475. 1.339485. 1.859383. 2.139485. 2.593843. 2.874933. 3.183948. DT+MLR. 0.767469. 1.060322. 1.485885. 1.576644. 2.020486. 2.104025. 2.470465. RMSE(℃) AR. 1.523852. 1.984932. 2.738471. 3.093849. 3.238749. 3.573821. 3.948573. MA. 2.089374. 2.583918. 2.948573. 3.543921. 4.097389. 4.438371. 4.898372. ARIMA. 1.384739. 1.583729. 2.093849. 2.493729. 2.949382. 3.239483. 3.583729. DT+MLR. 0.939228. 1.306369. 1.839327. 1.931441. 2.454578. 2.523955. 2.960434. MAPE(%) AR. 7.382719. 9.384765. 13.49573. 15.98374. 18.83749. 20.39485. 25.38291. MA. 10.39489. 14.39283. 19.49839. 25.29384. 28.48372. 30.49281. 34.29381. ARIMA. 5.382719. 7.483719. 10.39475. 12.49382. 15.39483. 18.48372. 20.39483. DT+MLR. 3.371654. 4.674258. 6.534029. 6.934151. 9.200218. 9.283791. 10.773. 52.

(64) 表 4-6 氣溫迴歸決策樹信賴區間表 領前一天. 領前二天. 領前三天. 領前四天. 領前五天. 領前六天. 領前七天. 標準誤差. 0.728374. 0.847593. 1.11183. 1.375938. 1.836485. 2.029374. 2.284638. 符合數目. 356. 352. 354. 350. 352. 350. 352. 總筆數. 365. 364. 363. 362. 361. 360. 359. 信賴程度. 97.53%. 96.70%. 97.52%. 96.69%. 97.51%. 97.22%. 98.05%. 53.

(65) 4.4.2 雨量迴歸決策樹預測 測試資料是拿香港天文氣象台一整年共 365 筆的資料來做測試。領前 一天雨量的預測效果如圖 4-35 所示,圖 4-36 為領前一天雨量預測值與實 際值的誤差: 領前一天雨量預測 300. 雨量(mm). 250 200 150 100 50 0 1. 61. 121. 181. 241. 301. 361. 日 Actualrainfall. DT+MLR. AR. MA. ARIMA. 圖 4-35 領前一天雨量預測 領前一天雨量預測誤差 35. 雨量(mm). 30 25 20 15 10 5 0 1. 61. 121. 181. 241. 301. 日 DT+MLR. AR. MA. ARIMA. 圖 4-36 領前一天雨量預測值與實際值的誤差. 54. 361.

(66) 圖 4-37 為領前一天雨量資料中的其中一週預測效果,圖 4-38 為領前 一天雨量資料中其中一週預測值與實際值的誤差: 領前一天的其中一週預測效果 160. 雨量(mm). 140 120 100 80 60 40 20 0 1. 2. 3. 4. 5. 6. 7. 日 Actualrainfall. DT+MLR. AR. MA. ARIMA. 圖 4-37 領前一天的其中一週預測效果. 雨量(mm). 領前一天的其中一週預測值與實際值的誤差 18 16 14 12 10 8 6 4 2 0 1. 2. 3. 4. 5. 6. 7. 日 DT+MLR. AR. MA. ARIMA. 圖 4-38 領前一天的其中一周預測值與實際值的誤差. 55.

(67) 領前二天雨量的預測效果如圖 4-39 所示,圖 4-40 為領前二天雨量預 測值與實際值的誤差: 領前二天雨量預測 300. 雨量(mm). 250 200 150 100 50 0 1. 61. 121. 181. 241. 301. 361. 日 Actualrainfall. DT+MLR. AR. MA. ARIMA. 圖 4-39 領前二天雨量預測 領前二天雨量預測誤差 35. 雨量(mm). 30 25 20 15 10 5 0 1. 61. 121. 181. 241. 301. 日 DT+MLR. AR. MA. ARIMA. 圖 4-40 領前二天雨量預測值與實際值的誤差. 56. 361.

(68) 圖 4-41 為領前二天雨量資料中的其中一週預測效果,圖 4-42 為領前 二天雨量資料中其中一週預測值與實際值的誤差: 領前二天的其中一週預測效果 140. 雨量(mm). 120 100 80 60 40 20 0 1. 2. 3. 4. 5. 6. 7. 日 Actualrainfall. DT+MLR. AR. MA. ARIMA. 圖 4-41 領前二天的其中一週預測效果 領前二天的其中一週預測值與實際值的誤差. 雨量(mm). 20 15 10 5 0 1. 2. 3. 4. 5. 6. 7. 日 DT+MLR. AR. MA. ARIMA. 圖 4-42 領前二天的其中一周預測值與實際值的誤差. 57.

(69) 領前三天雨量的預測效果如圖 4-43 所示,圖 4-44 為領前三天雨量預 測值與實際值的誤差: 領前三天雨量預測 300. 雨量(mm). 250 200 150 100 50 0 1. 61. 121. 181. 241. 301. 361. 日 Actualrainfall. DT+MLR. AR. MA. ARIMA. 圖 4-43 領前三天雨量預測 領前三天雨量預測誤差 35. 雨量(mm). 30 25 20 15 10 5 0 1. 61. 121. 181. 241. 301. 日 DT+MLR. AR. MA. ARIMA. 圖 4-44 領前三天雨量預測值與實際值的誤差. 58. 361.

(70) 圖 4-45 為領前三天雨量資料中的其中一週預測效果,圖 4-46 為領前 三天雨量資料中其中一週預測值與實際值的誤差:. 雨量(mm). 領前三天的其中一週預測效果 160 140 120 100 80 60 40 20 0 1. 2. 3. 4. 5. 6. 7. 日 Actualrainfall. DT+MLR. AR. MA. ARIMA. 圖 4-45 領前三天的其中一週預測效果 領前三天的其中一週預測值與實際值的誤差 25. 雨量(mm). 20 15 10 5 0 1. 2. 3. 4. 5. 6. 7. 日 DT+MLR. AR. MA. ARIMA. 圖 4-46 領前三天的其中一周預測值與實際值的誤差. 59.

(71) 領前四天雨量的預測效果如圖 4-47 所示,圖 4-48 為領前四天雨量預 測值與實際值的誤差: 領前四天雨量預測 300. 雨量(mm). 250 200 150 100 50 0 1. 61. 121. 181. 241. 301. 361. 日 Actualrainfall. DT+MLR. AR. MA. ARIMA. 圖 4-47 領前四天雨量預測 領前四天雨量預測誤差 60. 雨量(mm). 50 40 30 20 10 0 1. 61. 121. 181. 241. 301. 日 DT+MLR. AR. MA. ARIMA. 圖 4-48 領前四天雨量預測值與實際值的誤差. 60. 361.

(72) 圖 4-49 為領前四天雨量資料中的其中一週預測效果,圖 4-50 為領前 四天雨量資料中其中一週預測值與實際值的誤差:. 雨量(mm). 領前四天的其中一週預測效果 160 140 120 100 80 60 40 20 0 1. 2. 3. 4. 5. 6. 7. 日 Actualrainfall. DT+MLR. AR. MA. ARIMA. 圖 4-49 領前四天的其中一週預測效果. 雨量(mm). 領前四天的其中一週預測值與實際值的誤差 16 14 12 10 8 6 4 2 0 1. 2. 3. 4. 5. 6. 7. 日 DT+MLR. AR. MA. ARIMA. 圖 4-50 領前四天的其中一周預測值與實際值的誤差. 61.

(73) 領前五天雨量的預測效果如圖 4-51 所示,圖 4-52 為領前五天雨量預 測值與實際值的誤差: 領前五天雨量預測 350. 雨量(mm). 300 250 200 150 100 50 0 1. 61. 121. 181. 241. 301. 361. 日 Actualrainfall. DT+MLR. AR. MA. ARIMA. 圖 4-51 領前五天雨量預測 領前五天雨量預測誤差 70. 雨量(mm). 60 50 40 30 20 10 0 1. 61. 121. 181. 241. 301. 日 DT+MLR. AR. MA. ARIMA. 圖 4-52 領前五天雨量預測值與實際值的誤差. 62. 361.

(74) 圖 4-53 為領前五天雨量資料中的其中一週預測效果,圖 4-54 為領前 五天雨量資料中其中一週預測值與實際值的誤差:. 雨量(mm). 領前五天的其中一週預測效果 160 140 120 100 80 60 40 20 0 1. 2. 3. 4. 5. 6. 7. 日 Actualrainfall. DT+MLR. AR. MA. ARIMA. 圖 4-53 領前五天的其中一週預測效果 領前五天的其中一週預測值與實際值的誤差 25. 雨量(mm). 20 15 10 5 0 1. 2. 3. 4. 5. 6. 7. 日 DT+MLR. AR. MA. ARIMA. 圖 4-54 領前五天的其中一周預測值與實際值的誤差. 63.

(75) 領前六天雨量的預測效果如圖 4-55 所示,圖 4-56 為領前六天雨量預 測值與實際值的誤差: 領前六天雨量預測誤差 300. 雨量(mm). 250 200 150 100 50 0 1. 61. 121. 181. 241. 301. 日 Actualrainfall. DT+MLR. AR. MA. ARIMA. 圖 4-55 領前六天雨量預測 領前六天雨量預測誤差 60. 雨量(mm). 50 40 30 20 10 0 1. 61. 121. 181. 241. 301. 日 DT+MLR. AR. MA. ARIMA. 圖 4-56 領前六天雨量預測值與實際值的誤差. 64. 361.

(76) 圖 4-57 為領前六天雨量資料中的其中一週預測效果,圖 4-58 為領前 六天雨量資料中其中一週預測值與實際值的誤差:. 雨量(mm). 領前六天的其中一週預測效果 160 140 120 100 80 60 40 20 0 1. 2. 3. 4. 5. 6. 7. 日 Actualrainfall. DT+MLR. AR. MA. ARIMA. 圖 4-57 領前六天的其中一週預測效果 領前六天的其中一週預測值與實際值的誤差 30. 雨量(mm). 25 20 15 10 5 0 1. 2. 3. 4. 5. 6. 7. 日 DT+MLR. AR. MA. ARIMA. 圖 4-58 領前六天的其中一周預測值與實際值的誤差. 65.

(77) 領前七天雨量的預測效果如圖 4-59 所示,圖 4-60 為領前七天雨量預 測值與實際值的誤差: 領前七天雨量預測 350. 雨量(mm). 300 250 200 150 100 50 0 1. 61. 121. 181. 241. 301. 361. 日 Actualrainfall. DT+MLR. AR. MA. ARIMA. 圖 4-59 領前七天雨量預測 領前七天雨量預測誤差 70. 座標軸標題. 60 50 40 30 20 10 0 1. 61. 121. 181. 241. 301. 日 DT+MLR. AR. MA. ARIMA. 圖 4-60 領前七天雨量預測值與實際值的誤差. 66. 361.

(78) 圖 4-61 為領前七天雨量資料中的其中一週預測效果,圖 4-58 為領前 七天雨量資料中其中一週預測值與實際值的誤差: 領前七天的其中一週預測效果 140. 雨量(mm). 120 100 80 60 40 20 0 1. 2. 3. 4. 5. 6. 7. 日 Actualrainfall. DT+MLR. AR. MA. ARIMA. 圖 4-61 領前七天的其中一週預測效果 領前七天的其中一週預測值與實際值的誤差 35. 雨量(mm). 30 25 20 15 10 5 0 1. 2. 3. 4. 5. 6. 7. 日 DT+MLR. AR. MA. ARIMA. 圖 4-62 領前七天的其中一周預測值與實際值的誤差. 67.

參考文獻

相關文件

Department of Mathematics, National Taiwan Normal University, Taiwan..

Feng-Jui Hsieh (Department of Mathematics, National Taiwan Normal University) Hak-Ping Tam (Graduate Institute of Science Education,. National Taiwan

2 Department of Educational Psychology and Counseling / Institute for Research Excellence in Learning Science, National Taiwan Normal University. Research on embodied cognition

Department of Mathematics, National Taiwan Normal University,

2 Center for Theoretical Sciences and Center for Quantum Science and Engineering, National Taiwan University, Taipei 10617, Taiwan!. ⇤ Author to whom correspondence should

Department of Mathematics, National Taiwan Normal University, Taiwan..

2 Department of Materials Science and Engineering, National Chung Hsing University, Taichung, Taiwan.. 3 Department of Materials Science and Engineering, National Tsing Hua

Department of Physics and Institute of nanoscience, NCHU, Taiwan School of Physics and Engineering, Zhengzhou University, Henan.. International Laboratory for Quantum