智慧電網中以戶為單位之用電特徵分析

全文

(1)國立臺灣師範大學資訊工程研究所. 智慧電網中以戶為單位之用電特徵分析 An Analysis of Household Electricity Meter Data in Smart Grid Systems. 研究生：. 指導教授：. 郭千瑜. 陳伶志博士. 中華民國 102 年 7 月.

(2) 誌謝在這研究完成時，我最想感謝我的媽媽。謝謝妳，總是默默地在我身後支持我，沒有你就沒有今天的我。本研究可以順利完成，首先要感謝陳伶志教授，總是細心地教導我，並且給我非常多寶貴的建議。好的教授會給學生一根魚竿，而不是只給學生幾條魚，謝謝老師送給我如此珍貴人生經驗，這兩年我已成長茁壯了不少。感謝賀耀華教授，耐心地指導我、鼓勵我，並協助我完成這研究。謝謝戴敏育教授，百忙之中抽空前來聆聽我的發表，對於我因缺乏經驗而犯的錯誤，老師總是耐心的指正，除了教導我研究上的方法與建議外，也讓我更了解科學研究的精神。感謝李旺謙教授，提點我研究的方向和方法，讓我從中學習到許多事物。我要感謝所有學長、同學和學弟們，感謝你們這些同甘共苦的朋友們。第一個要感謝我的好夥伴如岑，這段日子有你真好，我會記得我們一起走過的那些路。感謝胡禎、御瑋、如岑，在最困難的時候，不吝嗇伸出你們的援手，為我分憂解勞，包容我、陪著我度過了最低潮的時候。感謝威賢學長、凱程、昱任、善和、辰叡陪伴我走過了一年，在這短短的相處時間中，給了我很多幫助。因為有你們，所以我才能順利完成這篇論文，我的研究生涯即將結束，謝謝你們。. i.

(3) 摘要智慧電網及智慧型電表建置在全球快速發展，在台灣已有特定地區裝設智慧型電網，透過智慧型電表蒐集用戶電表量測資料。消費者的用電習慣各有不同，而影響消費者的用電習慣有許多因素，本研究將會針對溫度、樓層等因素作用電量分析，使消費者不但可以瞭解自身的用電習慣，並加以調整，以減少電費支出，還可節省電能消耗。除了電量分析外，預測用電量也可幫助電力業者適時調整發電量，改善浪費電力能源之現象。本研究使用三種用電預測方法，分別為回看法 (ε-LookBack-N )、差分整合自回歸移動平均模型 (Autoregressive Integrated Moving Average Model) 和支持向量回歸 (Support Vector Regression)，我們將評估其適用性與準確度，並透過用電戶的用電特徵分群，進一步結合環境變因，研究用電戶用電度數的預測模型，並利用既有量測資料進行驗證。其預測模型可以幫助電力業者作用電預測，適時調整發電量，有效率的配送電能，以達到節能省碳之目的。. 關鍵字：智慧型電表 (Smart Meter Data)、資料分析 (Data Analysis)、分群演算法 (Clustering)、回看法 (ε-LookBack-N )、支持向量回歸 (Support Vector Regression) ii.

(4) 目錄誌謝 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. i. 摘要 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ii. 第一章. 緒論 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1. 第二章. 電表資料描述 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3. 第三章. 多樣性分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5. 第一節. 用電量基本分析. . . . . . . . . . . . . . . . . . . . . . . . . 6. 第二節. 依樓層分析用電量 . . . . . . . . . . . . . . . . . . . . . . . 8. 第三節. 依溫度分析用電量 . . . . . . . . . . . . . . . . . . . . . . . 11. 第四節. 依溫度與樓層分析用電量 . . . . . . . . . . . . . . . . . . 13. 第五節. 依假日分析用電量 . . . . . . . . . . . . . . . . . . . . . . . 15. 第四章. 用電戶分群. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16. 第一節. 分群演算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16. 第二節. 分群效度指標 . . . . . . . . . . . . . . . . . . . . . . . . . . 20. 第三節. 文化基因演算法. . . . . . . . . . . . . . . . . . . . . . . . . 23. 第五章. 用電戶用電預測方法 . . . . . . . . . . . . . . . . . . . . . . . . . . 26. 第一節. ε-LookBack-N . . . . . . . . . . . . . . . . . . . . . . . . . . 26. 第二節. ARIMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28. 第三節. SVR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 iii.

(5) 第六章. 預測結果 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33. 第七章. 相關文獻 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39. 第八章. 結論與未來展望 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42. 參考文獻 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 附錄 A 多樣性分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 附錄 B SVR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60. iv.

(6) 圖目錄圖1. 電表用電量頻率圖 (a) 動態用電量 (b) 基本用電量 . . . . . . . . .. 圖2. 用戶每日平均用電度數之累計分配函數圖 . . . . . . . . . . 6. 圖3. 樓層與基本用電量關係圖 . . . . . . . . . . . . . . . . . . . . . . 8. 圖4. 各樓層用戶平均用電量分析圖 . . . . . . . . . . . . . . . . . . . 9. 圖5. 每 15 分鐘平均用電量分析圖 (a) 六月 (b) 七月 (c) 八月. 5. (d) 九月 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 圖6. 每日平均用電量與每日溫度關係圖 . . . . . . . . . . . . . . . 11. 圖7. 每 15 分鐘平均用電量與每 15 分鐘平均溫度分析圖 . . . 12. 圖8. 樓層每日平均用電量與每日平均溫度關係圖 (a) 1 樓至. 5 樓 (b) 6 樓至 10 樓 (c) 11 樓以上. . . . . . . . . . . . . . . . . . . . . . . . . 13. 圖9. 各樓層用電戶每 15 分鐘平均用電量與溫度關係圖 . . . . 14. 圖 10. 每日平均用電量與星期之關係圖 . . . . . . . . . . . . . . . . . 15. 圖 11. 動態時間扭曲距離 . . . . . . . . . . . . . . . . . . . . . . . . . . . 19. 圖 12. 文化基因演算法的執行流程圖 . . . . . . . . . . . . . . . . . . . 23. 圖 13. 支援向量回歸示意圖 . . . . . . . . . . . . . . . . . . . . . . . . . . 32. 圖 14. 斯洛伐克總用電量測資料圖 (擷取自 [6]) . . . . . . . . . . . 39. 圖 15. PFEM 模型架構圖 (擷取自 [24]) . . . . . . . . . . . . . . . . . 41 v.

(7) 圖 16. 電錶使用度數頻率圖 . . . . . . . . . . . . . . . . . . . . . . . . . . 49. 圖 17. 用電戶每日平均用電度數之累計分配函數圖. . . . . . . . . 50. 圖 18. 各樓層用電戶平均用電圖 . . . . . . . . . . . . . . . . . . . . . . 51. 圖 19. 每 15 分鐘平均用電量分析圖 (a) 一月 (b) 二月 (c) 四月. (d) 五月 (e) 六月 (f) 七月 (g) 八月 (h) 九月 (i) 十月 (j) 十一月 (k) 十二月 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52. 圖 20. 每日溫度與用電量關係圖 . . . . . . . . . . . . . . . . . . . . . . 54. 圖 21. 2011 年四月至十一月每日平均溫度與用電量關係圖 . . . 55. 圖 23. 每日平均溫度與用電量關係圖 (a) 十二月 (b) 一月 (c). 二月 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56. 圖 22. 2010/12 至 2011/2、2011/12 每日平均溫度與用電量. 關係圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 圖 24. 每日平均用電量與每日溫度 20 度以上的關係圖 (a) 1. 樓至 5 樓 (b) 6 樓至 10 樓 (c) 11 樓至 16 樓 . . . . . . . . . . . . . . . . . . . 58. 圖 25. 每日平均用電量與每日溫度 20 度以下的關係圖 (a) 1. 樓至 5 樓 (b) 6 樓至 10 樓 (c) 11 樓至 16 樓 . . . . . . . . . . . . . . . . . . . 59. vi.

(8) 表目錄表1. 用戶位於樓層分布表 . . . . . . . . . . . . . . . . . . . . . . . . . . 3. 表2. 電表樓層分布表 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8. 表3. ε-LookBack-N 之 ε 比較 MAPE 表 . . . . . . . . . . . . . . . 33. 表4. PBM 分群效度指標之分群數表 . . . . . . . . . . . . . . . . . . 33. 表5. DB 分群效度指標之分群數表 . . . . . . . . . . . . . . . . . . . 33. 表6. 各預測方法比較表 . . . . . . . . . . . . . . . . . . . . . . . . . . . 34. 表7. 支持向量回歸 MAPE50%(分群資料正規化，PBM 分. 群標準) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 表8. 支持向量回歸 MAPE50%(分群資料正規化，DB 分群. 標準) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 表9. 支持向量回歸 MAPE80%(分群資料正規化，PBM 分. 群標準) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 表 10. 支持向量回歸 MAPE80%(分群資料正規化，DB 分群. 標準) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 表 11. 支持向量回歸 MAPE50%(分群資料未正規化，PBM. 分群標準) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 表 12. 支持向量回歸 MAPE50%(分群資料未正規化，DB 分. 群標準) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 vii.

(9) 表 13. 支持向量回歸 MAPE80%(分群資料未正規化，PBM. 分群標準) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 表 14. 支持向量回歸 MAPE80%(分群資料未正規化，DB 分. 群標準) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 表 15. 每月資料電表數統計表 . . . . . . . . . . . . . . . . . . . . . . . . 48. viii.

(10) 第一章. 緒論. 由台灣電力公司 [2] 網站可得知臺灣電力系統由大型核能、水力、火力三種能源生產電力，系統主要分成北、中、南三個區域。電能不能儲存備用，所以用電與供電需相當，若某區域電力求過於供時，須從其他區域透過電網輸電線配送電力支援。以 101 年北部地區用電為例，電力供應占全系統 34%，但用電量卻占全國 40% 以上，須向其他區域請求電力支援，從中、南部將電力送往北部，但電力在傳送過程中，部分電力將由電能轉變成熱能，散發至空氣中，導致電能損失。在 2012 年，政府推行油電價格合理化政策，由於電力供應吃緊，造成油電雙漲，引起民眾恐慌，面對能源價格不斷上升的情況下，減少能源消耗及避免資源浪費為現今最大的議題之一。自 2008 年開始，隨著智慧電網觀念的興起，全球電業開始大量布建智慧型電表，而電表資訊管理系統 (Meter Data Management System, MDMS) 便成為目前最受歡迎的研究議題。智慧型電表不同於以往過去的電表，智慧型電表不需要人力抄表，透過智慧電網，將電表量測到的用電資料回傳至電表資訊管理系統作紀錄，如此將可以省下人力費用。電力供應業者可透過電表資訊管理系統得到高精細度的用戶用電紀錄，透過詳細的用電量資料分析，可以協助電力業者制定不同時間不同電力價格的制度，並且適時的調整發電量，使配送電力更有效率，減少電力消耗，不僅可以節省成本支出，還可減少建置發電廠，達到節能省碳、有效利用資源的目的。根據國外使用智慧型電表作測試研究，提供即時的電力資訊給消費者參考，會影響消費者的用電行為與習慣，約可節省 4% 至 12% 的電力能源。因此，除了電力業者可有效節省成本外，消費者可以透過精細的量測資料，了解自身的用電狀況，調整用電習慣，不僅達到節約能源的目的，還可減少電費支出。由此可. 1.

(11) 知，建置智慧型電表會直接影響民眾的用電習慣，若搭配不同時間電價不同的計費制度實施，選擇對的時段使用電力能源，將會讓消費者節省更多電費支出。因應全球在智慧電網及智慧型電表建置的快速發展，台灣在近幾年已有某些地區安裝智慧型電表，並且收集量測資料，我們希望將台灣目前智慧電表測試計畫所收集到的量測資料作分析，透過量測資料與不同的變因作不同的分析，以了解目前消費者使用電量的情況。而變因有許多種，例如：溫度、濕度、用戶所在樓層、在家人口數、用戶型態等等，有許多因素會影響用電量的變動。本研究目的為用電戶的用電行為特徵分析，並依據用電戶用電行為的不同作用電戶分群。一般文獻中，用電資料通常是計算總用電量或特定用戶 (如：公家單位、工廠等) 的用電量，且資料來源皆是國外。在本研究中，資料與其他文獻不同的是，用電資料來源為台灣一般用戶，且用電資料包含用電戶樓層。溫度為用電變因，除了分析溫度與用電量的關係外，本文獻將會針對樓層的不同，探討用電量的變化，並且分析溫度和用戶所在樓層與用電量間的關係。上述的電表資料分析，可以讓消費者本身了解自身的用電習慣，並作自身用電調整，不僅可以減少電費支出，更可以節省能源消耗。除了讓消費者本身調整用電習慣，節省用電量外，預測用電戶用電量也可以幫助電力公司提供更好的用電效能。本研究將使用三種用電預測方法，分別為回看法 (ε-LookBack-N )、差分整合自回歸移動平均模型 (Autoregressive Integrated Moving Average Model) 和支持向量回歸 (Support Vector Regression)，並評估其適用性與準確度。在支持向量回歸部分，我們將透過用電戶的用電特徵分群，進一步結合環境變因，研究用電戶用電度數的預測模型，並利用既有量測資料進行驗證。其預測模型可以幫助電力業者作用電預測，適時調整發電量，有效率的配送電能，以達到節能省碳之目的。. 2.

(12) 第二章. 電表資料描述. 這幾年在政府的規劃下，在新竹與台北兩個地方的某些區域內，開始安裝智慧型電表，並蒐集用戶用電資訊。本實驗使用電力公司提供的智慧型電表用電資料，得到的用戶資料包含用戶電表號碼、智慧型電表的編號、用戶電號、用戶區域、用戶地址、用電度數。智慧型電表每 15 分鐘記錄一筆用電度數，並將電表度數回傳至電力公司作紀錄，每戶用戶一天有 96 筆紀錄，從 2010 年 11 月 1 號紀錄至今。由於用電資料在傳輸過程中，因為資料量過大，以至於有部分用電資料遺失，我們將智慧型電表測試計畫所收集到的量測資料加以整理後，有紀錄的用戶共 775 戶。由電力公司取得的用電紀錄，有大量的資料遺失，考慮到研究的準確度，本研究挑選資料較完整的 59 戶，時間為 2011 年 6 月 1 日至 2011 年 9 月 30 日，每顆電表遺失資料數皆小於 96 筆，即遺失小於一天之用電資料。表1為用戶位於樓層分布表，由表1可以觀察出用戶大多聚集在二樓至六樓，十樓以上的用戶較少，最高樓層為 16 樓。. 樓層 1 電表數量 3. 2 6. 3 9. 表 1: 用戶位於樓層分布表 4 5 6 7 8 9 10 11 12 8 8 8 6 2 2 1 1 1. 13 1. 14 1. 15 1. 16 1. 電力公司記錄用電項目為用戶電表號碼、時間與用電度數，用電度數與家中電器用品多寡有關，即使無人在家，沒有額外的使用電能，但還是有基本輸出的電力，例如：電冰箱、電熱水瓶等等。除此之外，雖然有許多電器用品未被開啟使用，但電器用品的插頭插在插座上，就需消耗些微的電能，這些基本的電力輸出，稱為基本用電量。當家中有人時，除了原本就需使用電能的電器用品外，需要額外使用電力的用電量，本研究稱之為動態用電量，例如: 電燈、電扇、電 3.

(13) 腦、電視等等，意即扣除基本用電量以外之用電量。. P ostLoad(P ) = BasicLoad(B) + DynamicLoad(D). (1). P 為某用電戶之 15 分鐘用電量，B 為該用電戶之 15 分鐘基本用電量，D 代表在該 15 分鐘內之動態用電量。用電戶基本用量之計算，如公式2所示。. BasicLoad = M in{V15 ,. V60 }, ∀ V15 > 0, V60 ≥ 0 4. (2). 在用電戶之歷史用電量中 (時間為 2011 年 6 月至 9 月)，每 15 分鐘之最小用電量 (0 除外) 與每小時用電量除四之最小用電量間，取最小用電量為該用電戶基本用電量。因為本研究資料允許每顆電表有小部分資料遺失，為避免 0 為用電資料過小造成的溢位 (overflow)，所以取每小時用電量除以四作為平均 15 分鐘用電量，但若遇到一小時內有兩筆用電資料為 0，則假設該電表資料遺失，該筆資料不納入計算中。每一用電戶家庭裡的電器用品皆不盡相同，基本用電度數各有差異，本研究將會使用動態用電量作用電戶之用電分析，以避免每一用電戶基本用電量的不同，造成分析上的誤差。. 4.

(14) 第三章. 多樣性分析. 此章節中，我們將針對台灣目前智慧型電表測試計畫所收集到的量測資料作多樣性分析，一方面將套用既有的國外研究成果，且套用佈建地區之時空環境因素，探究量測資料之各項顯性與隱藏特性；同時，相較於傳統研究方法，往往以電力供應業者角度進行資料分析，本計劃將嘗試以用戶端立場，探究如何透過資料分析，引導用戶端體認自身用電狀況，並透過自我調整與監控，減少電力浪費，進而達成節電之目標。每個人的生活作息不同，用電習慣也不同，再加上有很多因素會改變人們的用電習慣，進而影響用戶的用電量，導致消費者的用電資料大不相同。許多研究發現，氣象變化與用電量息息相關，氣候資料包含溫度、濕度、光照時間還有較特殊的氣候，像是颱風等等，在此我們將會分析溫度與用電量的關係。除了氣候會影響用電量外，本研究會探討用戶樓層與用電量的相關性、假日與用電量的相關性等等。附錄 A(頁48) 將介紹有包含更多電表的多樣性分析。. 圖 1: 電表用電量頻率圖 (a) 動態用電量 (b)基本用電量. 5.

(15) 第一節. 用電量基本分析. 智慧型電表每 15 分鐘記錄一筆用電度數，並將電表度數回傳至電力公司作紀錄，我們將 15 分鐘的用電量資料做頻率的統計，如圖1(a) 所示。智慧型電表每 15 分鐘記錄一筆用電度數，並將電表度數回傳至電力公司作紀錄，我們將 15 分鐘的用電量資料做頻率的統計，如圖1(a) 所示。經過統計後發現，用戶在 15 分鐘內使用的用電量為 0 度到 4.3 度。由圖1(a) 可以發現，每 15 分鐘的用電量大部分皆不超過 1 度，使用 0.1 度以內的頻率高達三十三萬多次，用電量 0.1 度到 0.2 度的頻率降到了十二萬多次，呈銳減的狀態。超過 1 度的用電量頻率較小，最高用電量達 4.3 度，但 1 度以上到 4.3 度的頻率皆不到一萬次。圖1(b) 為電表基本用電量頻率圖，大多數電表基本用電量小於 0.01 度，超過 1 度之電表較少。. 圖 2: 用戶每日平均用電度數之累計分配函數圖. 圖2 為用戶 2011 年 6 月到 2011 年 9 月的每日用電度數平均累積分配函數圖。由此圖可發現，用戶平均用電量，在 0 度到 30 度左右快速攀升，在此區間內，CDF(cumulative distribution function) 由 0% 上升至 90% 左右，代表有 6.

(16) 90% 的用戶在 6 月至 9 月裡每日的平均用電量大約在 0 度到 30 度之間。每日用電量高於 30 度後，CDF 上升的速度漸緩，大約有 10% 的用戶每日平均用電量大於 30 度。經過統計後發現，用戶每日平均最高用電量約為 137 度，每日平均最低用電量約為 1 度。. 7.

(17) 第二節. 依樓層分析用電量. 從樓層不同做用電量的分析，本研究資料的用戶分布樓層為一樓至十六樓。圖3為各樓層與基本用電量關係圖，從圖中可發現樓層與基本用電量並無太大關係，其基本用電量應與用電戶家中有多少電器用品有關。本研究實際調查發現，在 2 樓與 7 樓有公司行號進駐，所以基本用電量較其他樓層高，因此基本用電量與樓層的關係會隨著資料的不同而有所變化。. 圖 3: 樓層與基本用電量關係圖. 本研究將用戶樓層分為三種，分別為低樓層、中樓層與高樓層，低樓層為一樓至五樓，中樓層為六樓至十樓，十一樓以上為高樓，從表2可看出低樓層用戶數量較其他樓層多。表 2: 電表樓層分布表樓層電表數量低 34 中 19 高 6 8.

(18) 圖 4: 各樓層用戶平均用電量分析圖圖4為各樓層用戶平均用電量分析圖，本研究將 1 樓至 5 樓歸類於低樓層， 6 樓至 10 樓為中樓層，11 樓以上為高樓層。由圖4可觀察出位於 11 樓以上的高樓層用戶在六月至九月期間，用電量較其他樓層用戶高，在 10 樓以下的中低樓層用戶用電量較無明顯差別。圖5為一天 24 小時的平均用電，以日為單位，檢視每日不同時段的用電量。由圖 4 可以觀察出在六月到九月期間，早上九點過後至下午一點的時段，低樓層用電較其他樓層高，下午時段中樓層用電量較低於其他樓層。高樓層用電量在晚上高於其他樓層許多，夜間用電量差距更是明顯。相較於高樓層，低樓層在夜間用電量低於中高樓層，平均用電量小於 0.2 度。. 9.

(19) (a). (b). (c). (d). 圖 5: 每 15 分鐘平均用電量分析圖 (a) 六月 (b) 七月 (c) 八月 (d) 九月. 10.

(20) 第三節. 依溫度分析用電量. 本節將從溫度的不同分析用電量，圖6為 2011 年 6 月到 2011 年 9 月的每日平均用電量與每日溫度關係圖：. 圖 6: 每日平均用電量與每日溫度關係圖. 每日溫度與每日平均用電量呈相關係數為 0.824818，為高度正相關。當溫度愈高，用電量攀升愈迅速，推測應該是當氣溫升高後，消費者開始開啟冷氣機等耗電量較大的降溫電器用品，當溫度降低到較舒適的氣溫後，消費者不必開啟耗電量較大的降溫電器用品，用電量才下降。在六月到九月每 15 分鐘平均溫度大約在 27 度至 32 度間，中午氣溫最高，過正午後，氣溫緩緩下降，直到隔天早上六點，此時為氣溫最低的時刻。由於用電資料之使用者為一般大眾用戶，須按照工作時間上下班，從圖7可看出在晚上六點過後用電量開始驟升，此時應為使用者下班回家後，開啟多個電器用品所導致；在十點之後，用電量開始下降，此時應為使用者平均就寢時間。每 15 分鐘平均用電量與每 15 分鐘平均溫度相關係數為 0.512016，從每 15 分鐘平均用電 11.

(21) 圖 7: 每 15 分鐘平均用電量與每 15 分鐘平均溫度分析圖量的角度觀察與溫度的關係可以發現，每 15 分鐘的平均用電量與消費者的作息有較大的關係，與溫度呈中度正相關。而每日平均用電量與每日平均溫度呈高度正相關，是因為每日平均用電量為累計一日的用電量，消費者的用電行為將被加總的用電量抵銷。當每日平均溫度愈高，消費者則會開啟愈多降溫電器用品 (如：冷氣、電風扇等)，使用電量與溫度呈高度正相關。. 12.

(22) 第四節. 依溫度與樓層分析用電量. 本節將從溫度與樓層的不同分析用電戶之用電量，依照不同的樓層，各別分析溫度與用電量的關係，圖8為樓層每日平均用電量與每日平均溫度關係圖：. (a). (b). (c). 圖 8: 樓層每日平均用電量與每日平均溫度關係圖 (a) 1 樓至 5 樓 (b) 6 樓至 10 樓 (c) 11 樓以上圖8(a) 為低樓層平均用電量與每日平均溫度的關係圖，相關係數為 0.782564，屬於高度正相關；圖8(b) 為中樓層平均用電量與每日平均溫度的關係圖，相關係數為 0.778426，屬於高度正相關；圖8(c) 為高樓層平均用電量與每日平均溫度的關係圖，相關係數為 0.561422，屬於中度正相關。由圖8可以觀察出，不同樓層的溫度與用電關係，樓層愈低，用電量與溫度的相關係數愈高。從每日用電量角度觀察，高樓層每日平均用電量較其他樓層高，低樓層與中樓層平均用電量會隨著溫度升高而上升。圖9為各樓層用電戶每 15 分鐘平均用電量與溫度關係圖。每日氣溫由早上六點開始上升，直到十三時為全日氣溫最高的時刻，下午一點過後氣溫開始下降，至隔日早上六點。圖中，紅色線表示一樓至五樓平均用電量，綠色線代表六樓至十樓平均用電量，藍色線表示十一樓以上平均用電量。從圖9中可以觀察出，溫度並不與用電量呈正比，本研究資料使用者大多為一般大眾用戶，上班時間約為早上八點至下午五點或六點，雖然中午溫度最高，但上班時間不在家，所以用 13.

(23) 圖 9: 各樓層用電戶每 15 分鐘平均用電量與溫度關係圖電量並未因溫度升高而明顯增加。白天地面吸熱快，導致低樓層溫度較高，用電量也較其他樓層高，高樓層因為直接受到太陽曝曬，所以溫度比中樓層高，用電量也較中樓層多。晚上因為空氣熱對流原理，熱空氣往上升，冷空氣往下降，高樓層溫度較中低樓層高，所以高樓層用電量較其他樓層高。. 14.

(24) 第五節. 依假日分析用電量. 本節將用電量測資料作周期為一星期的分析，探討平日與假日用電量的不同，下圖為用電資料作周期為一星期的分析圖：. 圖 10: 每日平均用電量與星期之關係圖. 從圖中可以發現，平日平均用電量比假日平均用電量高，其中又以星期一用電量最高；假日部分，星期六的用電量比星期日用電量高一些。從整個星期角度觀察，星期日用電量最低，星期一用電量最高。. 15.

(25) 第四章. 用電戶分群. 本研究的電表資料相較於其他文獻中的電表，電表數較多、資料量因此較大，若每一用電戶各建立一個預測模型，將會造成計算上的負擔，所以本研究作用電戶分群，用電習慣相似的分為同一群，每群建立一個預測模型，以減少大量計算。考慮到消費者的用電行為與習慣各有所異，我們將針對用電戶的用電行為特徵作分群，將有相同用電行為特徵的用電戶歸為同一群，建立用電預測模型，以幫助預測用電量消耗，增加電表預測準確性。. 第一節. 分群演算法. 分群演算法是一種將資料分類成群的方法，主要目的是在資料中找出資料相似的幾個群聚，並找出每個群聚的中心點。在本研究中，一筆用電量即代表一筆時間序列資料，我們針對每筆時間序列資料作分群 [16, 27]。在 [16] 中提到，可以將時間序列資料分成三種型態，分別是：raw-data-based、feature-based、 model-based。raw-data-based 是直接將時間序列資料作分群演算法，找出每個群聚與每群的中心點；feature-based 是先將時間序列資料取特徵，利用特徵作分群演算法，找出每個群聚與每群的中心點；model-based 是分成兩種方法，一種是利用混合相關概率分佈，作基礎概率分佈的混和，依照最後得出的模型參數作分群，另一種方法則是先設定一組模型，依照模型係數或剩餘殘差作分群演算法，找出每個群聚與每群的中心點。本研究使用 feature-based 方法作分群，先將消費者的用電量取週期為一日之季節指數，並將每一用電戶的季節指數做正規化，以利比較用戶間的用電習慣。將每一用電戶的季節指數計算平均與標準差，接著. 16.

(26) 做正規化，用指數 x′i 替代原本的指數 xi ，正規化替代公式：. x′i =. xi − avg(X) std(X). (3). 正規化後的用電戶季節指數作為用電戶用電量特徵，就用電戶用電行為的特徵分類而言，我們使用下列的分群演算法，並透過真實的智慧電表後端量測資料，細究不同方法之異同、適用性與系統調校方法。茲分述如下： • K-Means [18]：此演算法是由 J. MacQueen 於 1967 年所提出的分群演算法，因觀念簡單、實作容易，所以被廣泛使用。目的是希望每個群聚中，每一點與群中心的距離平方誤差 (square error) 為最小，群聚與群聚之間的距離平方誤差為最大。假設將用戶分成 k 個群組，其中第 c 個群聚可以用集合 Gc 來表示，設 Gc 包含 nc 筆資料 (x1 , x2 , …, xnc )，此群聚中心為 yk ，則該群聚的平方誤差 Ec 可以定義為：. Ec =. ∑. |xi − yc |2. i. 其中 xi 是屬於第 c 群的資料點。其演算法步驟如下： 1. 從資料中，隨機選擇 k 點作為群中心。 2. 將資料點分配至距離群中心最近的群集中，形成 k 群。 3. 每個群集重新計算群內所有資料點的平均值。 4. 反覆步驟 2 與步驟 3，直到各個群中心不再變動為止。. 17. (4).

(27) • K-Medoids [23]：與 K-Means 做法相似，但中心點的選取方式不一樣，因距離計算方式不同，若使用自訂距離執行 K-Means，會導致反覆執行上述步驟 2 與步驟 3，而無法結束其演算法。在 K-Means 中，我們取目前群中所有資料點的平均值作為中心點，而在 K-Medoids 中，我們將取目前群中到所有其他點的距離和為最小的點作為中心點。在 K-Medoids 中，點與點之間的距離，除了可以使用既有的距離方法外，還可以自己定義距離。. 除此之外，我們亦將探討在分群演算法中所使用的測距函數，探討其在電表量測資料應用上之物理意義，以及可能形成的分群結果。本研究使用下列兩種測距函數： • 歐基里德距離 (Euclidean Distance)：將長度為 N 的用戶季節指數看成 N 維空間裡的一點，用戶間的距離就是計算點與點的距離。其中，時間序列 x 與時間序列 y 的距離為 D(x, y)，n 為時間序列的長度，計算公式： v u n u∑ D(x, y) = t (xi − yi )2. (5). i=1. 在用此距離計算方法下，我們使用一般 K-Means 演算法分群。. • 動態時間扭曲距離 (Dynamic Time Warping Distance)：我們考慮到電表量測資料具備時間序列的性質，而用電戶用電行為可能相似，只有些微的偏移，或者用電行為相似但用電時間長度不同，導致規模上的變化，因此，除了使用傳統的歐基里德距離外，本研究將使用動態時間扭曲，研究其在電表量測資料分析上之適用性，以及真實物理意義。其做法如圖11。在兩個時間序列中，任一時間點上會有兩個點，這兩個點各別向左右尋找 18.

(28) 圖 11: 動態時間扭曲距離離他們最近的對方序列點，如圖 11所示。若找不到序列點，代表此點已為最高點或最低點，所以將這點與對方序列點的距離設為整個序列的長度 (亦為 96)。所以我們將會找到兩段距離 (有兩個點各別向兩邊尋找)，因此在這個時間點上的兩個時間序列距離，我們有兩種作法： – 最短相似距離：兩段距離取最短的距離當作兩個時間序列點的距離。 – 平均相似距離：兩段距離計算平均當作兩個時間序列點的距離。在此距離計算方法之下，因為使用 K-Means 分群演算法會陷入無窮迴圈中，所以我們使用 K-Medoids 演算法來作分群。. 19.

(29) 第二節. 分群效度指標. 本研究將透過真實智慧電表後端量測資料的使用，評估不同測距函數與不同分群演算法搭配下的分群能力，並透過不同的分群效度指標 (Cluster Validity Index) ，尋找最佳的分群數。分群效度指標是用來評估分群結果的優劣，在分群時，無論是何種分群演算法，都需先決定分群數 k。評估的準則大約分為下列兩個要點： • 緊密度：群內資料與資料間特性的相似程度。 • 分散度：群與群之間特性的差異度。一個好的分群結果，群內資料與資料間特性的相似度愈高愈好，群與群之間特性的差異度愈大愈好。在分群數未知的情況下，分群效度指標提供了分群準則，本研究將利用分群效度指標找出最適當的分群數進行研究與分析。以下將介紹兩種常見的分群效度指標： • Dunn’s Index [8]：在 1973 年 J.C. Dunn 提出 Dunn’s Index，目的是計算分群結果的緊密度與分散度，用以判斷分群的優劣，分群效果愈好，其 Dunn’s Index 的計算結果就會愈大。其計算方法如公式6。 { DI = min. 1≤i≤nc. { min. 1≤j≤nc,i̸=j. minx∈Ci ,y∈Cj {d(x, y)} max1≤k≤nc {maxx,y∈Ck {d(x, y)}}. }} (6). 其中 nc 為分群數，Ci 代表群集 i，d(x, y) 為時間序列資料 x 到時間序列資料 y 的距離。 • Davies-Bouldin Index [7]：簡稱 DB Index，此分群效度指標是由 D.L. Davies 與 D.W. Bouldin 於 1979 年所提出，其方法為計算群內之緊密度與群間分. 20.

(30) 散度的比值。當群集中資料彼此間的相似度愈大，群集間彼此相異程度愈小，代表分群效果愈佳，其 DB Index 的計算結果就會愈小。其計算方法如公式7與公式8。 1 ∑ DB = Ri nc i=1 nc. Ri = max j,i̸=j. (Si + Sj ) dij. (7). (8). 其中 nc 為分群數，Si 為群集 i 內資料彼此間的平均距離，dij 為群集 i 與群集 j 資料彼此間的平均距離。. • PBM Index [21]：PBM Index 是由 Malay K. Pakhira, Sanghamitra Bandyopadhyay 和 Ujjwal Maulik 在 2004 年所提出，其目的在於計算評估分群結果是否有良好的緊密度與適當的分散度，PBM Index 愈大，代表分群結果愈好。計算方法如公式9。. 2 1 E1 P BM (k) = ( × × Dk ) k Ek. (9). 其中 k 為分群數，Ek 為 k 個群集內資料到群中心距離和的總和，Dk 代表兩最遠群集間的距離 (即計算兩群中心的距離)。由上述介紹可以發現，Dunn’s Index 是計算資料間的最大或最小距離，若群集中有較大或較小的異常值，將會影響最後分群結果，使結果有大量誤差，最後得到不良的分群結果。DB Index 的分散度與緊密度皆是計算資料彼此間的平均距離，此種計算方式較為公正，若有異常值，則會因為計算平均而抵銷。PBM Index 的緊密度是計算資料到群中心的距離和，此種做法可以計算出每個群集的密度，密度愈大，距離和愈小；密度愈小，距離和愈大。分散度是計算兩最遠群. 21.

(31) 中心的距離，當距離愈遠，代表群集愈分散。由於用電資料會有突然升高的用電量，且用電戶之用電量擁有相似的週期，將會導致 Dunn’s Index 不準確，在此研究資料型態中，我們將使用 DB Index 和 PBM Index 作為分群標準，引進不同的分群模型，進行用電戶用電行為分群，尋找最佳的分群數，謀求最具代表性的用電戶特徵行為分群。. 22.

(32) 第三節. 文化基因演算法. 在本研究中，將用戶電表作分群，用電量相近的分為一群，但無法直接判斷分群數多寡，分群效度指標讓分群數的判定有標準。我們將不同的分群數，各執行數次，每次皆計算分群結果之分群效度指標，並將其取平均作為該分群數之分群效度指標。在每次執行分群演算法時，初始群中心皆是隨機挑選，若執行分群後，得到較好的分群結果，為避免分群效度指標在作平均時，被其他較差指標抵銷，所以我們使用文化基因演算法（Memetic Algorithm），使分群演算法可以得到較好的結果，以利尋找最佳分群數。最後，依照每個分群數之分群效度指標的不同，找出最佳分群數，作為本研究用電戶分群之分群數。文化基因演算法是結合了基因演算法（Genetic Algorithm）以及區域搜尋（Local Search）的演算法，讓每組解有機會找到區域最佳解，可以使下一代有較好的基因而產生較好的解。本研究的文化基因演算法結構如圖12所示：. 圖 12: 文化基因演算法的執行流程圖. 23.

(33) 執行分群演算法後得到的分群結果將會對用電預測有很大的影響，本研究利用文化基因演算法，求得較佳的分群演算法結果，其設定及流程說明如下： • 初始解族群 (Initial Population)：隨機產生數組群中心作為初始解族群，本研究設定初始解族群為 10 組，每一組解包含 K 個群中心。 • 區域搜尋 (Local Search)：本研究使用下列三種分群演算法來尋找每組解之區域最佳解： I K-Means 演算法：使用歐基里德距離。 II K-Medoids 演算法：使用動態時間扭曲之平均距離。 III K-Medoids 演算法：使用動態時間扭曲之最短距離。 • 計算適應函數 (Evalution)：計算每組解的分群效度指標，本研究之分群效度指標使用下列三種： I Davies-Bouldin Index：其值愈小，分群結果愈佳。 II Dunn’s Index：其值愈大，分群結果愈佳。 III PBM Index：其值愈大，分群結果愈佳。 • 選擇 (Mating Selection)：本研究使用競爭式選擇法 (Tournament Selection)，作法為隨機挑選四個解，接著兩兩做比較，根據計算適應函數的結果 (即分群效度指標) 來選擇用於交配的親代，最後選出兩個最佳的解作為親代。 • 交配 (Reproduction)：由兩個親代利用 one-point order crossover 來做交配產生子代，沒有使用突變。 • 產生新族群 (Environmental Selection)：在親代及子代中尋找分群效度指標較好的十組解，作為下個世代的初始族群。 24.

(34) • 是否符合停止條件 (Stop Criteria)：如果演化到達某固定世代數，則停止演化，若未達到則繼續進行演化。本研究中我們演化到達 500 世代數後停止演化，若未達到則繼續進行演化。 • 最後解族群 (Final Population)：從最後剩下的解族群，選出最好的解作為最佳解。. 25.

(35) 第五章. 用電戶用電預測方法. 在此章節中，將介紹用電戶用電預測採用的三種預測方法，分別為回看法 (ε-LookBack-N )、差分整合自回歸移動平均模型 (Autoregressive Integrated Moving Average Model) 和支持向量回歸 (Support Vector Regression)，並評估在本研究資料中的適用性與準確度。在 Support Vector Regression 部分，我們將透過用電戶的用電特徵分群，進一步結合環境變因，研究用電戶用電度數的預測模型，並利用既有量測資料進行驗證。其預測模型可以幫助電力業者作用電預測，適時調整發電量，有效率的配送電能，以達到節能省碳之目的。. 第一節. ε-LookBack-N. LookBack-N 方法 [5] 適用時機是在紀錄電表資訊時，偵測出該筆資料為異常的缺失狀況，此演算法可利用目前系統內僅有的過去歷史資訊作為計算參數的對象，達到立即修復彌補電錶值，亦可評估未來使用電量之預測。在 LookBack-N 方法中，用電狀態須完全符合才可使用，但在本研究資料中，無法找出完全吻合的用電值，所以本研究將基於此方法延伸出 ε-LookBack-N 方法，此方法可有彈性的改變用電狀態符合程度。當電表編號 u 在時間 t 時發生資料缺失狀況，系統將會以時間點 t 為基準， u 往過去取 N 個電表，紀錄值用 vt−N 表示，作為用電戶的過去用電情況。接著， u 將其他用電戶的歷史電表資料與 vt−N 進行一連串的追溯比對運算，分析其他用 u 電戶之歷史用電紀錄是否與 vt−N 相同，一旦有歷史紀錄與缺失前的用電狀態吻. 合，我們取得該用電戶的在相同用電狀況之下一筆用電紀錄值作為我們的候選值，經過大量的比對篩選後，計算候選值的機率分佈並建造模型。但由於每日用電量無吻合情況，本研究加入變數 ε，允許其他用電戶的用. 26.

(36) u 電值與 vt−N 有 ε 的誤差 (原本 LookBack-N 方法的 ε 為 0)，若還是無法找到符. 合的用電資料，則沿用前一筆用電值作為下一筆用電紀錄值。最後，系統將會產生出一個隨機值 (Uniform Random)，依據輪盤法則 (Roulette Wheel Selection)， u 在模型內挑選候選值，其挑選到的候選值加上與 vt−N 的誤差後，作為本研究的 u 預測值，且用電值與 vt−N 誤差愈小被骰中的機率愈大，反之亦然。此做法稱作. ε-LookBack-N，此方法之詳細演算法如下： Algorithm 1 ε-LookBack-N 演算法 1: i ← 電表編號 2: r ← 追溯時間 u i 3: if vt−r = vt−r then 4: Mtu ← vti (候選值). 5: end if 6: if SizeOf(Mtu ) = 0 then u 7: vtu ← vt−1 8: else 9: 計算 Mtu 內機率模型 10: 根據輪盤法則選取模型內候選值 u i 11: vtu ← 候選值 +|vt−N − vt−N | 12: end if. 27.

(37) 第二節. ARIMA. 差分整合自回歸移動平均模型全稱為 Autoregressive Integrated Moving Average Model(ARIMA)，由。ARIMA 模型主要使用歷史資料建立適當的時間序列模型，利用模型預測未來時間序列資料，其中 ARIMA（p，d，q）分成三大部分: 自回歸 (Autoregressive) 模型，p 為自回歸項數；移動平均 (Moving Average) 模型，q 為移動平均項數；差分處理，d 為使之成為平穩序列所做的差分次數（階數）。自回歸模型指每個觀察值 xt 是由過去 p 個值的線性組合，再加上一個隨機誤差值，其 AR(p) 模型表示式如下：. xt = µ + ϕ1 xt−1 + · · · + ϕp xt−p + δt. (10). µ 為常數項，ϕi 為自回歸係數，δt 為隨機誤差值，此隨機誤差值平均數為 0，標準差等於 σ，對於任何 t 其 σ 值皆不變。定義 L 為延遲算子 (Lag operator)，對 xt 來說，過去一個的值為 xt−1 ，即 xt−1 = Lxt ，同理，xt−2 = Lxt−1 = L(Bxt ) = L2 xt ，式10可代換成式11。. xt = µ + (ϕ1 L + · · · + ϕp Lp )xt + δt ⇒ (1 − ϕ1 L − · · · − ϕp Lp )xt = µ + δt ⇒ (1 −. p ∑. (11). ϕi Li )xt = µ + δt. i=1. 移動平均模型指每個觀察值 xt 是由過去 q 個隨機項的加權平均所產生，其. 28.

(38) MA(q) 模型表示式如下：. xt = µ + θ1 δt−1 + · · · + θq δt−q + δt. (12). µ 為常數項，θi 為移動平均係數，δt 為隨機誤差值，此隨機誤差值平均數為 0，標準差等於 σ，對於任何 t 其 σ 值皆不變。代入延遲算子 L 後，可寫成下列公式： xt = µ + (1 + θ1 L1 + · · · + θq Lq )δt q ∑. ⇒ xt = µ + (1 +. (13) θi Li )δt. i=1. 其變異數如下：. V ar[xt ] = V ar[µ + θ1 δt−1 + · · · + θq δt−q + δt ] = σδ2 (1 + θ12 + · · · + θq2 ) =. σδ2 (1. +. q ∑. (14). θi2 ). i=1. 自回歸移動平均模型，簡稱 ARMA(p, q)，該模型為 AR(p) 與 MA(q) 的混合模型，表示式如下所示：. xt = µ + ϕ1 xt−1 + · · · + ϕp xt−p + δt + θ1 δt−1 + · · · + θq δt−q =µ+. p ∑ i=1. ϕi xt−i + δt +. q ∑. (15) θj δt−j. j=1. 在 ARIMA 模型中，時間序列資料必須是恆定、平穩的，但由於多數時間序列資料是非恆定性，所以須先執行差分運算，將時間序列資料化成穩定性，再執行 ARMA 模型，即為 ARIMA 模型。假設差分算子 (difference operator) 為. 29.

(39) ∆xt ，則 ∆xt = xt − xt−1 = (1 − L)xt ，其 ARIMA(p, d, q) 可表示成公式16。. (1 −. p ∑. ϕi Li )(1 − L)d xt = µ + (1 +. i=1. q ∑. θi Li )δt. (16). i=1. 本研究採用軟體 R [1]，這是一個統計軟體，我們將選擇適合的參數進行用電戶用電預測，並作交叉驗證。. 30.

(40) 第三節. SVR. Support Vector Machine(SVM) 為現今最常用在分類或是回歸分析的技術 [26]，它可在 N 維空間中的資料中找到分類平面，將資料分為兩群，當拿到新資料時，可以依照分類平面，將新資料作分類。而本研究之用電量資料屬於時間序列資料，所以使用支持向量回歸 (Support Vector Regression，SVR) [25]，作分類與預測。兩者不同的是，SVM 是找能將資料分成兩類的平面，而 SVR 是找資料分佈的平面。假設有一訓練資料 (training data)(x1 , y1 ), (x2 , y2 ), …, (xm , ym ) ⊂ Rn ，x 表示輸入的特徵值，y 為 x 相對應之回歸值，n 為輸入特徵值的維度。在 ε-SV regression 中，目標是找到一個函數 f (x)，使從訓練資料中得到的 yi ，誤差最多在 ε 以內，且函數 f (x) 盡可能的平坦，也就是忽略在 ε 以內的誤差，但不允許誤差超過 ε，因此 ε 愈小其精確度愈高。. f (x) = wϕ(x) + b with w ∈ Rn , b ∈ R. (17). 其中 ϕ 為非線性映射，將特徵值 x 映射至高維特徵空間，並在高維特徵空間中進行線性回歸。w 代表 f (x) 函數在高維特徵空間的平坦程度，其函數愈平坦預測準確度愈高，我們利用公式18尋找最小 w。. minimize. subject to. 1 ∥w∥2 2     yi − wϕ(x) − b ≤ ε. (18).    wϕ(x) + b − yi ≤ ε. 這是假設所有資料 (xi , yi ) 符合函數 f (x)，誤差皆在 ε 以內的情況，此公式18才. 31.

(41) 可行。. 圖 13: 支援向量回歸示意圖. 然而，有時候可能無法符合此情況，資料誤差可能大於 ε，所以引入鬆弛變量 (slack variables)ξi , ξi∗ ，以容許資料的誤差，如圖13，否則公式18不可行。 ∑ 1 ∥w∥2 + C ξi + ξi∗ 2 i=1      yi − wϕ(x) − b ≤ ε + ξi      m. minimize. subject to. (19). wϕ(x) + b − yi ≤ ε + ξi∗          ξi , ξi∗ ≥ 0, i = 1, ...m. C > 0，C 為權衡 f 之平坦程度與大於 ε 偏差總和而定義的變數，當 C 增加時，大於 ε 偏差總和對於平坦程度的重要性也相對增加，如此一來，便可以避免不足或過度 (underfitting or overfitting) 訓練資料。在此計算中，C 與 ε 為自訂變數，需使用者自行選取參數作計算。詳見請參考附錄 B(頁60)。本研究採用 LIBSVM [4]，這是一個 SVM 的 library，我們將選擇適合的參數進行用電戶用電預測，並作交叉驗證。. 32.

(42) 第六章. 預測結果. 本研究資料準確率計算方法使用 Mean absolute percentage error(MAPE)，如公式20所示：.

(43)

(44) n î

(45)

(46) 1 ∑

(47)

(48) Di − D 100 × ×

(49)

(50) n i=1

(51) Di

(52). (20). LookBack-N 方法在本研究資料中，無法找到吻合資料，因此使用 LookBack-N 的延伸方法 ε-LookBack-N ，ε 為允許資料的誤差範圍，表3為不同的 ε 值所執行的結果。從表3可觀察出，當 ε 為 0.5 時，MAPE 為最低，當 ε 愈大，雖然無吻合資料數降低，但準確率也跟著降低，這可能是因為 ε 愈大，候選值與實際值的誤差也愈大，所以準確率降低。之後的預測結果，將以 ε 為 0.5 作為最佳執行結果。. ε 50% 0.1 36.3 0.5 36.2 1 36.5 5 41.2. 表 3: ε-LookBack-N 之 ε 比較 MAPE 表 80% 無吻合資料數無吻合資料數占所有資料數百分比 48.7 520 7.22% 47.4 63 0.87% 48.3 6 0.08% 58.6 0 0%. 表 4: PBM 分群效度指標之分群數表 Normalized Non-Normalized K-Means 2 2 K-Medoids(Mean) 2 2 K-Medoids(Min) 3 2. 表 5: DB 分群效度指標之分群數表 Normalized Non-Normalized K-Means 10 2 K-Medoids(Mean) 8 2 K-Medoids(Min) 3 2. 33.

(53) 表 6: 各預測方法比較表 MAPE 50% ε-LookBack-N 36.2 ARIMA 模型 28.5 SVR-KMeans 21.8 SVR-KMedoids(Mean) 21.8 SVR-KMedoids(Min) 21.8 SVR-未分群 21.8. 80% 47.4 59.9 37.9 37.7 37.7 37.7. 本研究在 SVR 中使用三種分群演算法、兩種不同分群效度指標，表4與表5分別為分群效度指標為 PBM 之最後分群數表與分群效度指標為 DB 之最後分群數表。表6為三種用電預測方法之 MAPE 比較表，從表中可看出，針對本研究資料，SVR 為最佳的預測方法，SVR 配合 K-Medoids 又比 K-Means 佳，MAPE 平均為 21.8%，其次是 ARIMA，MAPE 為 28.5%，ε-LookBack-N 預測結果較差，MAPE 為 36.2%。透過用電戶的用電特徵分群，結合溫度、樓層、假日三種環境變因，作交叉分析，依照分析溫度、樓層、假日項目順序，T 代表有加入訓練，F 代表不考慮此項變因，以下為支持向量回歸，按照不同的分群標準、不同分群演算法，所建立預測模型的結果。因為少部分預測模型的 MAPE 異常高，若取平均值將會使其他較準確的模型被忽略，所以我們取模型 MAPE 的 50% 與 80% 做參考。在表7與表8中可以觀察出，使用 PBM Index 的分群預測結果較 DB Index 佳。在使用 PBM Index 時，配合 K-Means 分群演算法結果優於 K-Medoids 分群演算法，但使用 DB Index 分群標準時，K-Medoids(Min) 分群演算法明顯較其他兩者佳。在此分群預測結果中可以看出，K-Medoids(Min) 分群演算法雖然使用不同的分群標準，但最後分群結果相同，所以預測結果也相同，這可能是因為在本研究資料中，執行 K-Medoids(Min) 分群法加上文化基因演算法，使最後結果收斂至同一點，導致最後分群結果相同。 34.

(54) 表 7: 支持向量回歸 MAPE50%(分群資料正規化，PBM 分群標準) 分群演算法. FFF. FFT. FTF. FTT. TFF. TFT. TTF. TTT. K-Means. 22.2. 23.0. 25.7. 26.3. 25.2. 28.9. 28.3. 31.8. K-Medoids(Mean). 22.8. 24.9. 25.8. 27.2. 26.1. 28.5. 28.9. 31.6. K-Medoids(Min). 23.6. 25.1. 26.3. 27.1. 27.6. 30.4. 29.4. 31.7. 未分群. 21.8. 22.7. 24.1. 25.4. 25.0. 27.2. 26.6. 30.1. 表 8: 支持向量回歸 MAPE50%(分群資料正規化，DB 分群標準) 分群演算法. FFF. FFT. FTF. FTT. TFF. TFT. TTF. TTT. K-Means. 25.8. 29.8. 30.0. 32.7. 32.3. 35.3. 34.6. 35.0. K-Medoids(Mean). 25.2. 28.8. 28.8. 33.2. 29.3. 32.7. 32.6. 32.9. K-Medoids(Min). 23.6. 25.1. 26.3. 27.1. 27.6. 30.4. 29.4. 31.7. 未分群. 21.8. 22.7. 24.1. 25.4. 25.0. 27.2. 26.6. 30.1. 表 9: 支持向量回歸 MAPE80%(分群資料正規化，PBM 分群標準) 分群演算法. FFF. FFT. FTF. FTT. TFF. TFT. TTF. TTT. K-Means. 41.9. 45.4. 40.6. 48.4. 48.5. 55.6. 49.5. 55.9. K-Medoids(Mean). 38.8. 45.7. 43.3. 51.2. 51.2. 50.4. 53.2. 55.7. K-Medoids(Min). 39.4. 48.0. 45.7. 53.2. 49.2. 54.5. 53.3. 55.2. 未分群. 37.7. 43.2. 42.4. 47.2. 45.1. 46.8. 48.1. 54.6. 35.

(55) 表 10: 支持向量回歸 MAPE80%(分群資料正規化，DB 分群標準) 分群演算法. FFF. FFT. FTF. FTT. TFF. TFT. TTF. TTT. K-Means. 47.3. 58.3. 51.7. 61.6. 58.0. 65.6. 63.1. 65.6. K-Medoids(Mean). 45.3. 55.7. 54.3. 62.9. 50.6. 61.2. 61.7. 65.2. K-Medoids(Min). 39.4. 48.0. 45.7. 53.2. 49.2. 54.5. 53.3. 55.2. 未分群. 37.7. 43.2. 42.4. 47.2. 45.1. 46.8. 48.1. 54.6. 表7、表8、表9和表10為分群資料有正規化的預測結果，從 MAPE80% 表9和表10來看，PBM Index 預測結果更是明顯優於 DB Index，其中又以皆不考慮變因，只考慮過去用電量結果為最佳，影響用電量之環境變因，其重要性順序為樓層 > 假日 > 溫度。表11、表12、表13和表14為分群資料未正規化之用電預測 MAPE 表，換句話說，就是使用電表原始的平均用電量作分群。表11與表12分別為 PBM Index 與 DB Index 的 MAPE50% 預測結果。KMeans 分群演算法在 PBM Index 與 DB Index 不同分群標準情況下，分群結果相同，所以其預測結果也相同。在分群資料未正規化的情況下，使用 PBM Index 分群標準時，K-Medoids(Mean) 演算法與 K-Medoids(Min) 演算法分群結果相同，所以在表11中，兩者 MAPE 相同。整體來說，不論是 PBM Index 或是 DB Index，預測結果 MAPE 只有些微差距，其中又以只考慮過去用電量的預測為最佳。表13和表14可看出，PBM Index 預測結果略優於 DB Index，其中最佳的預測結果是考慮過去電量，若加入環境變因，則 MAPE 下降。. 36.

(56) 表 11: 支持向量回歸 MAPE50%(分群資料未正規化，PBM 分群標準) 分群演算法. FFF. FFT. FTF. FTT. TFF. TFT. TTF. TTT. K-Means. 21.8. 22.5. 24.2. 25.6. 25.1. 27.2. 26.6. 30.4. K-Medoids(Mean). 21.8. 22.6. 24.0. 25.5. 24.9. 27.4. 26.4. 30.9. K-Medoids(Min). 21.8. 22.6. 24.0. 25.5. 24.9. 27.4. 26.4. 30.9. 未分群. 21.8. 22.7. 24.1. 25.4. 25.0. 27.2. 26.6. 30.1. 表 12: 支持向量回歸 MAPE50%(分群資料未正規化，DB 分群標準) 分群演算法. FFF. FFT. FTF. FTT. TFF. TFT. TTF. TTT. K-Means. 21.8. 22.5. 24.2. 25.6. 25.1. 27.2. 26.6. 30.4. K-Medoids(Mean). 22.2. 24.5. 25.2. 27.6. 25.2. 29.1. 28.7. 33.6. K-Medoids(Min). 21.8. 23.6. 23.7. 27.1. 24.4. 30.0. 28.3. 32.4. 未分群. 21.8. 22.7. 24.1. 25.4. 25.0. 27.2. 26.6. 30.1. 表 13: 支持向量回歸 MAPE80%(分群資料未正規化，PBM 分群標準) 分群演算法. FFF. FFT. FTF. FTT. TFF. TFT. TTF. TTT. K-Means. 37.9. 43.2. 42.2. 47.5. 45.6. 47.9. 48.1. 55.0. K-Medoids(Mean). 37.7. 42.6. 42.4. 47.2. 45.3. 47.4. 48.1. 54.3. K-Medoids(Min). 37.7. 42.6. 42.4. 47.2. 45.3. 47.4. 48.1. 54.3. 未分群. 37.7. 43.2. 42.4. 47.2. 45.1. 46.8. 48.1. 54.6. 37.

(57) 表 14: 支持向量回歸 MAPE80%(分群資料未正規化，DB 分群標準) 分群演算法. FFF. FFT. FTF. FTT. TFF. TFT. TTF. TTT. K-Means. 37.9. 43.2. 42.2. 47.5. 45.6. 47.9. 48.1. 55.0. K-Medoids(Mean). 39.8. 44.5. 43.6. 51.4. 47.5. 51.2. 54.1. 61.4. K-Medoids(Min). 38.4. 44.4. 41.7. 49.8. 46.6. 50.5. 53.9. 56.9. 未分群. 37.7. 43.2. 42.4. 47.2. 45.1. 46.8. 48.1. 54.6. 從所有預測結果來說，在分群演算法部分，PBM Index 配合 K-Means 分群演算法結果較好，而 DB Index 配合 K-Medoids 分群演算法的預測結果較優。在分群標準部分，針對本研究資料，PBM Index 分群結果比 DB Index 分群結果佳，但可能是因為 DB Index 分群數較多，每群電表數少，導致無法訓練出較佳的模型，使預測結果較差。環境變因部分，只使用過去用電量去訓練時的結果為最佳，若訓練資料加入環境變因，依照預測結果，其重要性順序為樓層 > 假日 > 溫度，當訓練資料加入兩個以上的環境變因，會使用電量預測準確度下降。由於我們將不同樓層分開進行訓練模型，用電戶數較少的樓層資料相對較少，這可能會使用電預測準確度下降。其假日同理，假日用電資訊較平日少許多，若同時考慮假日與樓層時，高樓層假日的模型資料將會非常少，這可能是預測結果較差的原因之一。分群資料正規化部分，分群資料未正規化比正規化過後的結果佳，可能是因為正規化是放大用電戶的用電習慣，使用電習慣相同的在同一群中，但此舉可能造成用電量較小的用電戶與用電量較大的用電戶被分在同一群中，導致訓練時用電量差距太大，造成最後預測結果較差。. 38.

(58) 第七章. 相關文獻. 多樣性分析部分，在文獻 [13, 17, 15, 6] 中可看到，作者將溫度與用電量作相關性分析，利用溫度與用電量的高度相關性，輔助預測用電量。但對於未來溫度是未知的情況下，需先預測未來溫度才可預測未來用電量，作者視預測未來溫度為一大難題，若溫度預測誤差過大，將會導致用電量預測產生大量誤差。除了溫度的分析外，還有假日與用電量的相關性分析 [9, 15]，在文獻中，分析的結果為假日用電量皆高於平日，且星期六用電量高於星期日，星期日用電量最低，並利用假日與用電量的特性作用電預測 [3, 22, 6]。在 Bo-Juen Chen 等人提出的論文 [6] 中提到，他們有斯洛伐克連續兩年的用電資料與每日溫度，還有斯洛伐克的國家行事曆，他們主要目的為預測 1999 年一月份的每日最大用電量。. 圖 14: 斯洛伐克總用電量測資料圖 (擷取自 [6]). 在文獻 [6] 中，作者得到的用電資料為斯洛伐克整個國家的總用電量測資料，用電資料較有規律 (如14所示)，個人用電習慣與行為不會影響國家總用電量，預測用電資料較容易。. 39.

(59) 用電預測部分，文獻 [6] 使用 LIBSVM 預測用電量，並考慮假日、溫度與過去用電量，假日可分為平日、假日與特殊假期。因為此篇論文主要目的為預測 1999 年 1 月用電量，所以此篇作者將訓練資料的資料集分成兩群，一群為 “冬天” 資料集，時間由一月至三月和十月至十二月，另一群為 “一、二月” 資料集，時間為一月至二月。在不同資料集中與不同考慮條件下，探討預測結果為使用 “冬天” 資料集，且不考慮溫度，只考慮過去用電量、平日與假日與否的情況下，預測總用電量最為準確。 Amit Jain 等人提出基於分群之利用 SVR 預測短期用電量 [10]，此篇論文使用全印度總用電量資料，時間為兩年，每半小時一筆資料，目的是預測隔日用電量。此篇作者將兩年用電資料做切割，周期為一個星期，共 104 個禮拜，91 個禮拜作為訓練資料，13 個禮拜作為測試資料。SVR 訓練項目為前一日 48 筆資料、前一日溫度、預測日溫度和預測日 (星期一或星期二等等)，輸出預測日 48 筆資料。此篇論文將資料做分群，作者依照訓練資料與測試資料之每日用電量差做分群，測試資料將訓練資料集分成無分群、用電量差三百萬瓦一群與用電量差六百萬瓦一群，也就是將與測試資料差三百萬瓦與差六百萬瓦的用電資料做訓練。此種方法不需要任何沉重的計算負擔，並可以很容易地計算、預測第二天用電量。 Wen Shen 等人在 2013 年提出一個預測用電量的集合模型 [24]，此論文中提到，他基於模式序列相似演算法 (Pattern Sequence Similarity(PSF) algorithm) 結合五種不同分群演算法作分群預測，並將此模型命名為特徵預測集合模型 (Pattern Forecasting Ensemble Model，簡稱：PFEM)。五種演算法為：K-Means 分群演算法、Self-Organizing Map、階層式分群演算法、K-Medoids 分群演算法和 Fuzzy C-Means 分群演算法。此模型架構如圖15所示。在此篇論文中使用三種分群效度指標，分別為：Silhouette Index [12],. 40.

(60) 圖 15: PFEM 模型架構圖 (擷取自 [24]) Dunn’s Index [8] 和 DB Index [7]，作者採用多數投票法決定分群數，他將每種分群標準各執行 10 次，並選最頻繁出現的分群數作為最後分群數。在分群距離部分，K-Means 分群演算法、Self-Organizing Map、K-Medoids 分群演算法和 Fuzzy C-Means 分群演算法都使用歐基里德距離，而階層式分群演算法使用馬氏距離 (Mahalanobis Distance) [19]，根據他們的實驗分析，在階層式分群演算法中使用馬氏距離比使用歐基里德距離可以更精確的表示。最後，作者使用三個用電資料集預測用電需求，以比較各種分群預測性能，結果顯示特徵預測集合模型優於其他五種分群模型。. 41.

(61) 第八章. 結論與未來展望. 針對本研究資料，在多樣性分析部分，我們發現樓層愈低，上午用電量愈高；樓層愈高，夜晚用電量愈高，且高樓層在六月至九月每日用電量明顯高於其它其他樓層。當溫度愈高，整體的每日用電量愈高，兩者呈高度相關。以每 15 分鐘用電量來說，溫度與用電量並無太大相關，與家中是否有人在家活動較有關係，有人在家活動時，用電量上升，就寢後用電量下降，早上出門上班後，用電量也會下降。平日與假日用電量比較：平日用電量 > 星期六用電量 > 星期日用電量。用電戶分群與預測部分，分群效度指標在本研究資料中的適合度為 PBM Index>DB Index>Dunn’s Index，PBM Index 配合 K-Means 分群演算法結果較好，而 DB Index 配合 K-Medoids 分群演算法的預測結果較優。預測方法準確度為支持向量回歸 >ARIMA 模型 >ε-LookBack-N 。支持向量回歸加入環境變因後，其環境變因對支持向量回歸的重要性為樓層 > 假日 > 溫度，由於我們將不同樓層分開進行訓練模型，用電戶數較少的樓層資料相對較少，這可能會使用電預測準確度下降，其假日同理。我們發現當訓練資料加入兩個以上的環境變因，會使用電量預測準確度下降，可能因為每個模型的資料數非常少 (例如：假日與高樓層的模型，假日資料數比平日少，高樓層電表數又比其他樓層少很多，在此情況下，該模型的資料數非常稀少)，若未來有更多用電量測資料，預測結果將希望比現在更佳。在學術上，本研究提出 ε-LookBack-N 方法可以避免使用 LookBack-N 方法時找不到吻合的候選值。在使用 DB Index 時，距離使用本篇定義的動態時間扭曲距離比歐基里德距離更佳。在實務層面，我們可利用本研究結果，對用電戶用電量進行預測，並根據預測結果進行更有效率的配電。. 42.

(62) 在未來，我們希望可以加入更大量的用電資料，改善預測準確度。在本研究資料中，只使用台北地區的用電資料，未來希望可以有更多地區的用電資訊，並研究用電量與地域性相關程度。我們也希望可以建立氣象預測模式，利用氣象預測用電量。其預測模型可以幫助電力業者作用電預測，適時調整發電量，有效率的配送電能，以達到節能省碳之目的。除了預測更準確的用電量之外，希望可以提出異常用電量警告通知，在異常用電量警告的幫助下，用電戶可以即時了解目前家中用電狀況，且立即檢查並關閉未使用之電器用品，如此不僅可幫助用戶節省電費，還可幫助消費者本身調整用電習慣，更可以使電力公司提高供電效率，減少電力消耗，進而達到達到節約能源、有效利用資源、永續經營之目的。相信本研究之研究成果，對於智慧電表系統以及智慧電網，將可做出具體且正面的貢獻，同時更能進一步促進智慧電網的未來發展，以及各項智慧電網的加值創新應用。 . 43.

(63) 參考文獻 [1] R. http://www.r-project.org/. [2] Taiwan Power Company. http://www.taipower.com.tw/. [3] E. Castillo, B. Guijarro, and A. Alonso. Electricity load forecast using functional networks. In Electricity Load Forcast Using Intelligent Technologies, page 75–84. EUNITE: The European Network on Intelligent Technologies for Smart Adaptive Systems, 2002. [4] C.-C. Chang and C.-J. Lin. Libsvm: A library for support vector machines. ACM Trans. Intell. Syst. Technol., 2(3):27:1–27:27, May 2011. [5] R.-S. Chang, C.-Y. Kuo, and Y.-H. Ho. A survival analysis based approach for mdms missing data treatment. In Wireless and Sensor Networks Conference, number 61, August 2012. [6] B.-J. Chen, M.-W. Chang, and C.-J. Lin. Load forecasting using support vector machines: a study on eunite competition 2001. Power Systems, IEEE Transactions on, 19(4):1821–1830, 2004. [7] D. L. Davies and D. W. Bouldin. A cluster separation measure. Pattern Analysis and Machine Intelligence, IEEE Transactions on, PAMI-1(2):224– 227, 1979. [8] J. C. Dunn. Well-separated clusters and optimal fuzzy partitions. Journal of Cybernetics, 4(1):95–104, 1974.. 44.

(64) [9] D. Esp. Adaptive logic networks for east slovakian electrical load forecasting. In Electricity Load Forcast Using Intelligent Technologies, page 55–74. EUNITE: The European Network on Intelligent Technologies for Smart Adaptive Systems, 2002. [10] A. Jain and B. Satish. Clustering based short term load forecasting using support vector machines. In PowerTech IEEE Bucharest, page 1–8, 2009. [11] W. Karush. Minima of functions of several variables with inequalities as side constraints. Master’s thesis, Dept. of Mathematics, Univ. of Chicago, 1939. [12] L. Kaufman and P. J. Rousseeuw. Finding Groups in Data: An Introduction to Cluster Analysis (Wiley Series in Probability and Statistics). WileyInterscience, 1st. edition, March 2005. [13] W. Kowalczyk. Averaging and data enrichment: Two approaches to electricity load forecasting. In Electricity Load Forcast Using Intelligent Technologies, page 209–218. EUNITE: The European Network on Intelligent Technologies for Smart Adaptive Systems, 2002. [14] H. W. Kuhn and A. W. Tucker. Nonlinear programming. In Second Berkeley Symposium on Mathematical Statistics and Probability, page 481–492, 1951. [15] A. Lewandowski, F. Sandner, and P. Protzel. Prediction of electricity load by modeling the temperature dependencies. In Electricity Load Forcast Using Intelligent Technologies, page 107–114. EUNITE: The European Network on Intelligent Technologies for Smart Adaptive Systems, 2002.. 45.

(65) [16] T. W. Liao. Clustering of time series data—a survey. Pattern Recognition, 38(11):1857 – 1874, 2005. [17] A. Lotfi. Application of learning fuzzy inference systems in electricity load forecast. In Electricity Load Forcast Using Intelligent Technologies, page 123– 130. EUNITE: The European Network on Intelligent Technologies for Smart Adaptive Systems, 2002. [18] J. B. MacQueen. Some methods for classification and analysis of multivariate observations. In Proc. of the fifth Berkeley Symposium on Mathematical Statistics and Probability, volume 1, page 281–297. University of California Press, 1967. [19] R. De Maesschalck, D. Jouan-Rimbaud, and D.L. Massart. The mahalanobis distance. Chemometrics and Intelligent Laboratory Systems, 50(1):1 – 18, 2000. [20] J. Mercer. Functions of positive and negative type and their connection with the theory of integral equations. Philos. Trans. Royal Soc. (A), 83(559):69– 70, November 1909. [21] M. K. Pakhira, S. Bandyopadhyay, and U. Maulik. Validity index for crisp and fuzzy clusters. Pattern Recognition, 37(3):487 – 501, 2004. [22] E. Pelikán. Middle-term electrical load forecasting by time series decomposition. In Electricity Load Forcast Using Intelligent Technologies, page 167– 176. EUNITE: The European Network on Intelligent Technologies for Smart Adaptive Systems, 2002.. 46.

(66) [23] A. P. Reynolds, G. Richards, and V. J. Rayward-Smith. The application of k-medoids and pam to the clustering of rules. In Intelligent Data Engineering and Automated Learning – IDEAL 2004, volume 3177 of Lecture Notes in Computer Science, page 173–178. Springer Berlin Heidelberg, 2004. [24] W. Shen, V. Babushkin, Z. Aung, and W. L. Woon. An ensemble model for day-ahead electricity demand time series forecasting. In Proceedings of the fourth international conference on Future energy systems, page 51–62, 2013. [25] A. J. Smola and B. Schölkopf. A tutorial on support vector regression. Statistics and Computing, 14(3):199–222, 2004. [26] V. N. Vapnik. Statistical learning theory. Wiley, 1st. edition, September 1998. [27] R. Xu and D. Wunsch. Survey of clustering algorithms. Neural Networks, IEEE Transactions on, 16(3):645–678, 2005.. 47.

(67) 附錄 A 多樣性分析在多樣性分析部分，本研究將針對台灣目前智慧型電表測試計畫所收集到的量測資料作多樣性分析，研究當地溫度與用電量的關係、用戶樓層與用電量的相關性等等。考慮到電表數的多寡將會影響到分析結果，在此章節中，將會使用較多電表，以避免資料因為電表過少而導致分析上的誤差。在本章分析中，為了使分析時間能盡可能最長、電表數盡可能最多，避免少數電表決定大部分電表的分析結果，所以每個月的可用電表數不同，每顆電表可用月份數也會因此而不同。分析時間為 2010 年 12 月至 2011 年 12 月，統計表如下表所示：. 年 2010 月 12 電表數量 42 時間. 表 15: 每月資料電表數統計表 2011 1 2 3 4 5 6 7 8 9 10 11 12 15 32 0 29 37 33 50 61 66 25 35 31. 由表15可以看到每個月使用的電表數目，最少使用 15 個電表，最多使用 66 個電表。2011 年 3 月，此月份無可用的資料月，所有的電表紀錄皆有缺失值，所以此月份可用來做分析的電表數為 0。我們以下列觀點進行分析： • 用電量基本分析：智慧型電表每 15 分鐘記錄一筆用電度數，並將電表度數回傳至電力公司作紀錄，我們將 15 分鐘的用電量資料做頻率的統計，如圖16所示：. 48.

(68) 圖 16: 電錶使用度數頻率圖. 經過統計後發現，用戶在 15 分鐘內使用的電量大約為 0 度到 4.3 度。由圖16可以發現，每 15 分鐘的用電量大部分皆不超過 1 度，使用 0.1 度以內的頻率高達六十四萬五千多次，用電量 0.1 度到 0.2 度的頻率降到了三十一萬多次，呈銳減的狀態。超過 1 度的用電量頻率較小，最高用電量達 4.3 度，但 1 度以上到 4.3 度的頻率皆不到一萬次。. 49.

(69) 圖 17: 用電戶每日平均用電度數之累計分配函數圖. 圖17為用戶 2010 年 12 月到 2011 年 12 月的每日用電度數平均累積分配函數圖。由此圖可發現，用戶平均用電量，在 0 度到 30 度左右快速攀升，在此區間內，CDF(cumulative distribution function) 由 0% 上升至 90% 左右，代表有 90% 的用戶在一年裡每日的平均用電量大約在 0 度到 30 度左右。用戶用電量在 30 度左右時，CDF 高達 90%，代表有 90% 的用戶每日平均用電量小於 30 度。在 30 度以後，CDF 上升的速度漸緩，大約只有 10% 的用戶每日平均用電量大於 30 度，最高用電量為 150 度。. 50.

(70) • 依樓層分析用電量：. 圖 18: 各樓層用電戶平均用電圖. 我們從樓層的不同做用電量的分析，圖18為依據用戶樓層的平均用電資料圖，三月份的電錶用電紀錄皆有許多缺失，所以不列入分析。由圖18可看出，在夏天時高樓層用戶用電量明顯比中低樓層用戶的用電量高。以有三種樓層的月份來看，四月、六月、七月、八月這幾個月份每日平均用電量高樓層用電量高於其他樓層；在十月、十一月、十二月的用電量，低樓層用電量比中高樓層用電量高。. 51.

(71) (a). (b). (c). (d). (e). (f). (g). (h). (i). (j). (k). 圖 19: 每 15 分鐘平均用電量分析圖 (a) 一月 (b) 二月 (c) 四月 (d) 五月 (e) 六月 (f) 七月 (g) 八月 (h) 九月 (i) 十月 (j) 十一月 (k) 十二月. 52.

(72) 圖19為一天 24 小時的平均用電，以日為單位，檢視每日不同時段的用電量。從圖可以觀察出，四月的平均用電量較其他月份少，因為四月的溫度較舒適，尚未開啟耗電量較大的降溫電器產品。樓層間的用電量雖然比較平均，但還是看的出來，高樓層在晚上用電量稍比其他樓層高一些。六月、七月與八月高樓層用電量比其他樓層高出許多，從每日平均圖來看，高樓層在夜間的用電量差距更是明顯。到了冬天時，低樓層在下午到晚上這段時間的用電量較大，由圖8.19(i)、 8.19(j)、8.19(k)可以明顯的看出低樓層與中高樓層的差異，在圖8.19(i)可以看出，中低樓層用電量比中高樓層高三倍左右，是十月、十一月、十二月中最差異最大的。在這三個月內，中樓層與高樓層間差異較小，凌晨的用電量在 0.5 度左右，白天用電量在 0.5 度到 1 度中間。. 53.

(73) • 依溫度分析用電量：我們將溫度與用電量作分析，以下為 2010 年 12 月到 2011 年 12 月的每日平均用電量與每日溫度關係圖：. 圖 20: 每日溫度與用電量關係圖. 以整體來說，每日平均用電量與每日溫度呈中度正相關，相關係數為 0.66。從圖20中可以觀察出，約以 20 度為分界點，20 度以上的為高度正相關， 20 度以下的呈負相關。當溫度愈高，用電量攀升迅速，我們推測應該是當氣溫升高後，民眾開始開啟冷氣機等耗電量較大的降溫電器用品，到了較舒適的溫度後，人們不必開啟耗電量較大的降溫電器用品，用電量才下降。當溫度太低時，用電量開始上升，我們推測天氣太冷時，民眾開啟暖氣機、電毯等等可以升溫的電器用品。由於台灣處於亞熱帶氣候，冬天又濕又冷，所以除了暖氣機與電毯等等可升溫的電器用品，可能還會經常使用到除濕機。所以在溫度低時，用電量也會上升。在此我們將溫度高的月份與溫度低的月份各自獨立分析，如圖21和圖22所示：. 54.