第二章 文獻探討
3.2 資料搜集與整理
表 3-2 發電量資料的解釋變數與反應變數 種類 解釋變數(
x
i) 反應變數(y)
類別型
模組廠牌(x1) 模組生產國家(x2) 模組種類(
x )
3 模組裝設片數(x4) 換流器組數(x )
5 換流器廠牌(x )
6 有無變壓器(x )
7 變壓器輸出規格(x )
8系統 轉換效率
( )
連續型
模組單片面積(
x )
9 模組單片容量(x )
10 系統設置總容量(x11) 換流器輸出容量(x12) 變壓器容量(x )
13將變數分類後,利用(2-2)式計算發電系統之轉換效率( ),由於 計算公式中包含模組面積與發電量,因此缺少此兩項數據的資料將無法計 算轉換效率,予以刪除。另一方面,計算出轉換效率後必須先考慮其合理 性,若計算後某系統之轉換效率超出現有技術門檻,則判定該資料為異常。
就目前業界技術而言,最先進的太陽能發電系統,模組的實際轉換效率僅 略高於 19 % [34],因此將資料中轉換效率高於 19 % 的資料視為異常,同 樣予以刪除。
綜合上述,先行計算原始資料中各系統之轉換效率,刪除缺漏與異常 的資料後,再繼續建構預測模型。
2. 地表日照量資料
本研究所使用的地表日照量資料,數據皆以中央氣象局出版的氣象年 報為主,整理 1997 至 2007 年各地氣象觀測站之地表日照量資料,並以月 為最小單位計算累積地表日照量,各測站位置資料詳見圖 3-2。
3.3
步驟一 輸入資料並設定參數 時期的實際發電量相比較,計算平均絕對百分比差(Mean Absolute
Percentage Error, MAPE),公式如下:
執行次數=0
代數=0
族群隨機初始化
是否符合 終止條件
計算個體適合度
代數=代數+1
開始選擇基因運作機制
依據適合度 選擇一個個體
複製 交配 突變
族群數 i=m 族群數 i=0
依據適合度 選擇一個個體
依據適合度 選擇一個個體
i = i+1
結果記錄
執行次數=執行次數+1 執行次數=N
終止 Yes
No
Yes
Yes
No
No 開始
圖 3-3 遺傳規劃法之運算機制[16]
3.4 建立地表日照量預測模型
時間序列分析中,四個成份已於 2.6 節介紹,本節將敘述應用時間序 列分析進行地表日照量預測的步驟。
步驟一 檢驗資料是否為平穩型與隨機序列
時間序列為一隨機過程,可分為平穩型(Stationary)與非平穩型
(Non-Stationary),平穩型時間序列對於外在的衝擊僅具暫時性的影響,
受到短暫的波動干擾後又會返回其平均值,而外在衝擊對於時間序列會造 成累積的效果則為非平穩型(或稱非定態),使觀測值隨著時間逐漸偏離 平均值,必須經由差分轉換變為平穩型時間序列。判斷時間序列是否為穩 態可使用單根檢定(Unit-root Test),目前較常被學者使用的有 ADF 檢定
(Augmented Dickey-Fuller Test)與 PP 檢定(Philips-Perron Test)[7],本 研究在建模前,先以單根檢定判斷資料是否需要進行差分轉換,並判斷資 料是否具有順序上的相關性,檢查誤差項是否存有序列相關,使用的方式 為 D-W 檢定(Durbin-Watson Test)。
步驟二 選定模型進行預測
在 2.6 節中介紹過以成份來分解時間序列的假設模型,其中加法模型 假設成份間互相獨立,而乘法模型則假設成份間存在交互作用,考慮實際 情況後選擇乘法模型作為地表日照量資料的假設模型。建立模型後,先以 長期趨勢方程式預測,再使用季節與循環因子作為調整,最後得出地表日 照量的預測值,在本研究中使用 Minitab 統計軟體進行成份分解的預測。
步驟三 模型評估
一般常用的評估指標是 MSE(Mean Square Error)、MAD(Mean Absolute Deviation)與 MAPE(Mean Absolute Percentage Error, MAPE), 本研究將以此三項指標來評估預測模型的準確性,最後以 MAPE 值比較時 間序列預測模型與歷史數據平均值之預測準確性孰優孰劣。
第四章 實例驗證
本章將說明利用發電量資料與地表日照量資料分別建立預測模型的 結果,4.1 節敘述資料搜集與整理的結果;4.2 節分別以兩種不同方法建立 轉換效率預測模型再進行比較;4.3 節以成份分解法預測 2008 與 2009 年 各地區的地表日照量,4.4 節則進行最終發電量的預測,估計發電量資料 中,各發電系統在 2009 年可能輸出的發電量。
4.1 資料搜集與整理
以下分別詳述太陽能系統發電量資料與地表日照量資料,進行搜集與 整理的過程和結果。
4.1.1 太陽能系統發電量資料
本研究以台灣某太陽能光電研究單位所提供之 2005 至 2008 年政府補 助之太陽能發電系統進行資料分析,共計 126 筆,其中 2005 至 2007 年資 料用以建構預測模型,而 2008 年之發電量資料則用以驗證。首先以(2-2)
式計算各系統在 2005 至 2007 年,三年間的平均轉換效率( )。
計算結果發現有 3 筆資料因無模組面積數據,故無法計算轉換效率,
予以刪除後尚餘 123 筆。進一步考慮轉換效率的合理性,由於目前實際運 作的太陽能發電系統,即使是單晶矽模組,轉換效率也僅略高於 19 % [34], 因此在可計算轉換效率的 123 筆資料中,進一步刪除 10 筆轉換效率大於 19 %的資料,最後實際可進行分析的資料共有 113 筆。
進一步細究該 10 筆轉換效率異常的資料,其中 2 筆的解釋變數中,
單片模組尺寸分別為 166mm100mm、165mm125mm,明顯小於其他系 統之單片尺寸,初步判斷可能是尺寸數據錯誤,導致高估轉換效率。其 8 筆則判斷為發電量的回報資料有誤,導致轉換效率高估,由於各系統之發 電量資料尚未全面電子化,部分較先進的系統可透過電腦連線監控,即時
回傳系統端資料至控制中心的電腦資料庫中,但多數系統之發電量仍必須 由人工抄寫紀錄,因此可能發生人為疏失,經核對後發現此 8 筆發電量異 常的資料,該系統確為以人工的方式進行電錶抄寫。表 4-1 列出太陽能發 電系統原始資料的整理過程。
表 4-1 太陽能發電系統原始資料整理
4.1.2 地表日照量資料
本研究所分析的地表日照量資料,是以中央氣象局所出版之氣候資料 年報為主,蒐集 1997 年至 2007 年台灣各地氣象觀測站所回報的地表日照 量資料,本研究以月份做為時間序列分析的最小單位,故將每日的地表日 照量以月為單位加總,計算各月份之累積地表日照量,每一個地區各有 132 筆數據,由於各測站偶有幾天會發生儀器故障,若因故障而缺少觀測值,
則以該月份剩餘觀時間之日平均值,乘上該月份的天數,來推估該月份的 累積地表日照量。
4.2 預測系統轉換效率
誠如 3.3 節所述,本研究以遺傳規劃法建立轉換效率預測模型,並同 時以統計方法建立預測模型,驗證並比較預測模型的準確性。
4.2.1 以遺傳規劃法建立預測模型
1. 參數設定使用模擬程式執行遺傳規劃法之參數設定如下:
(1)解釋變數(自變數)個數為 13。(表 3-2)
(2)解釋變數之間由於單位不同,造成數值大小落差甚大,故先將資料 所有資料
總計
無法計算 轉換效率
轉換效率 異常(>19%)
有效資料 合計
126 3 10 113
(3)演化次數設定一極大值,確保演算結果達到收斂。
數分為連續型和類別型,故採用不同的方法分別處理,連續型變數利用相
Predictor Coefficient SE Coef T P-value VIF
模組單片面積 (m )
2 5.189 1.138 4.56 0.000* 3.931 Regression 4 470.710 117.678 27.809 0.000*Error 108 457.018 4.232
Total 112 927.728
R-Sq = 0.507 R-Sq(adj) = 0.489
Residual
Analysis P-value
K-S test 0.720 White’s test 0.076 D-W test 0.842 Run test 0.924由於多元迴歸分析與遺傳規劃法篩選出的顯著變數相同,故各變數範 圍如同表 4-2,R-square 約 50%,顯示以多元迴歸建構的預測模型解釋能 力並非十分理想,而 VIF 值皆小於 5 顯示變數之間共線性問題不大。經由 迴歸方程式中的係數可知,對於轉換效率影響最大的變數是模組的單片面 積(以m 為單位),其次依序為模組種類、變壓器與模組單片容量。連續 型變數部份,太陽能電池之單片面積越大,容量(瓦數)愈大,轉換效率 越高;類別型變數部分,有變壓器之太陽能發電系統轉換效率較高,而模 組的晶體種類亦影響轉換效率,模組轉換效率由高至低依序為多晶矽、單 晶矽與非晶矽。
殘差分析則判斷迴歸模型是否符合常態、同質、獨立三大假設,而對 應之 K-S 檢定、White’s 檢定、D-W 檢定與連檢定,結果均為不顯著,因 此判定本研究所使用之資料並無違反任何基本假設。
4.2.3 驗證過去工學實驗結果
誠如第一章研究目的所述,本研究是以資料分析的方式,驗證過去以 工程實驗所得的結果,Gregg 等人[21] 探討過去針對發電量影響因子之相 關研究,其中與系統變數有關的有模組面積、模組容量、模組種類、變壓 器與換流器,除了換流器以外,無論是以遺傳規劃法或多元迴歸分析,所 篩選出來的顯著變數皆與工學領域的研究不謀而合。換流器的功用是將輸 出的直流電轉為交流電,理論上應該是影響轉換效率之顯著變數,然而本 研究在進行資料分析時,換流器此一變數卻不顯著,原因是本研究是以台 灣地區所實際運行的太陽能發電系統為資料背景,而台灣地區目前現有的 發電系統皆已設有換流器,故資料中各系統的差異僅為換流器組數的多寡,
而非有無設置換流器,因此就分析的結果僅能證實:換流器組數的多寡對 於轉換效率並無顯著的影響,並非否定換流器設置與否對於轉換效率的影 響,與過去工學領域研究認定換流器為關鍵因子的觀念並無矛盾。
4.2.4 模型驗證與準確性比較
前面說明了如何以多元迴歸分析和遺傳規劃法,建構兩種不同預測模 型,透過模型計算出的轉換效率預測值,將 2008 年上半年度的各系統所 在地區之地表日照量資料,乘上各系統的模組總面積,以及兩種模型分別 預測的轉換效率,可得到同一時期各系統的發電量預測值,與該時期實際 發電量比較,計算 MAPE 值來進行兩模型之評比,以了解遺傳規劃法的預 測準確性是否優於傳統的統計方法。
由於各系統模組總容量大小(瓦數)不同,各系統之間比較時,會以 每單位容量可輸出的電量作為基準,下表 4-4 展示兩個不同模式對於 2008 上半年度的「每日平均」預測發電量以及實際發電量的節錄結果。
表 4-4 2008 上半年度各系統日平均發電量預測結果(節錄)
表 4-4 2008 上半年度各系統日平均發電量預測結果(節錄)