資料搜集與整理

第二章文獻探討

3.2 資料搜集與整理

表 3-2 發電量資料的解釋變數與反應變數種類解釋變數（

x

_i）反應變數

（y）

類別型

模組廠牌（x₁）模組生產國家（x₂）模組種類（

x ）

₃ 模組裝設片數（x₄）換流器組數（

x ）

₅ 換流器廠牌（

x ）

₆ 有無變壓器（

x ）

₇ 變壓器輸出規格（

x ）

₈

系統轉換效率

（ ）

連續型

模組單片面積（

x ）

₉ 模組單片容量（

x ）

₁₀ 系統設置總容量（x₁₁）換流器輸出容量（x₁₂）變壓器容量（

x ）

₁₃

將變數分類後，利用（2-2）式計算發電系統之轉換效率（ ），由於計算公式中包含模組面積與發電量，因此缺少此兩項數據的資料將無法計算轉換效率，予以刪除。另一方面，計算出轉換效率後必須先考慮其合理性，若計算後某系統之轉換效率超出現有技術門檻，則判定該資料為異常。

就目前業界技術而言，最先進的太陽能發電系統，模組的實際轉換效率僅略高於 19 % [34]，因此將資料中轉換效率高於 19 % 的資料視為異常，同樣予以刪除。

綜合上述，先行計算原始資料中各系統之轉換效率，刪除缺漏與異常的資料後，再繼續建構預測模型。

2. 地表日照量資料

本研究所使用的地表日照量資料，數據皆以中央氣象局出版的氣象年報為主，整理 1997 至 2007 年各地氣象觀測站之地表日照量資料，並以月為最小單位計算累積地表日照量，各測站位置資料詳見圖 3-2。

3.3

步驟一輸入資料並設定參數 時期的實際發電量相比較，計算平均絕對百分比差（Mean Absolute

Percentage Error, MAPE），公式如下：

執行次數=0

代數=0

族群隨機初始化

是否符合終止條件

計算個體適合度

代數=代數+1

開始選擇基因運作機制

依據適合度選擇一個個體

複製交配突變

族群數 i=m 族群數 i=0

依據適合度選擇一個個體

i = i+1

結果記錄

執行次數=執行次數+1 執行次數=N

終止 Yes

Yes

No 開始

圖 3-3 遺傳規劃法之運算機制[16]

3.4 建立地表日照量預測模型

時間序列分析中，四個成份已於 2.6 節介紹，本節將敘述應用時間序列分析進行地表日照量預測的步驟。

步驟一檢驗資料是否為平穩型與隨機序列

時間序列為一隨機過程，可分為平穩型（Stationary）與非平穩型

（Non-Stationary），平穩型時間序列對於外在的衝擊僅具暫時性的影響，

受到短暫的波動干擾後又會返回其平均值，而外在衝擊對於時間序列會造成累積的效果則為非平穩型（或稱非定態），使觀測值隨著時間逐漸偏離平均值，必須經由差分轉換變為平穩型時間序列。判斷時間序列是否為穩態可使用單根檢定（Unit-root Test），目前較常被學者使用的有 ADF 檢定

（Augmented Dickey-Fuller Test）與 PP 檢定（Philips-Perron Test）[7]，本研究在建模前，先以單根檢定判斷資料是否需要進行差分轉換，並判斷資料是否具有順序上的相關性，檢查誤差項是否存有序列相關，使用的方式為 D-W 檢定（Durbin-Watson Test）。

步驟二選定模型進行預測

在 2.6 節中介紹過以成份來分解時間序列的假設模型，其中加法模型假設成份間互相獨立，而乘法模型則假設成份間存在交互作用，考慮實際情況後選擇乘法模型作為地表日照量資料的假設模型。建立模型後，先以長期趨勢方程式預測，再使用季節與循環因子作為調整，最後得出地表日照量的預測值，在本研究中使用 Minitab 統計軟體進行成份分解的預測。

步驟三模型評估

一般常用的評估指標是 MSE（Mean Square Error）、MAD（Mean Absolute Deviation）與 MAPE（Mean Absolute Percentage Error, MAPE），本研究將以此三項指標來評估預測模型的準確性，最後以 MAPE 值比較時間序列預測模型與歷史數據平均值之預測準確性孰優孰劣。

第四章實例驗證

本章將說明利用發電量資料與地表日照量資料分別建立預測模型的結果，4.1 節敘述資料搜集與整理的結果；4.2 節分別以兩種不同方法建立轉換效率預測模型再進行比較；4.3 節以成份分解法預測 2008 與 2009 年各地區的地表日照量，4.4 節則進行最終發電量的預測，估計發電量資料中，各發電系統在 2009 年可能輸出的發電量。

4.1 資料搜集與整理

以下分別詳述太陽能系統發電量資料與地表日照量資料，進行搜集與整理的過程和結果。

4.1.1 太陽能系統發電量資料

本研究以台灣某太陽能光電研究單位所提供之 2005 至 2008 年政府補助之太陽能發電系統進行資料分析，共計 126 筆，其中 2005 至 2007 年資料用以建構預測模型，而 2008 年之發電量資料則用以驗證。首先以（2-2）

式計算各系統在 2005 至 2007 年，三年間的平均轉換效率（ ）。

計算結果發現有 3 筆資料因無模組面積數據，故無法計算轉換效率，

予以刪除後尚餘 123 筆。進一步考慮轉換效率的合理性，由於目前實際運作的太陽能發電系統，即使是單晶矽模組，轉換效率也僅略高於 19 % [34]，因此在可計算轉換效率的 123 筆資料中，進一步刪除 10 筆轉換效率大於 19 %的資料，最後實際可進行分析的資料共有 113 筆。

進一步細究該 10 筆轉換效率異常的資料，其中 2 筆的解釋變數中，

單片模組尺寸分別為 166mm100mm、165mm125mm，明顯小於其他系統之單片尺寸，初步判斷可能是尺寸數據錯誤，導致高估轉換效率。其 8 筆則判斷為發電量的回報資料有誤，導致轉換效率高估，由於各系統之發電量資料尚未全面電子化，部分較先進的系統可透過電腦連線監控，即時

回傳系統端資料至控制中心的電腦資料庫中，但多數系統之發電量仍必須由人工抄寫紀錄，因此可能發生人為疏失，經核對後發現此 8 筆發電量異常的資料，該系統確為以人工的方式進行電錶抄寫。表 4-1 列出太陽能發電系統原始資料的整理過程。

表 4-1 太陽能發電系統原始資料整理

4.1.2 地表日照量資料

本研究所分析的地表日照量資料，是以中央氣象局所出版之氣候資料年報為主，蒐集 1997 年至 2007 年台灣各地氣象觀測站所回報的地表日照量資料，本研究以月份做為時間序列分析的最小單位，故將每日的地表日照量以月為單位加總，計算各月份之累積地表日照量，每一個地區各有 132 筆數據，由於各測站偶有幾天會發生儀器故障，若因故障而缺少觀測值，

則以該月份剩餘觀時間之日平均值，乘上該月份的天數，來推估該月份的 累積地表日照量。

4.2 預測系統轉換效率

誠如 3.3 節所述，本研究以遺傳規劃法建立轉換效率預測模型，並同時以統計方法建立預測模型，驗證並比較預測模型的準確性。

4.2.1 以遺傳規劃法建立預測模型

1. 參數設定

使用模擬程式執行遺傳規劃法之參數設定如下：

（1）解釋變數（自變數）個數為 13。（表 3-2）

（2）解釋變數之間由於單位不同，造成數值大小落差甚大，故先將資料所有資料

總計

無法計算轉換效率

轉換效率異常（>19%）

有效資料合計

126 3 10 113

（3）演化次數設定一極大值，確保演算結果達到收斂。

數分為連續型和類別型，故採用不同的方法分別處理，連續型變數利用相

Predictor Coefficient SE Coef T P-value VIF

模組單片面積 (

m )

² 5.189 1.138 4.56 0.000* 3.931 Regression 4 470.710 117.678 27.809 0.000*

Error 108 457.018 4.232

Total 112 927.728

R-Sq = 0.507 R-Sq(adj) = 0.489

Residual

Analysis P-value

K-S test 0.720 White’s test 0.076 D-W test 0.842 Run test 0.924

由於多元迴歸分析與遺傳規劃法篩選出的顯著變數相同，故各變數範圍如同表 4-2，R-square 約 50%，顯示以多元迴歸建構的預測模型解釋能力並非十分理想，而 VIF 值皆小於 5 顯示變數之間共線性問題不大。經由迴歸方程式中的係數可知，對於轉換效率影響最大的變數是模組的單片面積（以m 為單位），其次依序為模組種類、變壓器與模組單片容量。連續型變數部份，太陽能電池之單片面積越大，容量（瓦數）愈大，轉換效率越高；類別型變數部分，有變壓器之太陽能發電系統轉換效率較高，而模組的晶體種類亦影響轉換效率，模組轉換效率由高至低依序為多晶矽、單晶矽與非晶矽。

殘差分析則判斷迴歸模型是否符合常態、同質、獨立三大假設，而對應之 K-S 檢定、White’s 檢定、D-W 檢定與連檢定，結果均為不顯著，因此判定本研究所使用之資料並無違反任何基本假設。

4.2.3 驗證過去工學實驗結果

誠如第一章研究目的所述，本研究是以資料分析的方式，驗證過去以工程實驗所得的結果，Gregg 等人[21] 探討過去針對發電量影響因子之相關研究，其中與系統變數有關的有模組面積、模組容量、模組種類、變壓器與換流器，除了換流器以外，無論是以遺傳規劃法或多元迴歸分析，所篩選出來的顯著變數皆與工學領域的研究不謀而合。換流器的功用是將輸出的直流電轉為交流電，理論上應該是影響轉換效率之顯著變數，然而本研究在進行資料分析時，換流器此一變數卻不顯著，原因是本研究是以台灣地區所實際運行的太陽能發電系統為資料背景，而台灣地區目前現有的發電系統皆已設有換流器，故資料中各系統的差異僅為換流器組數的多寡，

而非有無設置換流器，因此就分析的結果僅能證實：換流器組數的多寡對於轉換效率並無顯著的影響，並非否定換流器設置與否對於轉換效率的影響，與過去工學領域研究認定換流器為關鍵因子的觀念並無矛盾。

4.2.4 模型驗證與準確性比較

前面說明了如何以多元迴歸分析和遺傳規劃法，建構兩種不同預測模型，透過模型計算出的轉換效率預測值，將 2008 年上半年度的各系統所在地區之地表日照量資料，乘上各系統的模組總面積，以及兩種模型分別預測的轉換效率，可得到同一時期各系統的發電量預測值，與該時期實際發電量比較，計算 MAPE 值來進行兩模型之評比，以了解遺傳規劃法的預測準確性是否優於傳統的統計方法。

由於各系統模組總容量大小（瓦數）不同，各系統之間比較時，會以每單位容量可輸出的電量作為基準，下表 4-4 展示兩個不同模式對於 2008 上半年度的「每日平均」預測發電量以及實際發電量的節錄結果。

表 4-4 2008 上半年度各系統日平均發電量預測結果（節錄）

在文檔中建構台灣地區太陽能發電系統之發電量預測模型 (頁 43-0)

第二章 文獻探討