第四章 實例分析
第三節 系統實例操作
一、 時間數列型之目標變數實例分析
對於時間序列型之目標變數實例操作的部分,本研究將使用 TKU NetStat
(http://netstat.stat.tku.edu.tw/)的範例資料檔 lynx,此資料檔包含 64 年的記錄資 料,記錄 1848 年到 1911 年間,在加拿大北部被捕抓到的山貓和貂的數量,資
資料來源:TKU NetStat (http://netstat.stat.tku.edu.tw/)
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
51
接著,將以圖示的方式來介紹資料採礦系統之預測功能的操作步驟,從上 傳資料至發佈分析頁面,依序有步驟一至步驟五:
步驟一、執行資料採礦之預測系統,則會顯示上傳資料之介面(圖 4-8 上傳欲分 析資料之介面)。
圖4-8 上傳欲分析資料之介面
步驟二、時間數列型之目標變數的範例操作所選用的資料是 lynx 資料檔,故選 擇上傳欲分析的 lynx 資料檔(圖 4-9 讀取檔案)。
圖4-9 讀取檔案
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
52
步驟三、檢視選擇上傳的 lynx 資料檔是否有誤,或者不符合資料採礦系統之規 定,例如:遺漏值未以 NA 或空格取代、文字類別並非是英文…等,若資料有 誤可選擇上一步回到資料上傳之頁面,選擇重新上傳資料,若確認無誤即可進 入下一步繼續分析(圖 4-10 檢視上傳資料之頁面)。
圖4-10 檢視上傳資料之頁面
步驟四、選擇本研究的系統建置部份,即資料採礦預測(Forecasting)功能(圖 4-11 資料採礦功能之選擇)。
圖4-11 資料採礦功能之選擇
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
53
步驟五、選擇欲分析的目標變數和解釋變數,本操作範例選擇目標變數為 Lynx,
變數 Mink 當解釋變數,若資料上傳有誤則點選上一步回到資料上傳頁面重新上 傳,若確認無誤,點選「確認」鍵,進行預測功能之分析(圖 4-12 變數選擇)。
圖4-12 變數選擇
選擇變數的動作完成後,點選「確認」鍵,接著進行資料採礦預測功能之 分析,由於目標變數 Lynx(山貓)為數字型資料,為連續型(Continuous)變數,
且經系統透過 Durbin-Watson 檢定後,判定目標變數為時間序列資料,所以系統 以時間序列分析(Time series analysis)的分析方法建構模型。分析完成後,分 析結果頁面會發布成網頁的型式以供使用者預覽(圖 4-13 結果頁面預覽選擇),
分別有資料頁面(圖 4-14 資料頁面)以及時間序列分析(Time series analysis)
分析頁面(圖 4-15 時間序列分析頁面)可以選擇預覽,且資料頁面是使用者所 選的目標變數和解釋變數,其中資料頁面第一行為使用者所選的目標變數,而 分析頁面的目標變數的名稱則以「Target.Variable」取代原本的名稱,以便使用 者方便區別所選擇的目標變數和解釋變數。
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
54
圖4-13 結果頁面預覽選擇
圖4-14 資料頁面
可以選擇檢視結果頁面
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
55
圖4-15 時間序列分析頁面
資料頁面包含在變數選擇介面所選擇的目標變數和解釋變數,第一行為目 標變數資料,第二行之後依序為所選的解釋變數。而在時間序列分析頁面,內 容包含多種統計量和統計圖表,包括:時間序列圖、Dickey-fuller 檢定統計量、
PACF 圖、ACF 圖、樣本的 EACF 圖、ARIMA 模型係數、σ2統計量、AIC 統 計量、BIC 統計量、Log likelihood 統計量、殘差值、殘差時間序列圖、殘差的 常態機率圖、殘差 PACF 圖、殘差 ACF 圖、估計值和實際值比較圖,分析頁面 包含多種上述統計資料,可以供使用者參考使用。
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
56