第四章 實例分析
第二節 系統執行流程
國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
44
圖4-1 上傳資料之圖示
第二節 系統執行流程
執行系統之後,會顯示上傳資料之介面(圖 4-2 上傳欲分析資料之介面), 點選進入後,會出現讀取檔案之視窗(圖 4-3 讀檔視窗),使用者可以選擇上傳 想要進行資料採礦預測分析的資料,但上傳的資料檔格式必頇是 csv 檔案格式、
xlsx 檔案格式或 xls 檔案格式,因為系統背後運作的軟體是 Microsoft Office Excel 2007,所以若使用者所上傳的資料非上述三種格式,必頇在上傳之前先行轉檔,
才能進行資料採礦預測分析。若選擇所需檔案上傳完成後,則會進入檢視上傳 資料之頁面(圖 4-4 檢視上傳資料),使用者可以在這一步驟檢視所上傳的資料 是否正確,確認上傳的資料是否符合資料採礦預測系統之限制,確認無誤後,
即可選擇進入下一步,若發現上傳資料有誤可選擇上一步返回資料上傳頁面重 新上傳,而在進入下一步的過程裡,系統會主動將含有遺漏值(即含有 NA 或 空格的資料列)的資料刪除。
Index
變數名稱
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
45
圖4-2 上傳欲分析資料之介面
圖4-3 讀檔視窗
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
46
圖4-4 檢視上傳資料
資料採礦方法之頁面(圖 4-5 資料採礦功能之選擇),分成四種大方向分析,
分別是預測(Forecasting)、分類(Classification)、關聯(Association)和集群
(Clustering),由於本研究的部分為資料採礦之預測(Forecasting)系統,故選 擇進入預測方法。進入資料採礦之預測方法的介面(圖 4-6 資料採礦之預測功 能介面),預測方法的介面主要分成兩個下拉式選單,分別是選擇 X 變數以及選 擇 Y 變數,其中 X 變數為解釋變數,Y 變數為目標變數,使用者可以自由選擇 想要分析的目標變數和預加入建模的解釋變數。
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
47
圖4-5 資料採礦功能之選擇
圖4-6 資料採礦之預測功能介面
‧
(Dichotomous logistic)
文字型多元類別 類神經網路(Neural net)
多元羅吉斯迴歸分析
(Polytomous logistic)
數字型時間序列 時間序列分析(Time series analysis)
數字型非時間序列
(一般連續型資料)
迴歸分析(Regression analysis)
分類回歸樹(C&R tree)
數字型二元類別 類神經網路(Neural net)
二元羅吉斯迴歸分析
(Dichotomous logistic)
數字型多元類別 類神經網路(Neural net)
多元羅吉斯迴歸分析
(Polytomous logistic)
‧
時間序列分析(Time series analysis)
迴歸分析(Regression analysis)
分類迴歸樹(C&R tree)
類神經網路(Neural net)
二元分類羅吉斯迴歸分析
(Dichotomous logistic)
類神經網路(Neural net)
多元分類羅吉斯迴歸分析
(Polytomous logistic)
類神經網路(Neural net)
二元分類羅吉斯迴歸分析
(Dichotomous logistic)
類神經網路(Neural net)
多元分類羅吉斯迴歸分析
(Polytomous logistic)
Durbin-Watson test
若數字類別>5,判別為連續型變數 若數字類別≦5,判別為類別型變數 刪遺漏
值資料
‧
對於時間序列型之目標變數實例操作的部分,本研究將使用 TKU NetStat
(http://netstat.stat.tku.edu.tw/)的範例資料檔 lynx,此資料檔包含 64 年的記錄資 料,記錄 1848 年到 1911 年間,在加拿大北部被捕抓到的山貓和貂的數量,資
資料來源:TKU NetStat (http://netstat.stat.tku.edu.tw/)