第三章 研究方法
第三節 預測功能介紹
(Simple regression analysis);若自變數為一個以上,則為複迴歸分析(Multiple regression analysis)。
若為簡單迴歸分析(Simple regression analysis),以最小帄方法找出最佳線性方 程式:
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
34
若為複迴歸分析(Multiple regression analysis),以最小帄方法找出最佳線性 方程式:
最小帄方準則 m i nyi yˆi2
yi:第 i 個應變數觀察值 yˆi:第 i 個應變數估計值
最佳估計方程式 Yˆ X B
X :應變數觀察值矩陣,若為 a 個應變數,則為 n×(a+1)的矩陣。
n:總觀察個數。
Yˆ:估計值矩陣。
因此,當自變數只有一個為簡單迴歸分析(Simple regression analysis),則 預測模型為Yˆ b0 b1X;當自變數為一個以上為複迴歸分析(Multiple regression
analysis),則預測模型為Yˆ XB。建立回歸模式時,一方面希望包含較多的預 測變項,以求得較準確之預測;另一方面,基於經費及控制程度的考慮,希望 模式中的預測變項數目能儘量減少(黃俊英,1991)。由於上述兩種原因,則希 望能以最少的自變數項,達到理想的解釋模型變異程度,本研究的系統採取使 用者選取所要的自變數項和應變數項的操作方式。
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
35
二、時間序列分析
時間序列(Time series)是一組按照時間順序把隨機事件的變化過程依序記 錄下來,因而構成一組時間序列,時間的間隔可以是分秒、日、周、月…等等,
甚至是季節性的。而時間序列分析(Time series analysis)則是對依時間順序連 續記錄的觀察值數列進行觀察以及研究,找尋其中的規律,預測數列未來的走 勢。實務上,經常以數列走勢和統計檢定量來做初步討論。最主要是要利用過 去的資料來判斷一個變量未來的走向,以及不同變量同期或前後期的關聯性。
時間序列分析方法常分為描述性時間序列分析和統計時間序列分析。其中 描述性時間序列分析是對數據進行直覺性的比較或者繪圖做觀察,找尋數據其 中的規律,且描述性時間序列分析通常做為統計性時間序列分析的第一步驟。
統計時間序列分析有三個標準的時間序列模型,分別是 AR(Autoregressive model)、MA(Moving-average)和 ARMA(Autoregressive moving-average)。
三個時間序列模型分別如下:
(一) AR(p):Y =t 1Yt1 ... p t pY t ;
(二) MA(q):Yt 1t12t2 ...qtq t ;
(三) ARMA(p, q):Yt 1Yt1 ... p t pY t+1t1 2t2 ...qtq 其中,Yt為第 t 期觀察值,
t為時間序列模型係數,
t為時間序列模型係數,
i ~N(0,2)
‧
數為非常態分配或屬於類別型資料時,二元分類羅吉斯迴(Dichotomous logistic regression)歸為當反應變數為二元結果的問題,即是或否、有或沒有…等等結‧
當目標變數為多種分類時,就稱為多元分類羅吉斯迴歸(Polytomous logistic regression),假設目標變數 Y 有 k 個分類,其中第 n 個分類被選定為參考分類
(Baseline category),j 為分類編號。
假設目標變數為第 j 類別時,機率表示方式為
‧
以處理類別型和連續型資料。且類神經網路主要是由神經元(Neuron)、層(Layer)和網路(Network)構成,整個類神經網路包括了一系列的神經元,透過權重
(Weight)來做連結,且權重會隨著網路的不斷訓練而變化。類神經網路必頇透 過訓練(Training)的方式,反覆的學習不斷調整權重,而訓練樣本越多,類神 經網路的能力就越強,但是容易過度學習。以下將對神經元(Neuron)、層(Layer)
和網路(Network)做簡單概述:
(一) 神經元(Neuron)
‧
隱含層(Hidden)---介於輸入和輸出層,主要功用為分析。
輸出層(Output)---輸出最終結果。
(三) 網路(Network) Input Layer Hidden Layer Output Layer
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
40
五、決策樹
決策樹(Decision tree)也稱作規則推理模型,它藉由歸納資料的規則,建 立分類樹狀圖,利用這個規則來對新的資料做預測,預測新進資料在分類樹狀 圖裡所屬的類別,且模型推理過程容易理解。本研究將介紹建立 C&R Tree 分類 迴歸樹
C&R Tree(Classification and regression tree)又稱做分類迴歸樹,預測變數 可以是類別型資料或者是連續型資料。若預測變數為類別型資料,則為分類樹;
若預測變數為連續型資料,則為迴歸樹。C&R Tree 可以判定解釋變數的重要性,
可歸納出數條預測準則,做出適當的劃分,因此面對多缺失值或者是解釋變數 多的情況時,C&R Tree 再訓練的過程中是相當穩健的。