預測功能介紹

第三章研究方法

第三節預測功能介紹

（Simple regression analysis）；若自變數為一個以上，則為複迴歸分析（Multiple regression analysis）。

若為簡單迴歸分析（Simple regression analysis），以最小帄方法找出最佳線性方程式：

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

若為複迴歸分析（Multiple regression analysis），以最小帄方法找出最佳線性方程式：

最小帄方準則 ^{m i n}^yⁱ ^^y^ˆⁱ²

y_i：第 i 個應變數觀察值 yˆ_i：第 i 個應變數估計值

最佳估計方程式 ^Y^ˆ^ ^{X B}

X ：應變數觀察值矩陣，若為 a 個應變數，則為 n×（a+1）的矩陣。

n：總觀察個數。

Yˆ：估計值矩陣。

因此，當自變數只有一個為簡單迴歸分析（Simple regression analysis），則預測模型為^Yˆ ^b0 ^b1^X；當自變數為一個以上為複迴歸分析（Multiple regression

analysis），則預測模型為Y^ˆ XB。建立回歸模式時，一方面希望包含較多的預測變項，以求得較準確之預測；另一方面，基於經費及控制程度的考慮，希望模式中的預測變項數目能儘量減少（黃俊英，1991）。由於上述兩種原因，則希望能以最少的自變數項，達到理想的解釋模型變異程度，本研究的系統採取使用者選取所要的自變數項和應變數項的操作方式。

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

二、時間序列分析

時間序列（Time series）是一組按照時間順序把隨機事件的變化過程依序記錄下來，因而構成一組時間序列，時間的間隔可以是分秒、日、周、月…等等，

甚至是季節性的。而時間序列分析（Time series analysis）則是對依時間順序連續記錄的觀察值數列進行觀察以及研究，找尋其中的規律，預測數列未來的走勢。實務上，經常以數列走勢和統計檢定量來做初步討論。最主要是要利用過去的資料來判斷一個變量未來的走向，以及不同變量同期或前後期的關聯性。

時間序列分析方法常分為描述性時間序列分析和統計時間序列分析。其中描述性時間序列分析是對數據進行直覺性的比較或者繪圖做觀察，找尋數據其中的規律，且描述性時間序列分析通常做為統計性時間序列分析的第一步驟。

統計時間序列分析有三個標準的時間序列模型，分別是 AR（Autoregressive model）、MA（Moving-average）和 ARMA（Autoregressive moving-average）。

三個時間序列模型分別如下：

（一） AR（p）：Y =_t ₁Y_t_₁ ... _{p t p}Y_ _t ；

（二） MA（q）：_Y_t ₁_t_₁₂_t_₂ ..._q_t__q _t ；

（三） ARMA（p, q）：Y_t ₁Y_t_₁ ... _{p t p}Y_ _t+₁_t_₁ ₂_t_₂ ..._q_t__q 其中，Yt為第 t 期觀察值，

t為時間序列模型係數，

t為時間序列模型係數，

_i ^~N⁽⁰^,²⁾

‧

數為非常態分配或屬於類別型資料時，二元分類羅吉斯迴（Dichotomous logistic regression）歸為當反應變數為二元結果的問題，即是或否、有或沒有…等等結

‧

當目標變數為多種分類時，就稱為多元分類羅吉斯迴歸（Polytomous logistic regression），假設目標變數 Y 有 k 個分類，其中第 n 個分類被選定為參考分類

（Baseline category），j 為分類編號。

假設目標變數為第 j 類別時，機率表示方式為

‧

以處理類別型和連續型資料。且類神經網路主要是由神經元（Neuron）、層（Layer）

和網路（Network）構成，整個類神經網路包括了一系列的神經元，透過權重

（Weight）來做連結，且權重會隨著網路的不斷訓練而變化。類神經網路必頇透過訓練（Training）的方式，反覆的學習不斷調整權重，而訓練樣本越多，類神經網路的能力就越強，但是容易過度學習。以下將對神經元（Neuron）、層（Layer）

和網路（Network）做簡單概述：

（一）神經元（Neuron）

‧

隱含層（Hidden）---介於輸入和輸出層，主要功用為分析。

輸出層（Output）---輸出最終結果。

（三）網路（Network） Input Layer Hidden Layer Output Layer

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

五、決策樹

決策樹（Decision tree）也稱作規則推理模型，它藉由歸納資料的規則，建立分類樹狀圖，利用這個規則來對新的資料做預測，預測新進資料在分類樹狀圖裡所屬的類別，且模型推理過程容易理解。本研究將介紹建立 C&R Tree 分類迴歸樹

C&R Tree（Classification and regression tree）又稱做分類迴歸樹，預測變數可以是類別型資料或者是連續型資料。若預測變數為類別型資料，則為分類樹；

若預測變數為連續型資料，則為迴歸樹。C&R Tree 可以判定解釋變數的重要性，

可歸納出數條預測準則，做出適當的劃分，因此面對多缺失值或者是解釋變數多的情況時，C&R Tree 再訓練的過程中是相當穩健的。

在文檔中資料採礦預測系統之建構-以雲端運算為系統之主軸概念 - 政大學術集成 (頁 43-50)

第三章 研究方法

第三節 預測功能介紹

‧ 國

立 政 治 大 學

‧

‧ 國

立 政 治 大 學

‧

‧

‧

‧

‧

‧ 國

立 政 治 大 學

‧

第三章研究方法

第三節預測功能介紹

立政治大學

立政治大學

立政治大學