統計分析

第二章文獻回顧與評析

2.2 統計分析

1. 線性迴歸分析

迴歸分析(Regression Analysis)是一種統計分析方法，它將所要研究的變數區分為依變數(Dependent Variable)與自變數(Independent Variable)，並根據相關理論建立依變數為自變數的函數，然後利用所獲得的樣本資料去估計函數中參數之方法。迴歸的主要目的是做預測，目標是發展一種能以一個或多個預測變數的數值來做為依變數預測之方法。

本研究將探討「簡單」迴歸模式，也就是只用一個獨立變數X 去預測依變數 Y 的模式。所謂建立模式，就是找出Y 與 X 的函數關係式，即函數 f 滿足 Y=f(X)最常用的函數f 是線性函數，即 Y=f(X)= β0+β1X 稱為簡單線性迴歸(Simple Linear Regression) 模式；二次式(或多次式)函數為 Y=f(X)= β0+β1X+β2X²+...，指數函數為Y = β₀e^β¹^X 。此類函數因為只有一個自變數，因此稱為簡單迴歸模式。其中β1、β2稱為迴歸係數，

β0表示截距。並以最小平方法求取 β0 和 β1（參數估計）；當估計得到 β0和 β1後，即可求出估計的迴歸方程式。當得出估計的迴歸方程式之後，即可求出預測值、擬合值和殘差等，並可評估模式擬合的好壞。觀察值與擬合值的差距稱為殘差。要評估模式

擬合的好壞，最常用的方法是畫殘差圖。所謂殘差圖就是殘差對預測變數的散佈圖，

或是殘差對擬合值的散佈圖。殘差圖愈亂表示模式擬合得愈好。拿到資料的第一步就是先畫散佈圖，了解Y 與 X 的關係是否呈現線性或其他形狀。算出迴歸線後畫殘差圖，

看看模式是否良好，如果良好就作解釋、預測或控制，如果模式不良就作修正。一般統計模式皆有：觀察值＝母體參數＋抽樣誤差。條件常態分配：誤差項ε 有大有小，

我們假設它的分佈是常態分配，因此給定X 之後，Y 的分配也是常態分配。此種給定 X 後，所有同樣的 X 對應 Y 的分配為常態分配，稱為條件常態分配。

一般來說條件常態分配都具有均質性，就是不同的預測變數的母體具有相同的變異數。其次是獨立性，誤差項具有獨立性，即每一誤差項不會受到其它誤差項的影響。

然後是線性，不同的預測變數所對應的應變數的平均數的連接線是一直線。在迴歸分析中，我們可以知道的事是，到底所找的預測變數X 對準則變數 Y 有沒有解釋能力？

如果有，其解釋能力有多大？預測變數X 對準則變數 Y 有沒有解釋能力，也就是預測變數與準則變數有無相關，可寫成假設檢定如下：

H0：β1 = 0 H1：β1 ≠ 0

上式的含意為：若β1＝0，表示 X 對 Y 沒有貢獻，不論提供的 X 值是多少，對 Y 值的預測都沒有幫助，Y 對 X 是一常數，即：Y= β0，也就是模式Y＝β0+ β1X 中的迴歸係數 β1＝0。變異數分析主要的功能是分析因素（或變數）是否重要，它所使用的工具是分解平方和。如果都不用預測變數的訊息時，Yi與Y的變異稱為總平方和，以SSTO 表示。如果用上預測變數X 的訊息，則 Yi與Yˆi的變異稱為殘差平方和，以SSE 表示。

而SSTO－SSE＝SSR，稱為迴歸平方和，表示用了預測變數後總變異降低的部份。如要檢定H0：β1 = 0，可以利用 F 統計量檢定之：

F ＝ MSR / MSE

X 對 Y 的解釋能力，我們是以 SSR / SSTO 來量測，它表示由於預測變數 X 進入模式後，Y 的變異降低的比例，我們稱它為 X 對 Y 的解釋能力（更正確的說法是解釋變異的能力），通常以R²表示，稱R²為判定係數。SSTO 是沒有利用預測變數 X 時 Y 的變異，SSE 是有利用預測變數 X 時 Y 的變異，因此 R²的分子部份是變數X 進入模式後變異降低的部份，而分母是Y 的總變異，二者的比值即為由於變數 X 進入模式後 Y 變異降低的比例。判定係數 R² 的存在著一些特性，如下：

(1) 0 ≤ R² ≤ 1 。

(2) R² 愈大，表示 X 提供的訊息對 Y 愈有用。

(3) 調整的 Adj-R²其定義為：

數為Ｓ12

在文檔中捷運運量路網效應之研究 (頁 25-28)

第二章 文獻回顧與評析

2.2 統計分析

第二章文獻回顧與評析