• 沒有找到結果。

統計分析

在文檔中 捷運運量路網效應之研究 (頁 25-28)

第二章 文獻回顧與評析

2.2 統計分析

1. 線性迴歸分析

迴歸分析(Regression Analysis)是一種統計分析方法,它將所要研究的變數區分為 依變數(Dependent Variable)與自變數(Independent Variable),並根據相關理論建立依變 數為自變數的函數,然後利用所獲得的樣本資料去估計函數中參數之方法。迴歸的主 要目的是做預測,目標是發展一種能以一個或多個預測變數的數值來做為依變數預測 之方法。

本研究將探討「簡單」迴歸模式,也就是只用一個獨立變數X 去預測依變數 Y 的 模式。所謂建立模式,就是找出Y 與 X 的函數關係式,即函數 f 滿足 Y=f(X)最常用 的函數f 是線性函數,即 Y=f(X)= β01X 稱為簡單線性迴歸(Simple Linear Regression) 模式;二次式(或多次式)函數為 Y=f(X)= β01X+β2X2+...,指數函數為Y = β0eβ1X 。 此類函數因為只有一個自變數,因此稱為簡單迴歸模式。其中β1、β2稱為迴歸係數,

β0表示截距。並以最小平方法求取 β0 和 β1(參數估計);當估計得到 β0和 β1後,即 可求出估計的迴歸方程式。當得出估計的迴歸方程式之後,即可求出預測值、擬合值 和殘差等,並可評估模式擬合的好壞。觀察值與擬合值的差距稱為殘差。要評估模式

擬合的好壞,最常用的方法是畫殘差圖。所謂殘差圖就是殘差對預測變數的散佈圖,

或是殘差對擬合值的散佈圖。殘差圖愈亂表示模式擬合得愈好。拿到資料的第一步就 是先畫散佈圖,了解Y 與 X 的關係是否呈現線性或其他形狀。算出迴歸線後畫殘差圖,

看看模式是否良好,如果良好就作解釋、預測或控制,如果模式不良就作修正。一般 統計模式皆有:觀察值=母體參數+抽樣誤差。條件常態分配:誤差項ε 有大有小,

我們假設它的分佈是常態分配,因此給定X 之後,Y 的分配也是常態分配。此種給定 X 後,所有同樣的 X 對應 Y 的分配為常態分配,稱為條件常態分配。

一般來說條件常態分配都具有均質性,就是不同的預測變數的母體具有相同的變 異數。其次是獨立性,誤差項具有獨立性,即每一誤差項不會受到其它誤差項的影響。

然後是線性,不同的預測變數所對應的應變數的平均數的連接線是一直線。在迴歸分 析中,我們可以知道的事是,到底所找的預測變數X 對準則變數 Y 有沒有解釋能力?

如果有,其解釋能力有多大?預測變數X 對準則變數 Y 有沒有解釋能力,也就是預測 變數與準則變數有無相關,可寫成假設檢定如下:

H0:β1 = 0 H1:β1 ≠ 0

上式的含意為:若β1=0,表示 X 對 Y 沒有貢獻,不論提供的 X 值是多少,對 Y 值的 預測都沒有幫助,Y 對 X 是一常數,即:Y= β0,也就是模式Y=β0+ β1X 中的迴歸係 數 β1=0。變異數分析主要的功能是分析因素(或變數)是否重要,它所使用的工具 是分解平方和。如果都不用預測變數的訊息時,YiY的變異稱為總平方和,以SSTO 表示。如果用上預測變數X 的訊息,則 Yii的變異稱為殘差平方和,以SSE 表示。

而SSTO-SSE=SSR,稱為迴歸平方和,表示用了預測變數後總變異降低的部份。如 要檢定H0:β1 = 0,可以利用 F 統計量檢定之:

F = MSR / MSE

X 對 Y 的解釋能力,我們是以 SSR / SSTO 來量測,它表示由於預測變數 X 進入 模式後,Y 的變異降低的比例,我們稱它為 X 對 Y 的解釋能力(更正確的說法是解釋 變異的能力),通常以R2表示,稱R2為判定係數。SSTO 是沒有利用預測變數 X 時 Y 的變異,SSE 是有利用預測變數 X 時 Y 的變異,因此 R2的分子部份是變數X 進入模 式後變異降低的部份,而分母是Y 的總變異,二者的比值即為由於變數 X 進入模式後 Y 變異降低的比例。判定係數 R2 的存在著一些特性,如下:

(1) 0 ≤ R2 ≤ 1 。

(2) R2 愈大,表示 X 提供的訊息對 Y 愈有用。

(3) 調整的 Adj-R2其定義為:

數為S12

在文檔中 捷運運量路網效應之研究 (頁 25-28)

相關文件