• 沒有找到結果。

線性關係是社會科學研究的重要概念,相關分析的目的在描述兩個連續變數的線 性關係強度,而迴歸則是在兩變數之間的線性關係基礎上,進一步來探討變數間的解 釋與預測關係的統計方法。

一般在介紹相關分析時,均會特別提醒,一個顯著的相關係數,僅能說明兩個變 數之間具有一定程度的線性關聯,而無法確知兩個變數之間的因果關係。如果研究者 目的在於預測,亦即取用某一變數去預測另一個變數,或是關心實驗的控制(因),是 否影響某一被觀察的變數(果),研究者則可使用迴歸分析,透過迴歸方程式的建立與 考驗,來檢測變數間關係以進行預測用途。

3.3.1 迴歸分析的概念

從相關的原理可知,當兩個變數之間具有顯著的線性關係,可以用相關係數來反 應此一線性關係以一最具代表性的直線來表示,建立一個線性方程式,研究者即可以 透過此一方程式,代入特定的 x 值,求得一個 y 的預測值。此種以單一輸入變數 x 去 預測輸出變數 y 的過程,稱為簡單迴歸(simple regression)。如( 3-3 )式,稱為 y 對 x 的迴 歸分析。

a bx

y'   ( 3-3 )

在簡單迴歸中,其數學原理與相關的計算相同,均以兩個連續變數的共變數為基 礎,計算變數間標準化的關聯強度。惟相關係數計算之時,同時考慮兩個變數的變異 情形,屬於對稱性設計,以xy表示。但迴歸則由於目的在取用某一變數去預測另 一變數的變化情形,x、y 兩個變數各有其角色,在迴歸係數的計算中,x、y 變數為不 對稱設計,以xyyx表示。

3.3.2 最小平方法與迴歸方程式

在線性關係中,若變數之間的關係是完全相關時(即r 1),x 與 y 的關係呈一直 線,兩個變數的觀察值可以完全的被方程式y'bxa來涵蓋,其中 b 為斜率,a 為截

距,此時 x 與 y 的關係不必預測,代入 x 即得 y,或代入 y 即得 x。而我們可以取任何 兩個點,即可求出方程式的截距與斜率。

但是,當兩個變數之間的關係未達到完全相關時(即r1),x 與 y 的關係是分佈 在同一區域內,無法以一條直線來表示,而必須以人為的方式求取一條最具代表性的 線,此線稱為最適合線(best-fit line)或迴歸線(regression line),必定通過兩個變數的平均 數。

圖 3-2 x 與 y 關係散佈圖

以圖 3-2,圖中穿越各配對觀察值散佈區域的斜線即為迴歸線。而直線之所以能 夠用來反應 x 對 y 的預測關係,係因為各配對資料觀察值在迴歸線上的預測值具有最 小的離差(稱為迴歸殘差)。

更具體來說,對於某一個配對觀察值(x, y),如果將 x 值代入方程式,得到的數值 為對y變數的預測值,記為y ,兩者的差值' y 稱為殘差(residual),表示利用迴歸方y' 程式無法準確預測的誤差,最小平方法即為求取殘差的平方和最小化min

y y'

2

一種估計迴歸線的方法,利用此種原理所求得的迴歸方程式,稱為最小平方迴歸線 (least square regression line) [13]。

3.3.3 迴歸誤差與可解釋變異

'

)

表 3-1 迴歸模型的變異數分析摘要表

相關文件