線性迴歸 - 應用線性迴歸模型於射頻IC特性預測

線性關係是社會科學研究的重要概念，相關分析的目的在描述兩個連續變數的線性關係強度，而迴歸則是在兩變數之間的線性關係基礎上，進一步來探討變數間的解釋與預測關係的統計方法。

一般在介紹相關分析時，均會特別提醒，一個顯著的相關係數，僅能說明兩個變數之間具有一定程度的線性關聯，而無法確知兩個變數之間的因果關係。如果研究者目的在於預測，亦即取用某一變數去預測另一個變數，或是關心實驗的控制(因)，是否影響某一被觀察的變數(果)，研究者則可使用迴歸分析，透過迴歸方程式的建立與考驗，來檢測變數間關係以進行預測用途。

3.3.1 迴歸分析的概念

從相關的原理可知，當兩個變數之間具有顯著的線性關係，可以用相關係數來反應此一線性關係以一最具代表性的直線來表示，建立一個線性方程式，研究者即可以 透過此一方程式，代入特定的 x 值，求得一個 y 的預測值。此種以單一輸入變數 x 去 預測輸出變數 y 的過程，稱為簡單迴歸(simple regression)。如( 3-3 )式，稱為 y 對 x 的迴 歸分析。

a bx

y^'   ( 3-3 )

在簡單迴歸中，其數學原理與相關的計算相同，均以兩個連續變數的共變數為基礎，計算變數間標準化的關聯強度。惟相關係數計算之時，同時考慮兩個變數的變異情形，屬於對稱性設計，以xy表示。但迴歸則由於目的在取用某一變數去預測另 一變數的變化情形，x、y 兩個變數各有其角色，在迴歸係數的計算中，x、y 變數為不 對稱設計，以xy或yx表示。

3.3.2 最小平方法與迴歸方程式

在線性關係中，若變數之間的關係是完全相關時(即r 1)，x 與 y 的關係呈一直線，兩個變數的觀察值可以完全的被方程式y^' bxa來涵蓋，其中 b 為斜率，a 為截

距，此時 x 與 y 的關係不必預測，代入 x 即得 y，或代入 y 即得 x。而我們可以取任何 兩個點，即可求出方程式的截距與斜率。

但是，當兩個變數之間的關係未達到完全相關時(即r1)，x 與 y 的關係是分佈在同一區域內，無法以一條直線來表示，而必須以人為的方式求取一條最具代表性的線，此線稱為最適合線(best-fit line)或迴歸線(regression line)，必定通過兩個變數的平均數。

圖 3-2 x 與 y 關係散佈圖

以圖 3-2，圖中穿越各配對觀察值散佈區域的斜線即為迴歸線。而直線之所以能 夠用來反應 x 對 y 的預測關係，係因為各配對資料觀察值在迴歸線上的預測值具有最 小的離差(稱為迴歸殘差)。

更具體來說，對於某一個配對觀察值(x, y)，如果將 x 值代入方程式，得到的數值 為對y變數的預測值，記為y ，兩者的差值^' y 稱為殘差(residual)，表示利用迴歸方y^' 程式無法準確預測的誤差，最小平方法即為求取殘差的平方和最小化^min

_ 

^y^{ y}^'



²^的

一種估計迴歸線的方法，利用此種原理所求得的迴歸方程式，稱為最小平方迴歸線 (least square regression line) [13]。

3.3.3 迴歸誤差與可解釋變異

)

表 3-1 迴歸模型的變異數分析摘要表

在文檔中應用線性迴歸模型於射頻IC特性預測 (頁 28-33)