• 沒有找到結果。

第三章 研究設計與實施

第五節 資料處理與統計分析

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

48

第五節 資料處理與統計分析

本研究使用 Gretl 進行資料分析。為考驗本研究所提出之研究假設,以回答 研究問題,所使用的統計方法包括:描述性統計與分量迴歸分析等。

壹、 描述性統計

本研究係以「人力運用調查」之原始資料進行統計分析,針對樣本資料以 次數分配、百分比、平均值、標準差及交叉分析等描述性統計數值,分析教育 報酬率整體分布趨勢,並據以進行下一階段統計分析。

貳、 普通最小平方法(ordinary least square)

普通最小平方法(OLS)為求得使觀察值與估計值的平均或誤差平方和為 最小值的迴歸線。Mincer 薪資報酬模型是建立在普通最小平方法的基礎上,但 所估計的係數因受限於模型本身之設定,大多為教育報酬率的「平均」概念,

為每多受一年的教育對於平均薪資的影響,因此無法進一步探討不同工資水準 下教育報酬率的異質性。

若每一個樣本具有相同的截距項𝛼𝛼,且誤差項𝜀𝜀 𝑖𝑖具有統計上獨立且同分配 之特性,則普通最小平發法即可達到有效性及一致性之估計(黃鴻儒,2014)。

普通最小平方法之迴歸式如下:

𝛾𝛾𝑖𝑖 = 𝛼𝛼 + 𝑋𝑋𝑖𝑖𝛽𝛽 + 𝜀𝜀 𝑖𝑖 其中:

i = 1……n 表示在相同時間下的不同樣本 𝛾𝛾𝑖𝑖 為第 i 個樣本之被解釋變項

𝛼𝛼 為截距項

𝑋𝑋𝑖𝑖 為各解釋變數

𝜀𝜀 𝑖𝑖 為誤差項

一般假設迴歸式期望值為零,變異數為𝜎𝜎2

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

49

參、 分量迴歸分析(quantile regression)

分量迴歸最早是由 Koenker 與 Bassett(1978)所提出,分量迴歸模型可以解 釋被解釋變項,也就是薪資報酬在條件分配中不同分量的行為,並且可以進一 步描述解釋變項對不同被解釋變項分量的影響。Koenker 與 Hallock(2001)指 出,面對被解釋變項其條件分配與解釋變項之間關係的研究,有些研究會採取 將樣本切割分組後,再分別估計普通最小平方法之迴歸係數,但此方法不僅會 喪失有用的樣本資訊,亦可能導致樣本選擇偏誤(sample selection bias)。若以分 量迴歸分析來估計樣本,可免除此類偏誤。

分量迴歸分析與普通最小平方法最大的差異為,分量迴歸之係數是用來衡 量解釋變數的邊際效果在不同分量下不同的係數結果。許多較舊的文獻均採用 普通最小平方法求得教育報酬率,探討各個不同變項對於薪資報酬的影響。然 而普通最小平方法無法完整描述各種教育報酬率在薪資報酬分配中的變化。在 許多實證分析中,需探討的往往不只是平均的表現,更在意分配尾端的情況。

林于權(2004)運用分量迴歸分析探討台灣地區教育報酬率之變化並將之與傳 統普通最小平方法分析相比較,運用分量迴歸分析將樣本從低排到高,再針對 被解釋變項的分位數,觀察以這些分位為條件的估計。在教育投資報酬率方 面,1982 年至 2002 年的高等教育報酬率始終都是最高的,因此認為接受高等 教育對個人薪資報酬來說是有益。

分量迴歸分析不但可以同樣估計出分配之中央平均趨勢,也可以觀察以各 百分位數為基準的趨勢。相較之下,普通最小平方法為解釋變項對於被解釋變 項的平均邊際效果,以最小平方誤(SSE;sum of squared error)來估計迴歸式之𝛽𝛽 值;分量迴歸為解釋變項對於被解釋變項在某個特定分量點時的邊際效果,以 最小絕對離差(LAD;least absolute deviation)估計。分量迴歸分析可以提供更多 不同分位數的估計結果,更清楚解釋被解釋變項的整個分配情況,並刻畫解釋

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

50

變項對於被解釋變項不同的影響程度,可以呈現出在不同工資水準下的教育報 酬率異質性。

分量迴歸模型可以進一步描繪解釋變項(如教育程度與工作經驗)對不同被 解釋變項(薪資報酬)分配的影響程度。分量迴歸模型參數估計建立於「極小 化所有誤差項絕對值的總和」之準則上,表示如下:

模型架構為:

𝑦𝑦𝑖𝑖 = 𝐸𝐸𝑖𝑖𝛽𝛽𝜃𝜃 + 𝜀𝜀𝑖𝑖𝜃𝜃 𝑖𝑖 = 1,2 … … , 𝑇𝑇

其中,𝑦𝑦𝑖𝑖為被解釋變項,也就是從樣本𝑌𝑌𝑖𝑖中所抽出的隨機樣本;𝐸𝐸𝑖𝑖為解釋變 項;θ為分量,範圍介於 0 至 1 之間;𝛽𝛽𝜃𝜃為參數向量;𝜀𝜀𝑖𝑖𝜃𝜃為對應誤差。假設𝑦𝑦𝑖𝑖

之第θ條件分量為線性,可將條件分量迴歸模型表示如下:

Quant𝜃𝜃(𝑦𝑦𝑖𝑖|𝐸𝐸𝑖𝑖) = 𝑋𝑋𝑖𝑖𝛽𝛽𝜃𝜃, 𝑖𝑖 = 1,2 … … , 𝑇𝑇

其中,Quant𝜃𝜃(𝑦𝑦𝑖𝑖|𝐸𝐸𝑖𝑖),表示在迴歸向量𝐸𝐸𝑖𝑖下,決定𝑦𝑦𝑖𝑖在第θ的條件分量。𝛽𝛽𝜃𝜃 是估計不同θ值 (0 < θ < 1)下,未知參數的向量。若假設一線性模型,則迴歸 參數𝛽𝛽𝜃𝜃之估計式可得下列模型:

𝛽𝛽̂𝜃𝜃 = 𝑀𝑀𝑖𝑖𝑇𝑇 � � 𝜃𝜃

𝑖𝑖=𝑦𝑦𝑖𝑖≥𝑥𝑥𝑖𝑖𝛽𝛽

|𝑦𝑦𝑖𝑖− 𝐸𝐸𝑖𝑖′𝛽𝛽| + � (1 − 𝜃𝜃

𝑖𝑖=𝑦𝑦𝑖𝑖<𝑥𝑥𝑖𝑖𝛽𝛽

)|𝑦𝑦𝑖𝑖− 𝐸𝐸𝑖𝑖′𝛽𝛽|�

在此模型下,給定正、負絕對值誤差不同的權數,即可得分量迴歸估計 式。而參數估計式𝛽𝛽̂𝜃𝜃之意義為,當𝐸𝐸𝑖𝑖變動一單位時,𝑦𝑦𝑖𝑖的第θ分量分位將會變動 𝛽𝛽̂𝜃𝜃個單位。當θ=0.5 時,將上列式子乘以 2,則可得最小絕對離差之估計式如 下:

𝛽𝛽� = �|𝑦𝑦0.5 𝑖𝑖− 𝐸𝐸𝑖𝑖′𝛽𝛽|

𝑛𝑛 𝑖𝑖=1

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

51

將θ=0.5 時之分量迴歸稱為中位數迴歸,可得知中位數迴歸為分量迴歸中 的特例。

估計式亦可寫成一般式如下:

𝛽𝛽̂𝜃𝜃 = Min �1 𝑇𝑇 � 𝜌𝜌𝜃𝜃

𝑛𝑛 𝑖𝑖=1

(𝑦𝑦𝑖𝑖 − 𝐸𝐸𝑖𝑖′𝛽𝛽)� = 𝑀𝑀𝑖𝑖𝑇𝑇 �1

𝑇𝑇 � 𝜌𝜌𝜃𝜃(

𝑛𝑛 𝑖𝑖=1

𝜀𝜀𝑖𝑖𝜃𝜃)�

其中,𝜌𝜌𝜃𝜃為調整方程式(check function),可視為分量迴歸估計式的正、負 絕對誤差權重,定義如下:

𝜌𝜌𝜃𝜃(ε) = 𝜃𝜃𝜀𝜀 if ε ≥ 0 𝜌𝜌𝜃𝜃(ε) = (θ − 1)ε if ε < 0

故可知,𝛽𝛽̂𝜃𝜃是經過排序後,𝑦𝑦𝑖𝑖之第θ樣本分量。本研究將θ設定為 0.05,

0.25,0.5,0.75,0.95 分別進行迴歸分析。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

52

相關文件