為了檢驗研究假說,本文使用以下兩個多元迴歸模型進行實證分析5:
𝐹𝑖𝑛𝐿𝑖𝑡 = 𝛽0+ 𝛽1𝑆𝑡𝑎𝑡𝑢𝑠 + 𝛽2𝑀𝑎𝑡ℎ𝐿𝑖𝑡 + 𝛽3𝐺𝑒𝑛𝑑𝑒𝑟 + 𝜀 (1) 𝐹𝑖𝑛𝐿𝑖𝑡 = 𝛽0+ 𝛽1𝑆𝑡𝑎𝑡𝑢𝑠 + 𝛽2𝑀𝑎𝑡ℎ𝐿𝑖𝑡 + 𝛽3𝐺𝑒𝑛𝑑𝑒𝑟 + 𝛽4𝐻𝑜𝑢𝑟𝑠 + 𝛽5𝐿𝑎𝑛𝑔𝑢𝑎𝑔𝑒 + ε (2) 𝛽0為常數,𝛽1…𝛽5 為迴歸係數,ε 為誤差
模型(2)比模型(1)多放了變數 Hours 和 Language,然而也因為較多的缺失值6, 會影響模型(2)的估計準確度,故分成兩個迴歸模型處理。迴歸模型中的變數定義,
說明如下:
FinLit:金融素養評量分數(Financial Literacy scores)。分數範圍由 0 至 1000 分,將
PISA 2015 年金融素養評量分數的 10 個可能值(Plausible Values)平均,所得 到的結果。為本文統計模型中被解釋的依變數(Dependent variable)。
5 以統計軟體 Stata 程式碼表示的話,兩個多元迴歸模型如下:
reg FinLit Status MathLit Gender [aw=W_FSTUWT], robust (1) reg FinLit Status MathLit Gender Hours Language [aw=W_FSTUWT], robust (2) [aw=W_FSTUWT]表示使用最終學生加權變數做加權線性迴歸(Weighted Least Squares,WLS);
使用robust 指令,算出來的標準誤為穩健標準誤(White-Huber standard errors)。
6 全部 14 國樣本數為 129,520,FinLit 的資料缺失比率為 8.46%,Status 的資料缺失比率為 2.74%,
Status:經社文化地位指數(PISA index of Economic, Social and Cultural Status)。依
OECD 官方報告解釋,這個指數由以下 5 個變數所建立:(1) 國際社會經濟職 業地位指數( International Socio-Economic Index of Occupational Status, ISEI) (2) 將學生家長的最高學歷轉換為學校教育年數 (3)家庭財富的 PISA 指數 (4)家 中教育資源的PISA 指數 (5)家中經典文化財產的 PISA 指數,例如經典文學、
詩集著作和藝術品。轉換後的尺度,平均值為0,標準差為 1,經社文化地位
指數反映出了學生背景的經濟、社會和文化地位,為本文統計模型中的自變數 (Independent variable)。
MathLit:數學素養評量分數(Mathematics Literacy scores)。分數範圍由 0 至 1000
分,將PISA 2015 年數學素養評量分數的 10 個可能值(Plausible Values)平 均,所得到的結果。PISA 數學素養評量和 PISA 金融素養評量,在考驗算術 能力上有交集,因此將數學素養評量分數作為統計模型中的自變數。
Gender:虛擬變數,男生為 1,女生為 0。男女性別,常被統計模型分析使用,為
本文統計模型中的自變數。
Hours:學生校外每週自主學習時數,例如:做作業、課外輔導和自習,學習項目
包括科學、數學、本測驗語言、外國語言及其他。是從學生問卷資料中挑選缺 失值尚能接受,並且可能對金融素養評量表現有影響的變數,為本文統計模型 中的自變數。
Language:虛擬變數,在家是否大部分時間說本測驗語言,是的話為 1,否的話為 0。是從學生問卷資料中挑選缺失值能接受,並且可能對金融素養評量表現有 影響的變數,為本文統計模型中的自變數。
表 2 PISA 2015 年金融素養評量參與國家的變數敘述統計量(全部 14 國)
變數 樣本數 平均值 標準差 最小值 中位數 最大值
FinLit 118,568 474.555 114.420 28.323 476.592 909.531 Status 125,968 -0.366 1.159 -6.733 -0.310 4.068 MathLit 129,520 460.198 99.174 113.371 459.770 813.687
Gender 129,520 0.500 0.500 0 1 1 Hours 84,721 28.997 27.128 0 22 150 Language 126,209 0.903 0.296 0 1 1
從表 2 可以觀察到變數 Hours(學生校外每週自主學習時數)的最大值是 150 小 時,意思為一週七天168 小時中有 150 小時在自主學習,並不合理,被抽樣受試的 學生,可能有不認真填答資料問卷的情形。對於這個問題,以統計方法Winsorize 處理,將大於第90 百分位數的數值,都以第 90 百分位數的數值代替7,如此,變 數Hours 的最大值為 53 小時,較為合理。表 2 裡的其他變數,為連續變數或虛擬 變數,上下限沒有特別極端,不需要做Winsorize 調整。
下頁表 3 是 PISA 2015 年金融素養評量參與國家的變數平均值及標準差,表
上的金融素養評量分數和數學素養評量分數數據,有和 OECD 出版的官方報告一
致。表3 的國家順序,依金融素養評量分數表現由高至低排列,中國表現最好,整
體平均分數達到金融素養評量五個等級分類中,等級4 的水準;巴西表現最差,整
體平均分數在金融素養評量五個等級分類中,屬於最低的等級1 水準。
7 Hours 的最大值如果以第 95 百分位數的數值代替,最大值為 75 小時,意思為一週平均每天有
表 3 PISA 2015 年金融素養評量參與國家的變數平均值及標準差
在做多元迴歸統計模型之前,也需要觀察變數的相關係數,避免發生共線性問 題。變數的相關係數矩陣如以下表4 所示:
表 4 PISA 2015 年金融素養評量參與國家的變數相關係數矩陣(全部 14 國) FinLit Status MathLit Gender Hours Language FinLit 1.000
Status 0.308 1.000
MathLit 0.880 0.360 1.000
Gender -0.003 0.009 0.060 1.000
Hours -0.136 -0.052 -0.138 0.029 1.000
Language 0.092 0.063 0.076 -0.004 -0.023 1.000
從表 4 可以發現,同是自變數的 Status 和 MathLit 有中度相關性,在過去研 究,也有經社文化地位指數會影響學生數學素養評量表現的結論。為了避免此問題 造成多元迴歸模型分析中係數的偏誤,在此先做加權線性迴歸,以MathLit 為依變 數,Status 為自變數,然後將實際資料的 MathLit 數值減去加權線性迴歸預估的 MathLit 數值,得到 MathLit 的殘差,它代表了數學素養評量分數不能被經社文化 地位指數所解釋的部分,最後以MathLit 的殘差代替 MathLit 作為變數,放入多元 迴歸模型進行分析。問題處理過程,如下頁圖1 所示。
圖1 自變數 Status、MathLit 和依變數 FinLit 的相關性問題處理過程
自變數MathLit
自變數Status 依變數FinLit
先做加權線性迴歸,
以MathLit 為依變數,
以Status 為自變數。
然後以MathLit 的殘差 代替MathLit 作為自變數。
自變數MathLit 的殘差
自變數Status 依變數FinLit
圖 1 自變數 Status、MathLit 和依變數 FinLit 的相關性問題處理過程