第四章 研究結果
第一節 參數估計方法之估計結果
本研究中分別以個體能力與群體參數兩個部分於 complete 的設計下,探討施 測人數、題數與參數估計方法之結果,將其估計誤差以圖表表示。
壹、個體能力估計結果比較
本研究中假設了不同人數與不同施測題數之實驗情境,並比較不同方法於個 體能力估計結果,參數估計方法分為:可能值方法(PV_W)、未加入輔助變數之 可能值方法(PV_NoAV_W)加入輔助變數之期望後驗估計法(EAP_AV)、期望
呈現,且在附錄一之估計誤差標準差介於 0.00~0.02 之間,估計誤差標準差小,
表示變動範圍較小,估計較為準確。
一、父母親社經地位變項
由圖 4-1 可以得到下列結果:
(一)不同施測人數之結果比較
在 PV_W 方法於不同施測題數的情境中,施測人數 5460 人與 8064 人的個體 能力估計值之 RMSE 相近,且在其他四種方法(PV_NoAV、EAP_AV、EAP 與 MLE)有相似的結果。
(二)不同施測題數之結果比較
在 PV_W 方法於不同施測人數的情境中,施測題數 30 題之個體能力估計值 之 RMSE 較 15 題小,且在其他四種方法(PV_NoAV、EAP_AV、EAP 與 MLE)
有相似的結果。
(三)不同估計方法之結果比較
在施測題數 15 題的情境中,五種估計方法個體能力估計值之 RMSE 由小至 大依序為 EAP_AV、EAP、PV_W、PV_NoAV_W、MLE。在施測題數 30 題的情 境中,五種估計方法之 RMSE 由小至大依序為 EAP_AV、EAP、PV_W,最後 PV_NoAV_W 與 MLE 之 RMSE 最大且兩種方法估計結果相近。
二、學校變項
由圖 4-2 可以得到下列結果:
(一)不同施測人數之結果比較
個體能力之估計結果皆與社經地位變項相似,詳細結果請參閱附錄一。
(二)不同施測題數之結果比較
個體能力之估計結果皆與社經地位變項相似,詳細結果請參閱附錄一。
(三)不同估計方法之結果比較
個體能力之估計結果皆與社經地位變項相似,詳細結果請參閱附錄一。
圖 4-1 個體能力於社經地位變項與 complete 設計之 RMSE
圖 4-2 個體能力於學校變項與 complete 設計之 RMSE
貳、群體參數估計結果比較
本研究中假設了不同人數與不同施測題數之實驗情境,並比較不同方法於群 體參數估計結果,群體參數又分為群體能力平均數與群體能力標準差,參數估計
方法分為:可能值方法(PV)、未加入輔助變數之可能值方法(PV_NoAV)加入 輔助變數之期望後驗估計法(EAP_AV)、期望後驗估計法(EAP)、最大概似估 計法(MLE)五種,詳細研究結果將在附錄二呈現,且附錄二群體能力平均數之 估計誤差標準差介於 0.01~0.04 之間,群體能力標準差之估計誤差標準差介於 0.00~0.01 之間,估計誤差標準差小,表示變動範圍較小,估計較為準確。
一、父母親社經地位變項
首先探討父母親社經地位變項的群體能力平均數(圖 4-3)與群體能力標準 差(圖 4-4)結果,分別針對不同施測人數、題數與估計方法進行說明。
(一)不同施測人數之結果比較 1. 平均數
於施測題數 15 題的情境中,除了在 PV 方法的低社經地位變項與 EAP_AV 方法的高社經地位變項中,施測人數 8064 人群體能力平均數之 RMSE 較 5460 人 小;其餘方法與情境,施測人數 5460 人與 8064 人的群體能力平均數之 RMSE 相 近。
於施測題數 30 題的情境中,PV 與 EAP_AV 方法,施測人數 8064 人群體能 力平均數之 RMSE 較 5460 人小;在 PV_NoAV 與 EAP 方法的低社經地位變項中,
施測人數 8064 人群體能力平均數之 RMSE 較 5460 人小,高社經地位變項則兩種 施測人數之 RMSE 相似;在 MLE 方法施測人數 5460 人與 8064 人的群體能力平 均數之 RMSE 相近。
2. 標準差
在 PV 方法於不同施測題數的情境中,施測人數 5460 人與 8064 人的群體能 力標準差之 RMSE 相近,且在其他四種方法(PV_NoAV、EAP_AV、EAP 與 MLE)
有相似的結果。
(二)不同施測題數之結果比較 1. 平均數
PV 方法於不同施測人數的情境中,施測題數於 15 題之群體能力平均數之 RMSE 較 30 題小;且在 EAP_AV 與 MLE 有同樣的結果。在 PV_NoAV 與 EAP 兩種方法於不同施測人數的情境中,施測題數 30 題之群體能力平均數之 RMSE 較 15 題小。
2. 標準差
PV 方法除了在施測人數 8064 人的高社經地位變項中,施測題數 30 題群體 能力標準差之 RMSE 較 15 題小;但在其餘情境中,施測題數 15 題與 30 題的群 體能力標準差之 RMSE 相近。PV_NoAV、EAP_AV 與 MLE 三種方法於不同施測 人數的情境中,施測題數 30 題群體能力標準差之 RMSE 較 15 題小。EAP 方法於 不同施測人數的情境中,施測題數 15 題與 30 題的群體能力標準差之 RMSE 相近。
(三)不同估計方法之結果比較 1. 平均數
於施測人數 5460 人、施測題數 15 與 30 題,與施測人數 8064 人、施測題數 30 題的情境中,五種估計方法群體能力平均數 PV 與 EAP_AV 的 RMSE 最小且 兩種方法估計結果相近,其次為 MLE,而 PV_NoAV 與 EAP 的 RMSE 最大且兩 種方法估計結果相近。
於施測題數 15 題、施測人數 8064 人的低社經地位變項中,五種估計方法群 體能力平均數之 RMSE 由小至大依序為 PV、EAP_AV、MLE,最後 PV_NoAV 與 EAP 之 RMSE 最大且兩種方法估計結果相近;另外在高社經地位的變項中,
五種估計方法群體能力平均數之 RMSE 由小至大依序為 EAP_AV、PV、MLE,
最後 PV_NoAV 與 EAP 之 RMSE 最大且兩種方法估計結果相近 2. 標準差
體能力標準差之 RMSE 由小至大依序為 PV、EAP、PV_NoAV 與 EAP_AV(兩種 方法估計結果相近)、MLE;在其餘的情境中,五種估計方法群體能力標準差 PV 與 EAP 的 RMSE 最小且兩種方法估計結果相近,其次為 PV_NoAV 與 EAP_AV 且兩種方法估計結果相近,而 MLE 的 RMSE 最大。
圖 4-3 群體能力平均數於社經地位變項與 complete 設計之 RMSE
圖 4-4 群體能力標準差於社經地位變項與 complete 設計之 RMSE
二、學校變項
接著探討學校變項的群體能力平均數(圖 4-5)與群體能力標準差(圖 4-6)
結果,分別針對不同施測人數、題數與估計方法進行說明。
(一)不同施測人數之結果比較 1. 平均數
PV、PV_NoAV 與 EAP_AV 三種方法於施測題數 15 題學校 A 的變項中,施 測人數 5460 人與 8064 人的群體能力平均數之 RMSE 相近;在其餘情境中,施測 人數 8064 人群體能力平均數之 RMSE 較 5460 人小。
在 EAP 方法於施測題數 15 題學校 A 的變項中,施測人數 8064 人群體能力 平均數之 RMSE 較 5460 人小;但在其餘情境中,施測人數 5460 人與 8064 人的 群體能力平均數之 RMSE 相近。
在 MLE 方法於不同施測題數學校 A 的變項中,施測人數 8064 人群體能力平 均數之 RMSE 較 5460 人小;但在學校 B 的變項中,施測人數 5460 人與 8064 人 的群體能力平均數之 RMSE 相近。
2. 標準差
在 PV 與 EAP_AV 兩種方法於施測題數 30 題學校 B 的變項中,施測人數 8064 人群體能力標準差之 RMSE 較 5460 人小;但在其餘情境中,施測人數 5460 人與 8064 人的群體能力標準差之 RMSE 相近。
在 PV_NoAV、EAP 與 MLE 三種方法於不同施測題數中,施測人數 5460 人 與 8064 人的群體能力標準差之 RMSE 相近。
(二)不同施測題數之結果比較 1. 平均數
PV 方法於不同施測人數的情境中,施測題數於 15 題之群體能力平均數之 RMSE 較 30 題小,且在其他四種估計方法(PV_NoAV、EAP_AV、EAP 與 MLE)
2. 標準差
在 PV 與 PV_NoAV 兩種方法於施測人數 8064 人學校 B 的變項中,施測題數 於 30 題之群體能力標準差之 RMSE 較 15 題小;但在其餘情境中,施測題數 15 題與 30 題的群體能力標準差之 RMSE 相近。
在 EAP_AV、EAP 與 MLE 三種方法於不同施測人數的情境中,施測題數於 30 題之群體能力標準差之 RMSE 較 15 題小。
(三)不同估計方法之結果比較 1. 平均數
於施測題數 15 題、施測人數 5460 人的學校 A 變項、施測題數 15 題、施測 人數 8064 人的學校 B 變項與施測題數 30 題、施測人數 8064 人的學校 B 變項中,
五種估計方法群體能力平均數之 RMSE 以 PV、PV_NoAV、EAP_AV 與 EAP 最 小且四種方法估計結果相近,而 MLE 的群體能力平均數之 RMSE 最大。
於施測題數 15 題、施測人數 5460 人的學校 B 變項、施測題數 15 題、施測 人數 8064 人的學校 A 變項與施測題數 30 題、施測人數 5460 人的學校 A、B 變 項中,五種估計方法群體能力平均數之 RMSE 以 EAP 最小,而 PV、PV_NoAV、
EAP_AV、MLE 的群體能力平均數 RMSE 最大且四種方法估計結果相近。
於施測題數 30 題、施測人數 8064 人的學校 A 變項中,五種估計方法群體能 力平均數之 RMSE 相近。
2. 標準差
於施測題數 30 題、施測人數 8064 人的高社經地位變項中,五種估計方法群 體能力標準差之 RMSE 由小至大依序為 PV、PV_NoAV、EAP_AV 與 EAP(兩種 方法估計結果相近)、MLE;但在其餘情境中,五種估計方法群體能力標準差 PV 與 PV_NoAV 的 RMSE 最小且兩種方法估計結果相近,其次為 EAP_AV 與 EAP 且兩種方法估計結果相近,最後為 MLE。
圖 4-5 群體能力平均數於學校變項與 complete 設計之 RMSE
圖 4-6 群體能力標準差於學校變項與 complete 設計之 RMSE
三、父母親社經地位變項與學校變項之結果比較
本研究實驗設計中將父母親社經地位高、低之平均能力差設定為 1.414,學 校 A、B 的平均能力差為 0.000,透過兩背景變項不同平均能力差異,暸解群體
差異大小是否影響估計結果。
1. 平均數
在 PV_NoAV 與 EAP 方法於不同情境設定中(題數與人數),群體差異小的 變項中(學校),群體能力平均數之 RMSE 較小,群體差異大的變項中(社經地 位),群體能力平均數之 RMSE 較大。
EAP_AV 方法於不同情境設定中(題數與人數),群體差異小(學校)與群 體差異大兩種變項中群體能力平均數之 RMSE 相近。
PV 方法於大部分的情境設定中,群體差異小(學校)與群體差異大兩種變 項中群體能力平均數之 RMSE 相近。
MLE 方法於施測題數 30 題、施測人數 5460 人的情境中,群體差異小(學校)
與群體差異大兩種變項中群體能力平均數之 RMSE 相近,但在其他情境中,群體 差異小的變項中(學校),群體能力平均數之 RMSE 較小,群體差異大的變項中
(社經地位),群體能力平均數之 RMSE 較大。
(社經地位),群體能力平均數之 RMSE 較大。