第五章 模擬研究結果與討論
第二節 八組公式之模擬結果比較
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
44
第五章 模擬研究結果與討論
根據第二章歸納整理出有關四分位數之八組公式,將藉由模擬實驗的方式來 進一步了解這八組公式在不同資料結構分配下的適用性。第一節為模擬方法說明
,第二節八組公式之模擬結果比較。
第一節 模擬方法
在第三章已透過數學證明的方式推論八組公式之結果相同及相異的情況。若 欲探討此八組公式的適用性,我們將藉由模擬實驗的方式來進行評比。在假設原 始資料分別來自不同形式分配的情況下,我們將分別就各種公式所得出四分位數 估計值的好壞作探討。我們所考慮的資料原始分配包含五種右偏程度不一的分配,
包括卡方分配自由度 1﹐5﹐10 ( )﹐ ( )﹐ ( ) (圖 5﹣1﹣1)、指數分配 ﹐ 的型式(圖 5﹣1﹣2)以及平均數為 100﹐標準差為 10 的常態分配這一種對稱的型式(圖 5﹣1﹣3)。評估指標為偏誤(Bias)、標 準差(SD)與均方根誤差(RMSE)及平均相對誤差百分比 ( AvRE )。
圖 5-1-1 卡方分配: ( )﹐ ( )﹐ ( )
圖 5-1-2 指數分配:Exp( = ,15) 圖 5-1-3 常態分配:平均數 100,標準差 10
‧
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
47
(四)平均相對誤差百分比(AvRE):
1 0 0 1 ˆ
A v R E
1
n j
j
n
﹪
n : 模擬次數
ˆ : j 第 j 次模擬所得到的估計值 : 真實值 真實四分位數值
由前述可知評估指標(一)~(三)為絕對誤差,
絕對誤差 估計值-真實值 而
相對誤差 估計值-真實值 真實值
由於以相對誤差來判定估計值的誤差量較為客觀,所以在接下來的討論中 也會以平均相對誤差百分比進行評估。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
48
第二節 八組公式之模擬結果比較
在第三章已證明過八組公式之數學特性,現在透過模擬方式驗證確實如此。
但真正在估計的表現取決於分配型式,亦即不同的統計量在不同的分配情況下會 有不同的結果,此無法用數學方式證明,所以必須透過模擬方式加以驗證。
模擬結果與分析:
由於模擬結果顯示出八組公式在大樣本時註 17的表現差異不大,僅在小樣本 時(N=40、41、42、43)呈現出明顯差異,且實務上常接觸小樣本,故在此僅就八 組公式在小樣本時偏誤、標準差、均方根誤差的表現情形作討論。
模擬結果將分為下列兩種情況來進行說明:
一、將依 Bias(Q1)、Bias(Q3)、Bias(IQR)、SD(Q1)、SD(Q3)、SD(IQR)、
RMSE(Q1)、RMSE(Q3 ) 、RMSE(IQR)、AvRE( Q1 )、AvRE( Q3)、AvRE(IQR) 之順序,在樣本數(N=40、41、42、43)及六種不同資料分配下分別呈現出四 項評估指標的結果,並就其指標結果來分析八組公式之特性。
二、針對不同樣本數及不同資料分配的情況下,依據四項評估指標評比出表現最 好的公式。
註 17:大樣本的模擬結果放在附錄 1 中。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
49
(一) 八組公式在樣本數(N=40、41、42、43)及六種不同資料分配下,分別就四 項評估指標結果來進行分析。
1、Bias(Q1)
由圖 5-2-1~5-2-6 觀察整理如下:
八組公式在 Q1情況下,僅針對結果不相同部分,總計可歸納出四類不同公 式及兩種不同結果:
N=40、41、42 時:Q1(公式三)>Q1(公式二)>Q1(公式一)>Q1(公式六)。
N=43 時:Q1(公式三)>Q1(公式二)>Q1(公式一)或 Q1 (公式六)。
隨著分配不同加上公式本身特性,同一公式有可能呈現出高估或低估的結果。
圖 5-2-1 偏誤–Q1– 卡方分配(自由度 1)
圖 5-2-3 偏誤–Q1– 卡方分配(自由度 10) 圖 5-2-2 偏誤–Q1–
卡方分配(自由度 5)
圖 5-2-6 偏誤–Q1–常態分 配(平均數 100,標準差 10) 圖 5-2-4 偏誤–Q1–
指數分配( 係數 10)
圖 5-2-5 偏誤–Q1– 指數分配( 係數 15)
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
50
( 1) 卡方分配
○1 ( ):由前述可知公式三在四類不同公式中表現為最大,故以此為基準與其 他公式相比較。所以公式二( = 、公式一 = 比公式三
= 少 、 的估計量,且由圖 5-2-1 可觀察出公式三與公式二、公
式一之差異差不多以 1:2 的比例減少高估量,因而呈現出高估逐漸下降的情形。
接著,由於公式六( = ) 在計算四分位數時,遇到小數則無條件捨去,
與公式一 = 相較之下,因少了小數部分之計算,且隨著不同樣本數(N
=40、41、42)情況下,公式六比公式一少了 、 、 的估計量,因此比較容易產 生較小的估計值,甚至可能導致「低估」的現象。雖然如此,公式六的值與 0 非常接近,所以在八組公式中的表現反而較佳,因此在卡方分配(自由度 1)的情 況下,公式六捨去小數反而是一件好事。(詳細說明參考附錄 2–1~2–3)
○2 ( ):隨著資料結構偏移關係,八組公式的偏誤量明顯較 ( )增加,及在 不同的樣本數之下,公式之間不同的差異比例,導致公式一在 N=40、42 的偏誤 量由高估( ( ))變成低估( ( ))的情形。雖然如此,由圖 5-2-2 可知公式一比公 式六更精確接近真實第一四分位數且非常接近 0,所以兩者比較起來,公式一在 Bias(Q1)的表現比公式六好,在八組公式中的表現最佳。(詳細說明參考附錄 2–
4~2–7)
( ):隨資料結構偏移關係,八組公式的偏誤量明顯較 ( )、 2(5)增加許 多(可能更高(低)估或由高(低)估變低(高)估),並在不同的樣本數之下、公式之間 不同的差異比例,及因為某些公式的計算結果相同,導致低估的公式隨之增加。
例:當樣本數 N=43 時,公式一的偏誤量由高估變成低估,且公式一、四、五、
六、七的結果相同。因公式七在樣本數為奇數時採用公式一,而公式五與公式七
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
51
的結果相同,所以公式五、七也產生低估的情形。(詳細說明參考附錄 2–8~2–11)
( 2 ) 指數分配
在 =10、 =15 的高、低估結構相同,但可能隨資料結構偏移關係,八組公式 的偏誤量跟著增加,及在不同的樣本數之下,公式之間不同的差異比例,導致公 式六低估的情形越來越嚴重。(詳細說明參考附錄 2–12~2–15)
( 3 ) 常態分配
○1 由於某些公式在相同樣本數之下的計算結果相同,導致八組公式之低估現象 較普遍。例:N=43 時,公式一、四、五、六、七皆為「低估」的情形。由圖 5-2-6 可觀察出公式三與公式二、公式一之差異差不多以 1:2 的比例減少高估量,因 而呈現出高估逐漸下降的現象,甚至可能產生「低估」的情形。(詳細說明參考 附錄 2–16~2–19)
○2 N=40、41、42 時,公式三與公式二、公式一、公式六之差異,固定差不多 以 : : 、 : :1 及 : : 的比例減少高估量,導致公式一、公式六低估的 情形越來越嚴重。(詳細說明參考附錄 2–16~2–19)
( 4 ) 綜合表現
○1 由圖 5-2-1~圖 5-2-6 觀察出在不同樣本數 N=40、41、42、43 的情況下,公 式三與公式二、公式一、公式六之差異,差不多以 1:2:3、1:2:4 、1:2:5 及 1:2:2 的比例減少高估量,甚至可能產生低估的情形。
【註】:公式三與公式二、公式一、公式六之差異比例與定理五的證明結果相同。
○2 由圖 5-2-1~圖 5-2-6 觀察出偏誤在六種分配之第一四分位數情況下,當樣本 數 N=40、42 時,公式二、四、五、七、八結果相同;樣本數 N=41 時,公式 一、五、七結果相同及公式三、四、八結果相同;最後,在樣本數 N=43 時,公 式一、四、五、六、七結果相同;公式三、八結果相同。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
52
1-1、Bias( 3)
由圖 5-2-7~5-2-12 觀察整理如下:
八組公式在 Q3情況下,僅針對結果不相同部分,總計可歸納出四類不同公 式及四種不同結果:
N=40 時: (公式一)> (公式二)> (公式三)> (公式六)。
N=41 時: (公式一)> (公式二)> (公式三)或 公式六)。
N=42 時: (公式一)> (公式二)或 (公式六)> (公式三)。
N=43 時: (公式一)或 (公式六)> (公式二)> (公式三)。
隨著分配不同加上公式本身特性,同一公式有可能呈現出高估或低估的結 果。
圖 5-2-7 偏誤–Q3– 卡方分配(自由度 1)
圖 5-2-8 偏誤–Q3– 卡方分配(自由度 5)
圖 5-2-9 偏誤–Q3– 卡方分配(自由度 10)
圖 5-2-10 偏誤–Q3–
指數分配( 係數 10)
圖 5-2-11 偏誤–Q3– 指數分配( 係數 15)
圖 5-2-12 偏誤–Q3–常態 分配(平均 100,標準差 10)
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
53
( 1 ) 卡方分配
○1 2(1):由前述可知公式一在四類不同公式中表現為最大,故以公式一為基準與 其他公式相比較。所以公式二 = 、公式三 = 比公
式一 = 少 、 的估計量,且由圖 5-2-7 可觀察出公式一與公式二、
公式三之差異差不多以 1:2 的比例減少高估量,因而呈現出由高估變成低估的 情形,甚至低估的情形更嚴重。接著,由於公式六( = ) 在計算四分位 數時,遇到小數則無條件捨去,與公式一( = 相較之下,因少了小數部 分之計算,且隨著不同樣本數(N=40、41、42)情況下,所以公式六比公式一少
、 、 的估計量,因此比較容易產生較小的估計值,甚至可能導致「低估」的 現象。但由圖 5-2-7 看出公式三最接近真實第三四分位數且非常接近 0。另外,
因某些公式的計算結果相同,所以產生低估的公式亦隨之增加。(例:N=41,公 式三、四、六、八的結果相同)。(詳細說明參考附錄 2–20~2–23)
○2 2(5):隨自由度的增加,八組公式的偏誤量大部分都增加(可能更高(低)估或 由高(低)估變低(高)估),且八組公式本來在 2(1)的低估現象較少,但可能因為隨 著資料結構偏移關係,在不同的樣本數之下、公式之間不同的差異比例,及因為 某些公式的計算結果相同,導致低估的公式也隨之增加。例:N=40,公式二、
四、五、七、八,其偏誤量由高估( 2(1))變成低估( 2(5))。所以 2(5)時低估現象較 普遍。同理,N=42 也是相同情形。(詳細說明參考附錄 2–24~2–27)
○3 2(10):八組公式的偏誤量明顯較 ( )、 2(5)增加許多。另外,可能隨著資料 結構偏移關係,及在不同的樣本數之下,公式之間不同的差異比例,導致公式二、
四、五、六、七、八在 N=42 的偏誤量由低估( 2(5))變成高估( 2(10));並由圖 5-2-9 看出公式二、四、五、六、七、八的值很接近 0,所以在八組公式中的表現較佳。
(詳細說明參考附錄 2–28~2–31)
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
54
( 2 ) 指數分配
○1 =10:由於 =10 與 2(1)的資料結構類似,及在不同的樣本數之下,某些公 式之間有相同的差異比例,導致八組公式中產生低估的結構相同,只不過 =10 的偏誤量較 2(1)高。(詳細說明參考附錄 2–32~2–35)
○2 =15:隨自由度增加到了 =15 時,其偏誤量明顯增加(可能更高估或更低 估)。不過,可能隨著資料結構偏移關係,及在不同的樣本數之下,公式之間的 差異比例,導致公式三、八在 N=43 的偏誤量由低估( =10)變成高估( =15)
的情形。並由圖 5-2-11 看出公式三、八的值非常接近 0,所以在八組公式中的表 現較佳。(詳細說明參考附錄 2–36~2–39)
( 3 ) 常態分配
由於某些公式在相同樣本數之下,有相同的差異比例,導致計算結果相同,所以 八組公式之低估現象較普遍。例:N=41 時,公式三、四、六、八的結果相同皆 為低估。(詳細說明參考附錄 2–40~2–43)
○1 在 N=41 時,公式二( = )比公式六( = )多 的估計量,所 以有可能減少低估量但仍產生低估,並由圖 5-2-12 看出公式二比公式六更接近 0,所以表現較佳。
○2 在 N=42 時,公式二( = )比公式一( = )少 的估計量,如此 有可能增加低估量,而產生「低估」現象。同理,公式三( = )又比
公式一少 估計量,導致公式三低估的情形更嚴重。
○3 在 N=43 時,由圖 5-2-12 看出,雖然公式六為高估但很接近 0,而公式二 ( = )比公式六( = )少 估計量,如此有可能增加低估量,而產 生「低估」現象。同理,公式三( = )又比公式六( = )少 估 計量,更容易產生低估且低估的情形更嚴重。並由圖 5-2-12 看出公式三、八在八
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
55
組公式中的表現較差。
( 4 ) 綜合表現
○1 由圖 5-2-7~5-2-12 觀察出在不同樣本數 N=40、41、42 時,公式一與公式二、
公式三、公式六之差異,差不多以 1:2:3、1:2:2 及 1:2:1 的比例,減少 高估量,甚至可能產生低估的情形,同理,N=43 時,公式一(或公式六)與公式
公式三、公式六之差異,差不多以 1:2:3、1:2:2 及 1:2:1 的比例,減少 高估量,甚至可能產生低估的情形,同理,N=43 時,公式一(或公式六)與公式