國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
第参章、電腦模擬分析
由於死亡資料大多為整數資料,本文除比較SD(M+)與NM的差異與優缺點外,
亦希望能夠比較整數資料與精確至小數點以下一位的死亡資料,對於M與標準差 的估計有何差異。然而由於使用的資料形態,後續文章將對整數資料得到的M估 計值增加0.5個單位,而小數資料者增加0.05個單位。而對於標準差的估計便不做 更動。
本研究之電腦模擬乃使用R統計軟體,希冀藉著電腦模擬比較SD(M+)與NM 的差異與優缺點。設定十萬筆死亡年齡的隨機亂數,在不同的分佈設定下,反覆 一千次的模擬,比較不同的估計範圍,對方法估計值的影響與其偏誤程度,並比 較各種方法95%信賴區間涵蓋真實參數之覆蓋機率(Coverage Probability)。
本章分為四部分,第一部分為常態分配下的模擬結果比較;第二部分為羅吉 斯曲線的模擬結果比較;第三部分則為錯誤設定時的敏感度分析;第四部分為比 較修勻資料與未經修勻資料的結果差異。
第一節 常態壽命區間假設
首先,使用R產生十萬筆來自常態分配,平均數80且標準差為10的亂數,下 圖則是當樣本數為十萬時,對應到不同的k時,各種方法M估計值之期望值之比 較:
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
11
圖 3-1、不同 k 值時各方法 M 估計值比較
上圖中虛線部分為各方法之95%信賴區間,由上圖可以發現,使用整數觀測 值所產生之NM估計值最為準確,而小數點以下一位的資料稍為高估M值,而觀 測值校正法大約低估了0.5個單位,且變異較大;在圖3的右圖中雖無法精確看出 整數資料NM與小數點一位資料NM方法變異數差異,但從左圖中可以得知其變 異數將隨著k變大而變小。綜合上述偏誤性與變異數比較,可得下圖MSE之比較:
圖 3-2、不同 k 值時各方法 M 估計值之 MSE 比較
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
估計Modal Age時,經過平移的整數資料估計值與小數點以下一位資料有較 小的MSE,而傳統的觀測值方法雖然偏誤與整數資料的方法差不多,但由於其變 異數較大,因此MSE是三者中表現最差。而其覆蓋機率如下表所示:
表 3-1、各方法 M 估計值覆蓋機率比較
方法 整數資料+0.5 小數點以下一位 觀測值校正法
覆蓋機率 0.950 0.962 0.931
雖然觀測值校正法不論在偏誤性與變異數大小甚至是MSE的表現都明顯劣 於其他兩者,然而此方法的覆蓋機率卻與其於兩者沒有太大的差異,產生如此的 現象,也因為觀測值內插的方法有著較大的變異數,因此其95%信賴區間也是三 者中最大的。而各方法對於死亡分佈之標準差估計如下圖所示:
圖 3-3、不同 k 值時各方法標準差估計值比較
SD(M+)所使用的範圍是從M到M+2k做估計,其餘兩種方法則是從M-k到 M+k,也由於SD(M+)的範圍設定,因應近年來許多國家的Modal Age皆已經達到 約90歲的水準,若選擇k超過10,則SD(M+)所需要的範圍之上界已經超過HMD
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
13
上資料的年齡上限110歲,因此選擇k從5到10。
從上圖可以發現,SD(M+)所估計出來的標準差值,會隨著k而變大,其變異 數也隨著k而變大,但仍無法精準估計標準差值,其餘兩者皆在真實值附近,且 其變異數相較於SD(M+)小了許多。小數點下一位資料的方法,雖然會略為低估 標準差值,然而其95%信賴區間亦有涵蓋,真實之標準差值。綜合上述兩者可得 各方法之MSE比較圖:
圖 3-4、不同 k 值時各方法標準差估計值之 MSE 比較
由於SD(M+)在k值很小時的偏誤性較大,雖然其估計值之變異數會隨著k值 而變大,但是主要貢獻MSE過大的主因仍是其偏誤性過高。而其覆蓋機率如下表 所示:
表 3-2、各方法標準差估計值覆蓋機率比較
方法 整數資料 小數點以下一位 SD(M+)
覆蓋機率 0.938 0.904 0
雖然經過平移的整數資料在估計M值時,雖然其覆蓋機率略為低於小數點以
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
下一位資料,然而若是在比較標準差時,其表現便稍優於小數點以下一位者,而 SD(M+)由於其偏誤過高,即便其變異數是三者最大,但也沒有辦法涵蓋真實參 數值。