第四章 以電腦模擬量化專家意見
第一節 專家意見服從常態分配
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
26
第四章 以電腦模擬量化專家意見
由於台灣對於生育率的專家意見並沒有留下完整的收集和量化過程記錄可 供參考。本章我們借助電腦模擬的實驗,以專家意見服從常態分配、均勻分配和 二元常態分配下,模擬不同情境下可能收集到的專家意見資料型態(單一預測值、
一預測區間、願付卡和願付價格),以不同的統計方法比較量化效果。
第一節 專家意見服從常態分配
本節中假設專家意見為來自獨立且同態的常態分配隨機變數,為了計算方便 我們假設專家人數為 10 人,常態分配的平均數1.5,標準差 0.2。亦即
~ ( 1 . 5 , 0 . 2 ) , i 1 , 2 , . . . , 1 0
iid
Xi N (4-1)
情境一:單一預測值
當資料型態為單一預測值時,代表每位專家皆可清楚的指出自己認為的未來 某一時間點之生育率估計值,假設每位專家提供之參數值為來自相同常態分配的 獨立隨機變數(Independently and Identically Normal Distributed Variable)。
Method1-1:以動差估計量(MME)來估計, 。 Method1-2:以最小平方估計量(LSE)來估計 , 。
Method1-3:以無母數 trimean 方法估計,以全距除以某個常數(constant, c )和1 四分位距除以另外一個常數(constant, c )的加權平均估計量估計2 。進行電腦模 擬時,我們設定專家人數為 10 人(n=10),由附錄可以得到c =3.070369,1 c = 2 1.16941。
‧
估計參數 Method1-1 Method1-2 Method1-3
ˆ
MSE Method1-1 Method1-2 Method1-3 MSE(ˆ) 0.00382 0.00453 0.00446 MSE(ˆ) 0.00225 0.00220 0.00272
由表 1 可以看出在常態分配的假設下,三種估計量對的估計值皆為不偏估 計量,的估計標準誤(standard error;s.e.)也很接近; 的估計值 Method1-1 與 Method1-3 為不偏,Method1-2 有些微偏誤, 的標準誤 Method1-1 和 Method1-2 差不多,Method1-3 最大。由表 2 可以看出 Method1-1 對的估計量最好,
估計參數 Method1-1 Method1-2 Method1-3
0.946 0.955 0.934
‧
估計參數 Method1-1 Method1-2 Method1-3 n=5 ˆ
Method2-3.1:取區間資料中位數視為樣本,以無母數 trimean 方法估計,以全 距除以某個常數(constant, c )和四分位距除以另外一個常數(constant, 1 c )的加權2
‧
估計參數 Method2-1.1 Method2-2.1 Method2-3.1
~ (a, b)
‧
MSE Method2-1.1 Method2-2.1 Method2-3.1
~ (a, b)
‧
估計參數 Method2-1.1 Method2-2.1 Method2-3.1
~ (a, b)
Method2-3.2:取區間資料中位數視為樣本,以無母數 trimean 方法估計,以全 距除以某個常數(constant, c )和四分位距除以另外一個常數(constant, 1 c )的加權2
‧
估計參數 Method2-1.2 Method2-2.2 Method2-3.2
1, 2 ~ (a, b)
MSE Method2-1.2 Method2-2.2 Method2-3.2
1, 2 ~ (a, b)
‧
Method2-1.2 Method2-2.2 Method2-3.2
1, 2 ~ (a, b)
‧
Method3-3:對區間的樣本取其 trimean 後與區間外樣本進行合併估計,以全距 除以某個常數(constant, c )和四分位距除以另外一個常數(constant, 1 c )的加權平2 均估計量估計 。進行電腦模擬時,我們設定專家人數為 10 人(n=10),由附錄 可以得到c =3.070369,1 c = 1.16941。 2
表 11、情境三三種方法的估計值(常態分配)
估計參數 Method3-1 Method3-2.1 Method3-2.2 Method3-3
ˆ
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
35
表 12、情境三三種方法的 MSE(常態分配)
MSE Method3-1 Method3-2.1 Method3-2.2 Method3-3 MSE(ˆ) 0.00346 0.00449 0.00377 0.00552 MSE(ˆ) 0.00176 0.00233 0.00258 0.00312
表 13、情境三三種估計方法的涵蓋率(常態分配)
估計參數 Method3-1 Method3-2.1 Method3-2.2 Method3-3
0.945 0.943 0.949 0.948
0.900 0.907 0.905 0.898
由表 11 可以看出三種估計方法對的估計值皆為不偏,對 的估計三種方 法都有低估的情形。表 12 可以看出 Method 3-1 的 MSE(ˆ)最小,Method 3-3 最 大,MSE(ˆ)也有一樣的情形。表 13 可以看出三種估計的涵蓋率都有 90%以上。
由表 14 可以看出,Method3-1 因為使用完全截尾資料,故越偏離 1.5 產生 的偏差越大;Method3-2.2 雖然較 Method3-2.1 有較小的標準誤,但有產生更多 偏誤的風險;Method3-3 的的估計是偏誤較小的, 的估計值在偏離 1.5 很 多的情況下會有很大的估計誤差。由表 15 的 MSE 可以看出 Method3-2.1 都會較 Method3-2.2 小。表 16 可以看出當的真實值越偏離 1.5,估計量涵蓋率越低,
估計量涵蓋率也有同樣的情形,但每種方法的情況不相同,Method3-1 和 Method4-1 兩種估計量的涵蓋率差不多,Method3-2.1 和 Method3-2.2 的估計量 涵蓋率比 估計量涵蓋率小很多。
‧
參數 Method3-1 Method3-2.1 Method3-2.2 Method3-3
=1.1 ˆ
MSE Method3-1 Method3-2.1 Method3-2.2 Method3-3
=1.1 MSE(ˆ ) 0.0357 0.0109 0.0224 0.0031
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
37
表 16、情境三固定人數(n=10)與標準差( =0.2)不同下三種方法的涵蓋率(常態分配)
估計參數 Method3-1 Method3-2.1 Method3-2.2 Method3-3
=1.1 0.076 0.031 0.000 0.397
0.089 0.317 0.077 0.301
=1.3 0.838 0.946 0.818 0.972
0.782 0.962 0.751 0.854
=1.5 0.987 0.983 0.979 0.978
0.917 0.907 0.905 0.898
=1.7 0.829 0.918 0.857 0.993
0.773 0.917 0.776 0.826
=1.9 0.064 0.025 0.000 0.541
0.081 0.329 0.113 0.297
當資料型態為願付卡,但專家意見的中心點( ) 與區間中位數有差異的情 況下三種方法都會產生偏誤。在這個問題上,可以藉由多次重複意見收集達到改 善。例如第一次問卷只有 5 位專家選擇區間內,剩下的專家認為比區間最小值小,
或是比區間最大值大,則第二次設計問卷時的區間可以視上次問卷結果將區間進 行調整(平移)設計出新的願付卡區間。
情境四:願付價值
此情境是應用了願付價值(Willingness to Pay)以順序提問法進行推估。在此 情境下每位專家每次會被問一個詢問值(inquiry value),由專家認為實際值大於或 小於詢問值,每位專家問一次,則依專家人數不同(5,10,15,20)進行 1000 次電腦 模擬。
Method4-1:取最後一個詢問值。
Method4-2:取最後三個詢問值的平均。
Method4-3:取最後五個詢問值的平均。
由表 17 和表 18 可以看出專家人數只有五人時,ˆ都會有偏誤,其中 Method 4-1 會產生較多的偏誤,而 Method 4-3 偏誤最小,另外 MSE 也是 Method 4-1 最
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
39
表 19、情境四三種方法的涵蓋率(常態分配)
專家人數 涵蓋率 Method4-1 Method4-2 Method4-3 n=5 0.991 0.874 0.899 n=10 0.946 0.966 0.947 n=15 0.954 0.957 0.965 n=20 0.963 0.962 0.949 n=30 0.958 0.960 0.961
圖 7、一次模擬的第 k 次詢問值分佈(常態分配)
0 5 10 15 20 25 30
1.21.41.61.82.02.2
順 序 提 問 法 的 詢 問 值 變 化 情 形 (常 態 分 配 )
k-th inquiry
TFR
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
40
圖 8、第 k 次詢問值盒鬚圖(常態分配)
圖 9、第 k 次詢問值預測區間的涵蓋率(常態分配)
各 詢 問 值 盒 鬚 圖 (常 態 分 配 )
0 5 10 15 20 25 30
0.00.20.40.60.81.0
涵 蓋 機 率 (常 態 分 配 )
k-th inquiry
Coverage Probability
M4-1 M4-2 M4-3
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
41
本節的最後,以 bias、variance、MSE 和涵蓋率等不同角度分析各種情境下 對最適合的量化方式。總體而言,資料型態為單一預測值,以 MME 或 LSE 的 估計效果較無母數方法(trimean)好;資料型態為預測區間,模型 1 的情況下與單 一預測值相同,模型 2 的情況下,估計量會受到區間長度越長而產生越大的偏誤,
其中 LSE 估計量會比 MME 估計量好。理論原理是 MME 容易受離群值影響,模 擬的結果符合這個理論。但兩種方法均較無母數方法好;資料型態為願付卡,若 專家意見的中心點與區間中位數差不多時,仍然是 MME 和 LSE 法有較好的估 計結果,但當區間中位數與專家意見的中心點有差異時,無母數方法 trimean 提 供了相對可靠的推估結果;資料型態為願付價格,只要專家人數超過 15,最後 的詢問值都會收斂,取最後五個詢問值平均為較好的估計方法