台灣百年地震損失與模擬
講者:財金碩一 R98723067 江易燊 電信碩二 R97942121 林宜鴻
2010/01/06
大綱
一、研究動機
二、資料來源
三、模型建立
四、模擬預測
五、研究結果
六、未來展望
研究動機
台灣地震損失資料不十分齊全。
現存最完整的損害資料:
◦ 中央氣象局的地震災害房屋倒塌數
◦ 台灣某年的房價成交金額
希望能用數學模型來描述地震損失
◦ 可用於建立地震保險的相關資料
◦ 可計算地震保險保費
資料來源
以 1900~1999 百年來的地震資料為樣本。
◦ 來自中央氣象局,共 88 筆
◦ 排除掉短時間內連續餘震(如相差數十秒不到)
◦ 短時間內連續餘震採用損失相加的方式歸類
◦ 財產損失只計算「房屋」倒塌的損失
◦ 只計算「全倒 + 半倒」房屋的損失
A. 地震資料
資料來源
B. 人口資料
以 1901~2006 百餘年來的人口資料為樣本。
◦ 1905~1943 年人口資料:
來自《臺灣省五十一年來統計提要》
◦ 1949~2006 年人口資料:
來自《台灣社會變遷全記錄》
◦ 1901~1904 年的人口使用外插法估計
◦ 1944~1948 年的人口使用內插法估計
資料來源
使用 2008 年 Q1~Q4 台灣地區房價資料
◦ 來自內政部地政司全球資訊網
◦ 使用台灣 21 個縣市的房價資料
◦ 將台北市排除
◦ 每個縣市中,抽取約三分之一人口密度較高的 鄉/鎮/市/區
ex: 台北縣取新店市、中和市,但不取萬里鄉
C. 房價資料
資料來源
資料來源
總體模型
一次地震的損失:倒塌房價的總和
一段週期間的總損失,如一年:所有地震損失之和
為一個複合分配
S
1 2 ... C
X P P P
X C P
為損失金額 為倒塌屋數為房價
1 2
1 1 1
... i
N N C
N i ij
i i j
S X X X X P
S N
為總損失為該週期的地震次數 , , N C P
估計 三個分配
總體模型
估計固定週期發生地震頻率的分配 估計固定週期發生地震頻率的分配
估計每次地震倒塌房屋數量的分配 估計每次地震倒塌房屋數量的分配
估計每棟房屋價格分配(預測損失)
估計每棟房屋價格分配(預測損失)
地震頻率
地震發生頻率之模型建立
◦ 統計直觀而言,在連續的時間內發生的不連續事 件(地震),應該會呈現一 Poisson 分佈。
Question : Poisson 的時間區間該取多大?
◦ Poisson :計算某段時間區間內發生特定事件的次 數,即為觀察到的 λ !
...
2 , 1 , 0
! , )
(
k
k k e
p
k
地震頻率
思考:
◦ 取時間區間為一年,似乎很符合直觀
◦ 但考慮地震發生的特性,可能兩三年才會發生一 次災難性地震,若取一年期為觀察區間,容易
觀
察到太多 0 次的樣本,而影響到後續的參數分 析
◦ 故取時間區間為兩年,會比一年來得好
◦ 即 Poisson 分佈中的 λ≡ 每兩年期間內發生地震
一年期的 Poisson 地震頻率模型
地震頻率模型
Chi-Square 檢定
檢定離散分配中,已分組樣本與特定離散分配之 間的契合度
X2 = Chi-Square 統計量
Oi = 觀測到的頻率
Ei = 理論上的頻率
一年期的 Poisson 地震頻率模型
地震次數 觀測次數 期望值
0 53 41.478291
1 26 36.500896
2 13 16.060394
3 2 4.711049
4 2 1.036431
5 2 0.182412
6 0 0.026754
7 0 0.003363
8 0 0.000370
9 0 0.000036
2
88 /100 0.88 172.9( Wrong )
一年期的 Poisson 地震頻率模型
需注意合併資料,直到每組期望值都超過 5
結果依然不甚理想
地震次數 觀測次數 期望值
0 53 41.478291
1 26 36.500896
2 13 16.060394
3+ 8 5.960418
2 2
(2,0.05)
88 /100 0.88
7.502548 > 5.991
兩年期的 Poisson 地震頻率模型
兩年期的 Poisson 地震頻率模型
兩年期較為接近 Poisson
地震次數 觀測次數 期望值
0 12 8.602243
1 16 15.139948
2 12 13.323154
3 2 7.816250
4+ 8 5.118404
2 2
(3,0.05)
88 / 50 1.76
7.472632 < 7.815
倒塌房屋
全倒的房屋數,大部分為少量居多(如幾十棟),
但偶爾會出現龐大的倒塌量(如 921 大地震倒塌 十萬 棟以上)。
故其累積分配會呈現極端的『 Γ 』形狀。
若先將房屋倒塌數取自然對數,則可得到較為正 常的機率分佈圖,如下頁:
原始倒塌房屋分配
對數倒塌房屋
房屋倒塌數的模型建立
◦ ln( 經人口調整後的房屋倒塌數 ) ?
◦ 但若該次地震倒塌 0 棟房子,則取 ln 後會出問題
…
∵ln(0)=-∞
◦ 解決方法:
使用 ln( 經人口調整後的房屋倒塌數 +n) , n 為我 們
選定的一個很小的常數(例如 4 )
◦ n 如何取?
選定 3~8 的常數,使得 K-S 值最小 ( 其實差異不
大 ) 21
對數倒塌房屋分配
對數倒塌房屋模型
接前頁之分析,我們以 ln( 經人口調整後的房 屋倒塌數 +n) 為主要分析的變數對象
◦ 令 Y=ln( 經人口調整後的房屋倒塌數 +n)
◦ 則 Y 會呈現什麼樣的分佈?
◦ Y 可能的分佈: Exponential Distribution Lognormal Distribution Weibull Distribution Other Distributions…
哪一個會最接近資料分布?
◦ 用 MLE 嘗試可能的模型,並利用畫圖和 K-S 檢 定。
對數倒塌房屋模型
Kolmogorov–Smirnov test ( K-S 檢定)
◦ 鑑定樣本資料與某特定分配間的契合度
◦ K-S 檢定統計量 =
為樣本資料的累積分配函數
為目標欲鑑定的分配之累積函數
) (x F
) (x Fn
對數房屋倒塌模型分析 Exponential
Match
對數房屋倒塌模型分析 Lognormal M
atch
對數房屋倒塌模型分析 Weibull Mat
ch
對數房屋倒塌模型分析 Weibull
Weibull 分配機率密度函數
利用 Maximum Likelihood Estimate
K-S 檢定:
對數房屋倒塌模型會滿足 Weibull
1 ( / )
( ) 0
( )
0 0
: :
k x k
k x e x
f x
x K Shape Scale
1.8830 5.3087 K
(88,0.025)
0.0709 0.14274
D KS
修正倒塌房屋模型
以房屋倒塌數為損失估計的重點
◦ 1920 年倒塌 100 棟房屋的意義與 2008 年倒塌 100 棟
房屋的意義相同嗎?
◦ 假設房屋建築品質具有時間上的同質性
◦ 則房屋倒塌數明顯需要經過人口密度調整
◦ 假設台灣面積不變,人口密度的比例即可看成為 總人口數的比例
◦ 以 2006 年年底的人口密度為 1 (基準),其他年 份
的人口密度再以比率換算
總體模型 ( 修正 )
估計每兩年中發生地震頻率的分配 估計每兩年中發生地震頻率的分配
每次地震全倒的房屋數量分配 每次地震全倒的房屋數量分配
全倒的房屋數量分配用人口數調整 全倒的房屋數量分配用人口數調整
全倒房屋數量取自然對數 全倒房屋數量取自然對數
估計每棟房屋價格分配(預測)
經人口調整後房屋倒塌模型分析
經人口調整後房屋倒塌模型分析
經人口調整後房屋倒塌模型分析
經人口調整後 Weibull 模型分析
Weibull 分配機率密度函數
利用 Maximum Likelihood Estimate
K-S 檢定:
經人口調整後的房屋倒塌模型亦滿足 Weibul l 分配!
1 ( / )
( ) 0
( )
0 0
: :
k x k
k x e x
f x
x K Shape Scale
2.039 k
6.579,
14274 .
0 D
0.0724
D
K-S(88,0.025)
房價分配
內政部網站上大約有 30000 筆房屋交易資 料,
依前述抽樣方法抽出約 10000 筆資料 ( 為 何選
取 1/3 ? ) ,檢視其是否合乎特定分配。
房價的平均數約為 560 萬
房價的中位數約為 450 萬
Claim :房價會是接近一個 lognormal 的分
全台房價分配
房價分配 Lognormal 模型
Lognormal 分配機率密度函數:
利用 Maximum Likelihood Estimate :
) 6407 .
0 ,
1099 .
6 (
~
LogN
P房價模型
分配參數回顧
分配參數
模擬一次代表兩年的損失
◦ 以 代表一年的損失,符合我們的直覺。
1 1 1
~ (1.76)
ln ~ (5.3087,1.8830) ln ' ~ (6.579,2.039) 2008 ~ log(6.1099,0.6407)
~ , ,
Ci
N N
i ij
i i j
S X P
N P C W C W P
S N C P compound
兩年地震發生頻率
一次地震房屋倒塌數
修正一次地震房屋倒塌數 年的房價
兩年區間的地震損失
S
100 年的未調整損失模擬
100 年的未調整損失模擬
= 236 = 4.6
= 8229
59.2%
= 5704
= 2 3550 VaR(0.05) = 834
CVaR(0.05) = 4022 VaR(0.01) = 8229 CVaR(0.01) = 8229
平均損失億
中位損失億 右偏分配 最大損失億 第二損失億 總損失的
總和損失 兆億
億 越接近尾端損失越大
億
億 只有100次,所以相等
億
400000 次的未調整損失模擬
400000 次的未調整損失模擬
= 1495 = 5.6
= 6484
18.18%
= 4394
= 59819 VaR(0.05) = 941
CVaR(0.05) = 2 8909 VaR(0.01) = 9081
CVaR(0.01) = 13 3513
平均損失億
中位損失億 右偏分配 最大損失兆 第二損失兆 總損失的 總和損失 兆
億 越接近尾端損失越大
兆億
億 越接近尾端損失越大
兆億
未調整損失模擬討論
在 100 年的模擬中,可以看出只有幾次會發 生特別大的損失,前兩次損失佔了百年損失 的 59.2% ,算是符合台灣地震的特性。
把模擬次數加到 40 萬次,則更容易看到一些 更極端的損失值。
中位數遠小於平均數,極端右偏的損失。
如果只考慮 VaR ,而不考慮 CVaR ,會遠遠低
估後尾所帶來的風險。
100 年的調整損失模擬
100 年的調整損失模擬
= 4032 = 25.3
= 15 6453
70.23%
= 12 6749
= 40 3200 VaR(0.05) = 1 6318 CVaR(0.05) =7 2510 VaR(0.01) = 15 6453 CVaR(0.01) = 15 6453
平均損失億
中位損失億 右偏分配 最大損失兆億 第二損失兆億 總損失的 總和損失 兆億
兆億 越接近尾端損失越大
兆億
兆億 只有100次,所以相等
兆億
400000 次的調整損失模擬
400000 次的調整損失模擬
= 1 40 = 19
= 30785
13.13%
= 23844
= 416060 VaR(0.05) = 5848
CVaR(0.05) =20 2542 VaR(0.01) = 6 8016
CVaR(0.01) = 93 5799
平均損失兆億
中位損失億 右偏分配 最大損失兆 第二損失兆 總損失的 總和損失 兆
億 越接近尾端損失越大
兆億
兆億 越接近尾端損失越大
兆億
調整損失模擬討論
調整損失,和非調整損失有類似的特性,右 偏分配和可能會有一兩次的極大損失。
在調整損失過後,不管是模擬 100 或 40 萬 次,整體損失會上升數倍。
舉 40 萬次為例,平均損失上升 6.95 倍,中
位數上升 4.13 倍, CVaR(0.05) 和 CVaR(0.0
1) 上升 7 倍,可知越尾端的資料會往上調整
的越多。
研究結果
(a) 未經人口密度調整的房屋倒塌模型
(b) 經過人口密度調整的房屋倒塌模型
研究結果
未經人口密度調整的房屋倒塌數
可用 Weibull Distribution 描述其倒塌數分配
Weibull(λ, k)=W(λ =5.3087, k=1.8830)
K-S 檢定: D=0.0709< D(88,0.025)=0.14274
k=2 in Weibull Distr.
→ Rayleigh Distribution
(often use in mechanics, dynami- cs, especially in vibration)
研究結果
經過人口密度調整的房屋倒塌數
可用 Weibull Distribution 描述其倒塌數分配
Weibull(λ, k)=W(λ =6.579, k=2.039)
K-S 檢定: D=0.0724< D(88,0.025)=0.14274
更近似於
Rayleigh Distribution!
並且較合乎現實情況
研究結果
地震頻率分佈
可用 Poisson Distribution 描述其發生頻率
Poisson(λ)=P(λ =1.76)
Chi-Square 檢定: χ2 =7.473< χ2(3,0.05)=7.8 15
使用兩年期間隔時間,
更能符合現實情形
研究結果
房屋價格分佈
可用 Lognormal Distribution 描述其價格分佈
LogN(μ, σ)=LogN(μ=6.1099, σ=0.6407)
從全台 21 縣市內抽樣,以人口數多之鄉鎮為主
取 10000 筆資料做分析,
結果極度吻合 Lognormal 模型,如右圖
研究結果
模擬預測
模擬未來 100 次及 400000 次之結果
100 次:平均損失 4032 億,最大損失 15 兆 6453 億 元
400000 次:平均損失 1 兆 40 億
台灣 2008 年 GDP : 12.7 兆元
未來展望
應用在地震保險上:
◦ 此模型分析可用來計算地震險(房屋)的保險金
◦ 可用來預測未來數年內,地震造成房屋的總損失
Some Problem
◦ 地震具有區域性→應將房價分區(北中南東)
◦ 觀察者偏差:抽取的樣本與實際倒塌者是否一樣
◦ 房價資料:透天還是公寓?
◦ 人口密度調整,可否改進?(人口與房屋分佈可 能不同、人口調查與地震時間點差異)
◦
未來展望
房價指數 V.S. 物價指數
損失:房屋→房價指數
補償:金錢→物價指數(貨幣指數)
可延伸的研究主題
◦ 分區討論並建立各分區的個別地震、房價模型
◦ 模擬過程:先決定地震發生在哪區(歷史資料:
北 =0.1, 中 =0.3 , 南 =0.1, 東 =0.5 ),再 使用該區的
模型模擬並預測。
參考文獻
郭逸龍,「由統計分析方法估計台灣地 震損失」