兩階段最小平方法

第四章研究方法與實證模型

第二節兩階段最小平方法

Retallack and Ostendorf（2019）指出，當車流量較低時，其與交通事故發生數量之間呈現線性關係，而車流量較高時，交通事故數量則隨車流量之增長而以平方速度正向增加；另Martin（2002）則表明公路事故數量與每小時車流量呈正相關。由以上文獻可知，車流量確為預測事故數量之重要解釋變數。而Sager（2019）

於研究空氣汙染物對道路安全之影響時，亦因車流量變數所致內生性問題而以 IV 處理之。

由於本研究無法取得車流量相關資料，導致發生遺漏變數（omitted variable）

（2）IV 與誤差項無相關性，即 IV 須具外生性（exogeneity）。

風向與空氣汙染物濃度之間具相關性（Guerra，2006；Bondy et al.，2020；

行政院環保署，2020）。據本研究資料顯示，𝑃𝑀_2.5濃度確會隨風向改變而有所不

30行政院環保署（2019）指出臺灣境內細懸浮微粒（𝑃𝑀2.5）濃度貢獻比率中，車輛移動源約占 27.5%，與工業源並列排放來源之首。

同（如圖1 所示），而本研究亦繪製各空品區的𝑃𝑀_2.5濃度與風向之關係圖，如圖 2 所示。此外，亦有諸多文獻亦將風向做為空氣污染物濃度之 IV（Anderson，

2015；Deryugina et al.，2019；Bondy et al.，2020），因此本研究以風向（wind direction）

搭配空氣品質區³¹做為IV。

資料來源：本研究繪製

註：圖中各長條之上下界代表該風向濃度之最大值及最小值，中間粗線代表該風向濃度之中位數。

圖1 𝑷𝑴_𝟐.𝟓濃度與各風向之關係（全台）

31由於空氣汙染之流通會跨越縣市邊界，故環保署考量各地氣象條件、地形、汙染源分布特性、

汙染擴散情形後，將臺灣分成七大空氣品質區（以下簡稱空品區）及離島監測區，分別為：宜蘭、

中部、花東、竹苗、雲嘉南、高屏、北部空品區及離島監測區，各空品區中皆設有一至數個空氣品質測站。

資料來源：本研究繪製

圖2 𝑷𝑴_𝟐.𝟓濃度與各風向之關係（依空品區分類）

本研究分別參考Deryugina et al.（2019）及 Bondy et al.（2020）——皆以風向做為空氣污染物濃度 IV 之兩篇研究——將 IV 採不同設定。Deryugina et al.

（2019）探討空氣汙染對於中老年人健康與醫療支出之影響時，將美國境內所有空氣汙染監測站依其分布位置歸類至100 個群體中，再搭配指標函數（indicator function）與風向虛擬變數（dummy variable）之組合做為該研究之 IV；而 Bondy et al.（2020）意欲探究空氣汙染對犯罪事件之影響，遂將英國倫敦分為中央、東區、西區、南區及北區等五個地區，再搭配東風、西風、南風及北風等四種風向於各地區之每日吹拂時間比例，做為該研究IV。

由圖 2 可知，不同的空品區下，𝑃𝑀_2.5濃度與各風向之關係皆相異，因此本研究中所採第一種設定之IV（以下簡稱 IV1）為前述風向與空品區（包含離島監測區）所組成之虛擬變數組合。在IV1 設定中，空品區變數為虛擬變數型態，風向則依據其來向角度分為八大風向：北風、東北風、東風、東南風、南風、西南

風、西風、西北風等，亦屬虛擬變數。透過上述兩者所組成之虛擬變數組合，若 Kleibergen-Paap rk LM statistic 檢定之。即便能藉由此檢定得知是否存在相關性，

然仍須透過其他檢定俾驗證所選取IV 是否存在弱工具變數之疑慮。

（2）弱識別檢驗：當 IV 通過不足識別檢定後，並不代表其不為弱工具變數，

故仍須藉助弱識別檢驗予以驗證。根據Staiger and Stock（1997）與 Stock and Yogo

32此部分數據僅須將第一階段資料處理後所得每小時風向資料予以統計即可獲取。

（2005）之建議，第一階段之 F 值應大於 10；惟考慮異質性（heteroscedasticity）

時，可用Cragg-Donald Wald F statistic 或 Kleibergen-Paap rk Wald F statistic 搭配 Stock-Yogo weak ID test critical values 進行檢定。

（3）過度識別檢定：當 IV 個數超過內生變數數量時，即可進行過度識別檢定；該檢定係檢驗所有IV 是否皆具外生性，可使用 Hansen J statistic 及其 P 值檢定之。

三、模型檢定

本研究係以IV 搭配 2SLS 進行迴歸分析，前文已介紹本研究所使用之 IV 及其相關檢定，而IV 是否適合則須取決於第一階段迴歸結果。式（3）及式（4）

分別為使用IV1 及 IV2 時之第一階段迴歸模型³³。

𝐴𝑃_𝑖𝑡 = 𝛼₀+ 𝛼₁^′𝐼[𝑅𝑒𝑔𝑖𝑜𝑛 x 𝑊𝐷] + 𝛼₂^′𝑻_𝒎𝒂𝒙_𝑖𝑡 + 𝛼₃^′𝑊_𝑖𝑡+ 𝜏_𝑖 + 𝜇_𝑡+ 𝜈_𝑖𝑡 （3）

𝐴𝑃_𝑖𝑡 = 𝛼₀ + 𝛼₁^′[𝑅𝑒𝑔𝑖𝑜𝑛 x 𝑊𝐷] + 𝛼₂^′𝑻_𝒎𝒂𝒙_𝑖𝑡+ 𝛼₃^′𝑊_𝑖𝑡+ 𝜏_𝑖+ 𝜇_𝑡+ 𝜈_𝑖𝑡 （4）

式（3）及式（4）中的變數定義與前述式（1）相同，其中𝐼[]為指標函數，

若符合其中敘述則該函數之值為 1，反之則為 0；另𝑅𝑒𝑔𝑖𝑜𝑛為空品區變數，𝑊𝐷 為風向變數，𝜏_𝑖及𝜇_𝑡分別為地區與時間之固定效果，𝜈_𝑖𝑡為誤差項。

第一階段迴歸之結果經相關檢定確認並通過後，即可進行第二階段迴歸，式

（5）為第二階段之迴歸模型；其變數定義與前文相同，其中𝐴𝑃̂ 為第一階段所得_𝑖𝑡 空氣污染物濃度之估計值，𝜃_𝑖及𝜂_𝑡分別為地區與時間之固定效果，𝜖_𝑖𝑡誤差項。

𝑙𝑛𝑌_𝑖𝑡 = 𝛽₀+ 𝛽₁𝐴𝑃̂ + 𝛽_𝑖𝑡 ₂𝑻_𝒎𝒂𝒙_𝑖𝑡+ 𝛽₃^′𝑊_𝑖𝑡+ 𝜃_𝑖+ 𝜂_𝑡+ 𝜖_𝑖𝑡 （5）

33為簡化表達，式（3）中𝛼₂^′𝑻_𝒎𝒂𝒙_𝑖𝑡為使用Spline 迴歸時，關於𝑇_𝑚𝑎𝑥𝑖𝑡的之所有項目，詳見式

（2）。

在文檔中高溫與空氣品質對交通事故之影響 (頁 25-31)

第四章 研究方法與實證模型

第二節 兩階段最小平方法

第四章研究方法與實證模型

第二節兩階段最小平方法