• 沒有找到結果。

第三章 研究設計

第三節 模型建立

一、零膨脹卜瓦松模型(Zero-inflated Poisson model)

由於本文中的應變數,土地交易次數屬於計數型資料(count data),此類型 的資料適合配適的模型為卜瓦松迴歸模型(Poisson regression),分配函數如下:

P(Y = y) =𝜆𝑦exp⁡(−𝜆)

𝑦! ⁡, 𝑦 = 0,1,2 … , 𝜆 > 0

其中的𝜆代表「單位時間內事件發生的平均次數」,其值為非負的整數。同時參 數𝜆也是卜瓦松分配中的平均數與變異數,屬於 equi-dispersed 的分配,也就是 平均數的值等於變異數之分配。然而觀察本文資料中土地交易次數分配後,發 現其中次數為零的所占的比例相當高,其次數分配如下表。

表 9 台中市十二期土地交易次數分配 Total Count Percentage 0 566 54.5805%

3.02 次、標準差為 14.17 次,此樣本的變異數大於平均數,屬於 over-dispersed 的分配。因此在零次數特別多的情況下,若使用卜瓦松模型時將不符合其 equi-dispersed 的假設,並且將使變異數的估計出現問題。根據 Lambert (1992),對於 擁有大量次數零的計數型資料,作者認為使用零膨脹卜瓦松分配(zero-inflated Poisson distribution)會有較好的配適(以下簡稱該模型為 ZIP)。ZIP 的概念為將計 數資料分成兩部分:首先為「次數為零」的資料,它有𝜔的機率服從二項分 配,1 − 𝜔的機率與一般計數型資料一樣服從卜瓦松分配,其意義代表零次數資 料的來源有兩種類型,如此一來使模型能配適更多零之情況。而第二個部分則 為「非零的次數」,這部分的資料將服從 zero-truncated Poisson 分配。而 ZIP 的 機率密度函數如下:

P(Y = y) = {

𝜔 + (1 − 𝜔) exp(−𝜆) ,⁡⁡⁡⁡⁡⁡𝑦 = 0 (1 − 𝜔)𝜆𝑦exp(−𝜆)

𝑦! ,⁡⁡⁡⁡⁡⁡⁡⁡⁡𝑦 > 0

其中的𝜔為發生「excess zero」的機率,由上式可發現組成零的部分來兩種層 面,因此也影響我們對於迴歸結果的解釋方式。另外,Lambert (1992)將𝜔的分 配視為一個 logit 模型,以捕捉變數對於「excess zero」的機率之影響,其分配 如下:

𝜔 = exp⁡(𝑧′𝛾) 1 + exp⁡(𝑧′𝛾)

其中解釋𝜔之變數𝑧可以包含在解釋 zero-truncated Poisson 的要素當中,以上之 參數將用最大概似估計法估計。

圖 7 零膨脹卜瓦松模型示意圖

上圖為本研究針對 ZIP 的解釋方式,首先對於土地所有者而言,其有權決 定是否賣出,或者是否有人願意購買該土地,當中「是或否」的決策屬於二項 分配,若為「否」則交易次數為零,不屬於計數資料的部分。然而,若地主願 意買賣,則會使用 zero-truncated Poisson 分配來分析影響交易次數之原因。當 中的結果又可區分為距離某設施愈近交易次數愈高,或者是距離某設施愈近交

二、存活分析(Survival analysis)

本研究除了次數之資料外,在土地異動以及建物異動資料中也整理出了 態分配,而且常為設限資料(censored data),其在觀察時間截止之前不一定有事 件發生,也就是在時間的限制內無法完整觀察病人存活的情況,只知道該病患 限資料(right-censored data)。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

26

若以圖來表示(見圖 8),橫軸為時間,縱軸則為三個不同的案例。三個案例 中「最後一次土地交易」的時間點與「登記為建案」的時間點皆不同。其中 case 3 在研究期間結束時還未開發成建案,因此紀錄為設限資料。而 case 1 與 case 2 當中均有事件發生(登記為建案),稱為完整資料(complete data),其中案 例之間的存續期間之差別為本研究想要探討的。此外,由此圖可發現,存活分 析的特色為能夠捕捉兩種類型的資料,包含觀察事件是否發生(二元變數)以及 經歷的時間(連續型變數),因此也是本文使用此方法的原因之一。

圖 8 存活資料示意圖

確認為存活資料後,本研究將觀察不同土地特徵下何種因素將顯著影響存 活時間之差異,將使用存活分析當中常被使用的 Cox 比例危險模型(Cox proportional hazard model),其模型如下:

ln[h(t)] = ln[ℎ0(t)] + 𝛽1𝑥1+ ⋯ . +𝛽𝑛𝑥𝑛 或是能改寫成:

h(t) = ℎ0(t)𝑒𝑛𝑖=1𝛽𝑖𝑥𝑖

當中的被解釋變數h(t)代表風險(hazard),為在 t 期給定所有解釋變數不變時,

發生事件的風險(本研究中的事件為建案登記)。等號右式則包含了ℎ0(t)與 𝑒𝑛𝑖=1𝛽𝑖𝑥𝑖之乘積,其中ℎ0(t)稱為基期風險函數(baseline hazard function),在 Cox 比例危險模型中不指定其函數,為半參數模型(semi-parametric model)。而 𝑒𝑛𝑖=1𝛽𝑖𝑥𝑖的部分,其將線性組合取指數能使 h(t)恆為非負之數值。另外當中的解 釋變數𝑥在本模型中為不受時間影響之變數,本研究資料中的地理特徵也假設在 觀察期間內不隨時間而更動。

此外,Cox 比例危險模型實證結果的解釋方式常使用風險比值(hazard ratio),其意涵為給定兩組不同的解釋變數𝑥,將其分別算出的風險值相除,也 就是:

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

27

Hazard⁡ratio =ĥ(t, X⁡⁡) ĥ(t, X⁡⁡)

若ĥ(t, X⁡⁡) > ĥ(t, X⁡⁡)則Hazard⁡ratio > 1,反之Hazard⁡ratio則介於零與一之間。

而若將ĥ(t, X⁡⁡)繼續拆解下去可得:

ĥ(t, X⁡⁡)

ĥ(t, X⁡⁡) =ℎ̂0(t)𝑒𝑛𝑖=1𝛽̂𝑖𝑥𝑖

ℎ̂0(t)𝑒𝑛𝑖=1𝛽̂𝑖𝑥𝑖 = 𝑒𝑛𝑖=1𝛽̂𝑖(𝑥𝑖−𝑥𝑖)

當中的𝑒𝑛𝑖=1𝛽̂𝑖(𝑥𝑖−𝑥𝑖)表示若某解釋變數𝑥1增加一單位(𝑥𝑖 − 𝑥𝑖 = 1),則 Hazard⁡ratio為𝑒𝛽1,也就是𝑥𝑖的風險比𝑥𝑖多了𝑒𝛽1倍。

卜瓦松模型還要好,使用 ZIP 能解決資料中 over-dispersed 的現象。而在解釋變 數的方面則分成兩個部分,其中一個部分為屏除過多的零次數的現象,以 truncated Poisson 來估計影響交易次數之參數。而第二個部分的變數解釋的不是

「次數」,而是研究地主與投資人之間「是否」願意買賣土地,若地主沒有打算

Truncated Poisson

小學 -0.000284 0.0002555

相關文件