第二章 文獻回顧
第二節 環境變數
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
9
第二節 環境變數
將環境變數與無效率項結合,最早由 Huang and Liu (1994) (JPA) 和 Battese and Coelli (1995) 提出,假設無效率項為截斷常態分配 (truncated normal),將截 斷常態分配的帄均數設定為環境變數的函數。這兩篇論文的主要差異,在於前者 的環境變數中包含生產要素,後者則否,僅包含外生變數。因為他們的環境變數 係數估計值均達統計顯著,考慮環境變數具有重要性。Huang (2005) 使用類似 Huang and Liu (1994) 的模型,探討資訊與電腦設備對台灣銀行業的效率與生產 力之影響,確認資訊與電腦設備投資有助於提升銀行業的效率與生產力。
加入環境變數並以貝氏方法估計的文獻,如 Koop et al. (1994b)。該文獻以貝 氏方法估計成本函數,並未加入單調性與曲度限制條件。環境變數是由數個指標 變數與一個連續型變數所組成,並與僅有截距項而無環境變數的模型進行比較。
論文中討論到,由於貝氏大多以 Gibbs Sampling 進行抽樣,其原理為從驗後分配 (posterior distribution) 的條件分配 (conditional distribution) 中抽樣,但若環境變 數為連續變數,則無法推導得出對應的條件分配,需用其他方法例如
independence Metropolis-Hasting,對參數進行重複抽樣,導致估計的困難度大幅 增加。
因此現有的貝氏方法結合環境變數的論文,大部分是將環境變數設為數個類 別指標變數,如 Koop et al. (1997),同樣是在未加入單調性與曲度限制條件下,
討論成本函數模型中加入環境變數的顯著性。實證結果指出加入環境變數後,相 較於無環境變數,模型有較高的解釋力。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
10
Fernández et al. (2000) 同時考慮限制條件與環境變數,且完整的介紹貝氏 方法在距離函數的應用。該篇文章採用銀行業資料進行實證分析,在多產出的射 線產出距離函數中,僅加入簡單的限制條件,例如係數值非負;環境變數則是依 照銀行大小分成三個類別的指標變數,無效率項假設不隨時間改變。此外,在其 附錄中以 Geweke 與 Gelman and Rubin 兩種方法演示貝氏方法的收斂診斷。但特 別提到在抽取距離函數的參數時,無法證明該參數的母體帄均數與標準差存在,
故這兩種診斷方法僅能提供參考。
總結來說,多數使用貝氏方法與距離函數的文獻,僅單純考慮限制條件或是 環境變數,鮮少同時考慮兩者。本文的優點在於估計方向距離函數模型時,同時 考慮限制條件與環境變數,進行效率評估,並與未考慮非意欲產出之射線距離函 數模型比較。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
11
第三章 研究方法
第一節 方向距離函數
1. 模型設定
方向距離函數的優點之一,在於可加入非意欲產出於模型中。如 Färe et al.
(2005)、Feng and Serletis (2010) 與 Feng and Serletis (2014) 都是以產出面方向距 離函數,並加入非意欲產出。本論文同樣使用產出面方向距離函數,以下簡稱方 向距離函數。以𝑥代表要素投入向量, 𝑦代表產出,𝑏為非意欲產出,t 代表時間 趨勢。參考 Färe and Grosskopf (2003) 與 Feng and Serletis (2010),方向距離函數 可定義為
𝐷⃗⃗ 0(𝑦, 𝑏, 𝑥, 𝑡; 𝑔𝑦, −𝑔𝑏) = 𝑚𝑎𝑥{𝛾: (𝑦 + 𝛾𝑔𝑦, 𝑏 − 𝛾𝑔𝑏) ∈ 𝑃(𝑥)} (1)
𝑃(𝑥) = *𝑦 ∶ 𝑦 𝑖𝑠 𝑝𝑟𝑜𝑑𝑢𝑐𝑖𝑏𝑙𝑒 𝑓𝑟𝑜𝑚 𝑥+,為方向距離函數模型下可能的產出集合 (output set),𝑔𝑦與𝑔𝑏為方向向量。方向距離函數的意義為,產出頇朝𝑔𝑦方向增加 𝛾單位,同時非意欲產出需朝𝑔𝑏方向減少𝛾單位,才能達到生產邊界。對於方向 的選取,為了直觀與簡便,我們選擇 𝑔𝑦與𝑔𝑏均為單位向量,若產出與非意欲產 出都只有一種,則 𝐠 = (𝑔𝑦, −𝑔𝑏) = (1, −1)。此時方向距離函數可解釋為,產出 增加與非意欲產出減少是朝 (1, −1) 方向調整𝛾單位。參考 Färe et al. (2005),方 向距離函數的性質整理如下: 𝐷⃗⃗ 0(𝑦, 𝑏, 𝑥, 𝑡; 𝑔𝑦, −𝑔𝑏) ≥ 0,若且唯若(𝑦, 𝑏) ∈ 𝑃(𝑥) (2)
𝐷⃗⃗ 0(𝑦′, 𝑏, 𝑥, 𝑡; 𝑔𝑦, −𝑔𝑏) ≥ 𝐷⃗⃗ 0(𝑦, 𝑏, 𝑥, 𝑡; 𝑔𝑦, −𝑔𝑏), (𝑦′, 𝑏) ≤ (𝑦, 𝑏) ∈ 𝑃(𝑥) (3)
𝐷⃗⃗ 0(𝑦, 𝑏′, 𝑥, 𝑡; 𝑔𝑦, −𝑔𝑏) ≥ 𝐷⃗⃗ 0(𝑦, 𝑏, 𝑥, 𝑡; 𝑔𝑦, −𝑔𝑏), (𝑦, 𝑏′) ≥ (𝑦, 𝑏) ∈ 𝑃(𝑥) (4)
𝐷⃗⃗ 0(𝜑𝑦, 𝜑𝑏, 𝑥, 𝑡; 𝑔𝑦, −𝑔𝑏) ≥ 0, (𝑦, 𝑏) ∈ 𝑃(𝑥),0 ≤ 𝜑 ≤ 1 (5)
𝐷⃗⃗ 0(𝑦, 𝑏, 𝑥, 𝑡; 𝑔𝑦, −𝑔𝑏)為凹函數, (𝑦, 𝑏) ∈ 𝑃(𝑥) (6)
𝐷⃗⃗ 0(𝑦 + 𝜙𝑔𝑦, 𝑏 − 𝜙𝑔𝑏, 𝑥, 𝑡; 𝑔𝑦, −𝑔𝑏) = 𝐷⃗⃗ 0(𝑦, 𝑏, 𝑥, 𝑡; 𝑔𝑦, −𝑔𝑏) − 𝜙, 𝜙 ∈ 𝑹 (7)
‧
出 y 為非遞增,等同於滿足產出的強可拋性 (strong disposability);(4)亦為單調 性,方向距離函數對於非意欲產出𝑏為非遞減;(5)為滿足產出與非意欲產出之弱 可拋性 (weak disposability);(6)為滿足方向距離函數之凹性;(7)為方向距離函數 之轉換性質 (translation property)。此外,O’Donnell and Coelli (2005) 在射線距離 函數中加入了對投入的單調性,Feng and Serletis (2014) 也在方向距離函數加入 對投入的單調性。因此本文也同樣加入對投入的單調性,方向距離函數對投入𝑥為‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
14
配合樣本資料可將函數中的參數估計出來。此處𝑢𝑖𝑡為無效率項,假設可隨時間 改變,𝑣𝑖𝑡為隨機干擾項,𝑣𝑖𝑡~𝑁(0, 𝜎2)具獨立且相同分配,它與𝑢𝑖𝑡統計獨立,並 假設無效率項與隨機干擾項皆與各解釋變數不相關。若以矩陣的形式表達,(19) 式可化為
𝒚 = 𝒔′𝜷 − 𝒖 + 𝒗 (20) 其中𝒔′為(19)式右方所有解釋變數 (包含截距項) 所構成的𝐾𝑇 × 15矩陣。𝜷則為 與其對應之15 × 1參數向量。其餘𝒚, 𝒖, 𝒗都為𝐾𝑇 × 1向量。
2. 限制條件
方向距離函數有三種單調性質,對產出𝑦為非遞增、對非意欲產出𝑏為非遞 減、對投入𝒙亦為非遞減。根據(9)式針對產出、投入和非意欲產出取偏導數得到
𝜕𝐷⃗⃗ 0(𝑦,𝑏,𝑥,𝑡;1,;1)
𝜕𝑦 = 𝛽1+ 𝛽6𝑦 + 𝛽11𝑥1+ 𝛽12𝑥2+ 𝛽13𝑏 + 𝛽14𝑡 ≤ 0 (21)
𝜕𝐷⃗⃗ 0(𝑦,𝑏,𝑥,𝑡;1,;1)
𝜕𝑏 = 𝛽4+ 𝛽9𝑏 + 𝛽13𝑦 + 𝛽16𝑥1 + 𝛽18𝑥2+ 𝛽20𝑡 ≥ 0 (22)
𝜕𝐷⃗⃗ 0(𝑦,𝑏,𝑥,𝑡;1,;1)
𝜕𝑥1 = 𝛽2+ 𝛽7𝑥1+ 𝛽11𝑦 + 𝛽15𝑥2+ 𝛽16𝑏 + 𝛽17𝑡 ≥ 0 (23)
𝜕𝐷⃗⃗ 0(𝑦,𝑏,𝑥,𝑡;1,;1)
𝜕𝑥2 = 𝛽3+ 𝛽8𝑥2 + 𝛽12𝑦 + 𝛽15𝑥1+ 𝛽18𝑏 + 𝛽19𝑡 ≥ 0 (24) 代入轉換性質與𝑏̃ = 𝑏 + 𝑦後,(21)-(24)式可改寫為 (詳如附錄 1)
𝜕𝐷⃗⃗ 0(𝑦,𝑏,𝑥,𝑡;1,;1)
𝜕𝑥1 = 𝛽2+ 𝛽7𝑥1 + 𝛽15𝑥2+ 𝛽16𝑏̃ + 𝛽17𝑡 ≥ 0 (25)
𝜕𝐷⃗⃗ 0(𝑦,𝑏,𝑥,𝑡;1,;1)
𝜕𝑥2 = 𝛽3+ 𝛽8𝑥2+ 𝛽15𝑥1+ 𝛽18𝑏̃ + 𝛽19𝑡 ≥ 0 (26) 0 ≤ 𝜕𝐷⃗⃗ 0(𝑦,𝑏,𝑥,𝑡;1,;1)
𝜕𝑏 = 𝛽4+ 𝛽9𝑏̃ + 𝛽16𝑥1+ 𝛽18𝑥2 + 𝛽20𝑡 ≤ 1 (27)
‧
(jointly concavity),參考 Chambers (2002)、Färe et al. (2005) 與 Feng and Serletis (2014) 以及附錄 2,在單一產出與單一非意欲產出的情況下,簡化為‧
若把資料依照所得水準分為高所得(high income, HI)、中高所得(middle high, MH)、中低所得(middle low, ML)與低所得國家(low income, LI)等四個類別,可計 算四個所得類別下的帄均效率分數,依序以𝐸𝐶𝐻𝐼𝑑, 𝐸𝐶𝑀𝐻𝑑 , 𝐸𝐶𝑀𝐿𝑑 , 𝐸𝐶𝐿𝐼𝑑代表。計算方
參考 Feng and Serletis (2014),將方向距離函數模型的技術進步率定義為
𝜕𝑙𝑛𝐷⃗⃗ 0(𝑦,𝑏,𝑥,𝑡;1,;1)
‧
‧
為了與方向距離函數比較,參考O’Donnell and Coelli (2005),本文另估計產 出面射線距離函數,以下簡稱射線距離函數。射線距離函數定義為 O’Donnell and Coelli (2005) 與 Feng and Serletis (2014) 等。我們同樣設定為超越 對數的形式,其優點在於具有相當的伸縮性,且易於滿足(52)式的一階齊次性,
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
20
其中𝒘′為(61)式等號右方所有解釋變數 (包含截距項) 所構成的𝐾𝑇 × 10矩陣。𝜶 則為與其對應之10 × 1參數向量。其餘−ln𝒚, 𝝐, 𝜺都為𝐾𝑇 × 1向量。
2. 限制條件
參考O’Donnell and Coelli (2005) 與 Feng and Serletis (2014),根據射線產出 距離函數的單調性,其對產出y為非遞減且對投入𝑥1, 𝑥2為非遞增,意即
𝜕𝐷(𝑦,𝑥,𝑡)
𝜕𝑦 ≥ 0、𝜕𝐷(𝑦,𝑥,𝑡)
𝜕𝑥1 ≤ 0 與 𝜕𝐷(𝑦,𝑥,𝑡)
𝜕𝑥2 ≤ 0。由(53)式,針對y, 𝑥1, 𝑥2取偏導數後代 入(56)-(60)式,可將單調性限制整理為(詳如附錄 3)
𝑓1 = 𝛼2+ 𝛼6𝑙𝑛𝑥1+ 𝛼9𝑙𝑛𝑦 + 𝛼12𝑙𝑛𝑥2+ 𝛼13 ≤ 0 (63) 𝑓2 = 𝛼3+ 𝛼7𝑙𝑛𝑥2+ 𝛼10𝑙𝑛𝑦 + 𝛼12𝑙𝑛𝑥1+ 𝛼14𝑡 ≤ 0 (64)
產出距離函數對產出具有击性,若且唯若D(y, x, t)對於y的海森矩陣所有主子 式 (principal minor) 非負;另外,產出距離函數對投入具有準击性,充分條件為 D(y, x, t)對於𝒙的鑲邊海森矩陣 (bordered Hessian matrix) 其所有鑲邊主子式 (bordered principal minors) 為負,推導詳如附錄 4。準击性限制條件可整理為
2𝛼12𝑓1𝑓2− (𝛼6 − 𝑓1)𝑓22 − (𝛼7− 𝑓2)𝑓12 < 0 (65)
‧
‧
參考 Feng and Serletis (2014),射線距離函數模型的技術進步率定義為
−𝜕𝑙𝑛𝐷(𝑦,𝑥,𝑡)
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
23
第三節 貝氏方法
1. 貝氏方法的介紹
(1) 架構
貝氏方法的架構,是由概似函數 (likelihood function) 乘上各參數的先驗分 配,得到聯合驗後分配 (joint posterior distribution) (以下簡稱為驗後分配),再根 據驗後分配對各參數進行統計量的計算。其主要的特色在於先驗資訊的加入,使 得參數估計中能帶有一些人為或已知的成分。應用在估計成本或距離函數時,最 主要的優點是可以將單調性與曲度這些不等號限制條件,加諸於目標函數,由此 估計得到的迴歸係數值,保證符合上述不等號限制條件。此外,貝氏方法將無效 率項𝑢𝑖𝑡視為隨機參數,由於加入先驗資訊 (先驗分配),使得所有𝑢𝑖𝑡可進行點估 計與區間估計。相較之下,傳統的 MLE 法則是以條件帄均數 (conditional mean) 估計無效率值。
(2) 貝氏抽樣方法
待估參數的統計量是由驗後分配所決定,然而驗後分配可能是複雜的高維度 分配,不易由積分得到各參數之邊際分配 (marginal distribution)。因此,需要模 擬出複雜的驗後分配,從中重複抽取足夠多數的參數樣本,並以這些樣本估計參 數的統計量。而馬可夫鏈蒙地卡羅法(Markov chain Monte Carlo, MCMC),即為 模擬高維度的複雜分配而使用的抽樣方法。其中有兩種方法最為常見,即 Gibbs sampling 與 Metropolis-Hasting。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
24
Gibbs sampling 的概念是,由驗後分配中推導各參數的條件分配後,對各參 數的條件分配進行抽樣。而各參數抽取後的樣本帄均數,將會收斂至驗後分配中 該參數的母體帄均值。此方法的關鍵在於需要推導出各參數的條件分配,因此驗 後分配的型態很重要。由於驗後分配是由概似函數與先驗分配相乘,因此可透過 先驗分配妥當的設定,間接地讓條件分配有著易於數學推導的型態。
相較於 Gibbs sampling,Metropolis-Hasting 法不需要知道條件分配的型態,
僅需能夠計算出某兩組參數樣本下,驗後分配的機率密度比值即可。其精神在於 每次的抽樣,是根據前一次的參數樣本進行跳躍。設給定的參數向量為𝛚𝒕,接 著以𝛚𝒕為中心,從某固定的提議分配 (proposal distribution) 中隨機抽樣,通常 是選擇多維度常態分配 (multivariate normal distribution),從中抽出下一組參數樣 本𝛚𝒕:𝟏。令𝑗(𝝎)為某參數樣本下所計算的驗後分配機率密度函數,而
𝑞(𝝎𝒕:𝟏|𝝎𝒕)為從𝛚𝒕跳躍至𝛚𝒕:𝟏之多維度常態分配機率密度。跳躍成功的機率稱 為接受率(acceptance rate),以 r 表示,則𝑟 = 𝑚𝑖𝑛 *1,𝑗(𝝎𝒕+𝟏)𝑞(𝝎𝒕|𝝎𝒕+𝟏)
𝑗(𝝎𝒕)𝑞(𝝎𝒕+𝟏|𝝎𝒕) +。若成功跳 躍,則下個樣本即為𝛚𝒕:𝟏,反之則停留在同樣的樣本𝛚𝒕。以此規則不斷抽取參 數樣本,各參數的樣本帄均數會收斂至驗後分配的母體帄均。此方法的優點在於 不需要推導出條件分配,因此使用上較沒有限制,也能適用到更複雜的分配,譬 如考慮限制條件的情況。相對的,此法的缺點在於抽取的參數樣本依賴於上一組 的參數樣本,參數樣本間容易有較高的自我相關 (autocorrelation) 問題,導致模 型收斂速度較慢3。
3
可參考 Patrick Breheny 所提供的教學資料,
http://web.as.uky.edu/statistics/users/pbreheny/701/S13/notes/2-28.pdf
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
25
(3) 貝氏區間估計
貝氏方法下的區間估計是透過可信區間 (credible interval) 的建立。在傳統 統計學中的信賴區間屬於隨機區間,假設母體參數為固定且未知。然而貝氏方法 的可信區間相反,為加入先驗資訊下建構出來的固定區間,但母體參數為隨機變 數。因此兩者的解釋方式不同,可信區間解釋為母體參數位於此區間的機率。然 而,不管是傳統的信賴區間或是可信區間,意義上都是為了對參數進行區間估 計。
貝氏假設母體參數為隨機變數,因此我們可以用蒙地卡羅法所抽出的參數樣 本取得樣本帄均數與標準差,計算出 95%的可信區間。最常用來決定區間上下分 位數的方法有兩種,同尾 (equal-tail) 與最高驗後密度 (highest posterior density, HPD)。同尾可信區間意即 95%機率下,上下尾各為 2.5%之面積。由於面積對稱 因此較為簡易,也較常被使用;最高密度可信區間是找出能使區間寬度極小化的 上下分位數,其特色為上下分位數所計算的機率密度相等,意即這區間所包含的 可能值都有著最高的驗後機率密度。然而在非對稱驗後機率密度的情況下,其上 下尾的面積不同,實際使用時計算上下分位數較複雜。由於前者簡便與直觀,後 續的實證分析,本文採用之。
(4) 貝氏模型診斷
參考 Flegal(2008)4,根據馬可夫鏈中央極限定理,若𝑔̅𝑛為樣本帄均數,𝐸𝜋𝑔為
參考 Flegal(2008)4,根據馬可夫鏈中央極限定理,若𝑔̅𝑛為樣本帄均數,𝐸𝜋𝑔為