環境變數 - 文獻回顧 - 運用貝氏方法估計方向距離函數─考慮環境變數、單調性與曲度限制下之效率分析

第二章文獻回顧

第二節環境變數

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

9 第二節環境變數

將環境變數與無效率項結合，最早由 Huang and Liu (1994) (JPA) 和 Battese and Coelli (1995) 提出，假設無效率項為截斷常態分配 (truncated normal)，將截斷常態分配的帄均數設定為環境變數的函數。這兩篇論文的主要差異，在於前者的環境變數中包含生產要素，後者則否，僅包含外生變數。因為他們的環境變數係數估計值均達統計顯著，考慮環境變數具有重要性。Huang (2005) 使用類似 Huang and Liu (1994) 的模型，探討資訊與電腦設備對台灣銀行業的效率與生產力之影響，確認資訊與電腦設備投資有助於提升銀行業的效率與生產力。

加入環境變數並以貝氏方法估計的文獻，如 Koop et al. (1994b)。該文獻以貝氏方法估計成本函數，並未加入單調性與曲度限制條件。環境變數是由數個指標變數與一個連續型變數所組成，並與僅有截距項而無環境變數的模型進行比較。

論文中討論到，由於貝氏大多以 Gibbs Sampling 進行抽樣，其原理為從驗後分配 (posterior distribution) 的條件分配 (conditional distribution) 中抽樣，但若環境變數為連續變數，則無法推導得出對應的條件分配，需用其他方法例如

independence Metropolis-Hasting，對參數進行重複抽樣，導致估計的困難度大幅增加。

因此現有的貝氏方法結合環境變數的論文，大部分是將環境變數設為數個類別指標變數，如 Koop et al. (1997)，同樣是在未加入單調性與曲度限制條件下，

討論成本函數模型中加入環境變數的顯著性。實證結果指出加入環境變數後，相較於無環境變數，模型有較高的解釋力。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

10

Fernández et al. (2000) 同時考慮限制條件與環境變數，且完整的介紹貝氏方法在距離函數的應用。該篇文章採用銀行業資料進行實證分析，在多產出的射線產出距離函數中，僅加入簡單的限制條件，例如係數值非負；環境變數則是依照銀行大小分成三個類別的指標變數，無效率項假設不隨時間改變。此外，在其附錄中以 Geweke 與 Gelman and Rubin 兩種方法演示貝氏方法的收斂診斷。但特別提到在抽取距離函數的參數時，無法證明該參數的母體帄均數與標準差存在，

故這兩種診斷方法僅能提供參考。

總結來說，多數使用貝氏方法與距離函數的文獻，僅單純考慮限制條件或是環境變數，鮮少同時考慮兩者。本文的優點在於估計方向距離函數模型時，同時考慮限制條件與環境變數，進行效率評估，並與未考慮非意欲產出之射線距離函數模型比較。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

11 第三章研究方法

第一節方向距離函數

1. 模型設定

方向距離函數的優點之一，在於可加入非意欲產出於模型中。如 Färe et al.

(2005)、Feng and Serletis (2010) 與 Feng and Serletis (2014) 都是以產出面方向距離函數，並加入非意欲產出。本論文同樣使用產出面方向距離函數，以下簡稱方向距離函數。以𝑥代表要素投入向量， 𝑦代表產出，𝑏為非意欲產出，t 代表時間趨勢。參考 Färe and Grosskopf (2003) 與 Feng and Serletis (2010)，方向距離函數可定義為

𝐷⃗⃗ ₀(𝑦, 𝑏, 𝑥, 𝑡; 𝑔_𝑦, −𝑔_𝑏) = 𝑚𝑎𝑥{𝛾: (𝑦 + 𝛾𝑔_𝑦, 𝑏 − 𝛾𝑔_𝑏) ∈ 𝑃(𝑥)} (1)

𝑃(𝑥) = *𝑦 ∶ 𝑦 𝑖𝑠 𝑝𝑟𝑜𝑑𝑢𝑐𝑖𝑏𝑙𝑒 𝑓𝑟𝑜𝑚 𝑥+，為方向距離函數模型下可能的產出集合 (output set)，𝑔_𝑦與𝑔_𝑏為方向向量。方向距離函數的意義為，產出頇朝𝑔_𝑦方向增加 𝛾單位，同時非意欲產出需朝𝑔_𝑏方向減少𝛾單位，才能達到生產邊界。對於方向的選取，為了直觀與簡便，我們選擇 𝑔_𝑦與𝑔_𝑏均為單位向量，若產出與非意欲產出都只有一種，則 𝐠 = (𝑔_𝑦, −𝑔_𝑏) = (1, −1)。此時方向距離函數可解釋為，產出增加與非意欲產出減少是朝 (1, −1) 方向調整𝛾單位。參考 Färe et al. (2005)，方向距離函數的性質整理如下： 𝐷⃗⃗ ₀(𝑦, 𝑏, 𝑥, 𝑡; 𝑔_𝑦, −𝑔_𝑏) ≥ 0，若且唯若(𝑦, 𝑏) ∈ 𝑃(𝑥) (2)

𝐷⃗⃗ ₀(𝑦′, 𝑏, 𝑥, 𝑡; 𝑔_𝑦, −𝑔_𝑏) ≥ 𝐷⃗⃗ ₀(𝑦, 𝑏, 𝑥, 𝑡; 𝑔_𝑦, −𝑔_𝑏)， (𝑦′, 𝑏) ≤ (𝑦, 𝑏) ∈ 𝑃(𝑥) (3)

𝐷⃗⃗ ₀(𝑦, 𝑏′, 𝑥, 𝑡; 𝑔_𝑦, −𝑔_𝑏) ≥ 𝐷⃗⃗ ₀(𝑦, 𝑏, 𝑥, 𝑡; 𝑔_𝑦, −𝑔_𝑏)， (𝑦, 𝑏′) ≥ (𝑦, 𝑏) ∈ 𝑃(𝑥) (4)

𝐷⃗⃗ ₀(𝜑𝑦, 𝜑𝑏, 𝑥, 𝑡; 𝑔_𝑦, −𝑔_𝑏) ≥ 0， (𝑦, 𝑏) ∈ 𝑃(𝑥)，0 ≤ 𝜑 ≤ 1 (5)

𝐷⃗⃗ ₀(𝑦, 𝑏, 𝑥, 𝑡; 𝑔_𝑦, −𝑔_𝑏)為凹函數， (𝑦, 𝑏) ∈ 𝑃(𝑥) (6)

𝐷⃗⃗ ₀(𝑦 + 𝜙𝑔_𝑦, 𝑏 − 𝜙𝑔_𝑏, 𝑥, 𝑡; 𝑔_𝑦, −𝑔_𝑏) = 𝐷⃗⃗ ₀(𝑦, 𝑏, 𝑥, 𝑡; 𝑔_𝑦, −𝑔_𝑏) − 𝜙， 𝜙 ∈ 𝑹 (7)

‧

出 y 為非遞增，等同於滿足產出的強可拋性 (strong disposability)；(4)亦為單調性，方向距離函數對於非意欲產出𝑏為非遞減；(5)為滿足產出與非意欲產出之弱可拋性 (weak disposability)；(6)為滿足方向距離函數之凹性；(7)為方向距離函數之轉換性質 (translation property)。此外，O’Donnell and Coelli (2005) 在射線距離函數中加入了對投入的單調性，Feng and Serletis (2014) 也在方向距離函數加入對投入的單調性。因此本文也同樣加入對投入的單調性，方向距離函數對投入𝑥為

‧

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

14

配合樣本資料可將函數中的參數估計出來。此處𝑢_𝑖𝑡為無效率項，假設可隨時間改變，𝑣_𝑖𝑡為隨機干擾項，𝑣_𝑖𝑡~𝑁(0, 𝜎²)具獨立且相同分配，它與𝑢_𝑖𝑡統計獨立，並假設無效率項與隨機干擾項皆與各解釋變數不相關。若以矩陣的形式表達，(19) 式可化為

𝒚 = 𝒔′𝜷 − 𝒖 + 𝒗 (20) 其中𝒔′為(19)式右方所有解釋變數 (包含截距項) 所構成的𝐾𝑇 × 15矩陣。𝜷則為與其對應之15 × 1參數向量。其餘𝒚, 𝒖, 𝒗都為𝐾𝑇 × 1向量。

2. 限制條件

方向距離函數有三種單調性質，對產出𝑦為非遞增、對非意欲產出𝑏為非遞減、對投入𝒙亦為非遞減。根據(9)式針對產出、投入和非意欲產出取偏導數得到

𝜕𝐷⃗⃗ ₀(𝑦,𝑏,𝑥,𝑡;1,;1)

𝜕𝑦 = 𝛽₁+ 𝛽₆𝑦 + 𝛽₁₁𝑥₁+ 𝛽₁₂𝑥₂+ 𝛽₁₃𝑏 + 𝛽₁₄𝑡 ≤ 0 (21)

𝜕𝐷⃗⃗ ₀(𝑦,𝑏,𝑥,𝑡;1,;1)

𝜕𝑏 = 𝛽₄+ 𝛽₉𝑏 + 𝛽₁₃𝑦 + 𝛽₁₆𝑥₁ + 𝛽₁₈𝑥₂+ 𝛽₂₀𝑡 ≥ 0 (22)

𝜕𝐷⃗⃗ ₀(𝑦,𝑏,𝑥,𝑡;1,;1)

𝜕𝑥₁ = 𝛽₂+ 𝛽₇𝑥₁+ 𝛽₁₁𝑦 + 𝛽₁₅𝑥₂+ 𝛽₁₆𝑏 + 𝛽₁₇𝑡 ≥ 0 (23)

𝜕𝐷⃗⃗ ₀(𝑦,𝑏,𝑥,𝑡;1,;1)

𝜕𝑥₂ = 𝛽₃+ 𝛽₈𝑥₂ + 𝛽₁₂𝑦 + 𝛽₁₅𝑥₁+ 𝛽₁₈𝑏 + 𝛽₁₉𝑡 ≥ 0 (24) 代入轉換性質與𝑏̃ = 𝑏 + 𝑦後，(21)-(24)式可改寫為 (詳如附錄 1)

𝜕𝐷⃗⃗ ₀(𝑦,𝑏,𝑥,𝑡;1,;1)

𝜕𝑥₁ = 𝛽₂+ 𝛽₇𝑥₁ + 𝛽₁₅𝑥₂+ 𝛽₁₆𝑏̃ + 𝛽₁₇𝑡 ≥ 0 (25)

𝜕𝐷⃗⃗ ₀(𝑦,𝑏,𝑥,𝑡;1,;1)

𝜕𝑥₂ = 𝛽₃+ 𝛽₈𝑥₂+ 𝛽₁₅𝑥₁+ 𝛽₁₈𝑏̃ + 𝛽₁₉𝑡 ≥ 0 (26) 0 ≤ ^𝜕𝐷^⃗⃗⁰(𝑦,𝑏,𝑥,𝑡;1,;1)

𝜕𝑏 = 𝛽₄+ 𝛽₉𝑏̃ + 𝛽₁₆𝑥₁+ 𝛽₁₈𝑥₂ + 𝛽₂₀𝑡 ≤ 1 (27)

‧

(jointly concavity)，參考 Chambers (2002)、Färe et al. (2005) 與 Feng and Serletis (2014) 以及附錄 2，在單一產出與單一非意欲產出的情況下，簡化為

‧

若把資料依照所得水準分為高所得(high income, HI)、中高所得(middle high, MH)、中低所得(middle low, ML)與低所得國家(low income, LI)等四個類別，可計算四個所得類別下的帄均效率分數，依序以𝐸𝐶_𝐻𝐼^𝑑, 𝐸𝐶_𝑀𝐻^𝑑 , 𝐸𝐶_𝑀𝐿^𝑑 , 𝐸𝐶_𝐿𝐼^𝑑代表。計算方

參考 Feng and Serletis (2014)，將方向距離函數模型的技術進步率定義為

𝜕𝑙𝑛𝐷⃗⃗ ₀(𝑦,𝑏,𝑥,𝑡;1,;1)

‧

為了與方向距離函數比較，參考O’Donnell and Coelli (2005)，本文另估計產出面射線距離函數，以下簡稱射線距離函數。射線距離函數定義為 O’Donnell and Coelli (2005) 與 Feng and Serletis (2014) 等。我們同樣設定為超越對數的形式，其優點在於具有相當的伸縮性，且易於滿足(52)式的一階齊次性，

‧

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

20

其中𝒘′為(61)式等號右方所有解釋變數 (包含截距項) 所構成的𝐾𝑇 × 10矩陣。𝜶 則為與其對應之10 × 1參數向量。其餘−ln𝒚, 𝝐, 𝜺都為𝐾𝑇 × 1向量。

2. 限制條件

參考O’Donnell and Coelli (2005) 與 Feng and Serletis (2014)，根據射線產出距離函數的單調性，其對產出y為非遞減且對投入𝑥₁, 𝑥₂為非遞增，意即

𝜕𝐷(𝑦,𝑥,𝑡)

𝜕𝑦 ≥ 0、^{𝜕𝐷(𝑦,𝑥,𝑡)}

𝜕𝑥₁ ≤ 0 與 ^{𝜕𝐷(𝑦,𝑥,𝑡)}

𝜕𝑥₂ ≤ 0。由(53)式，針對y, 𝑥₁, 𝑥₂取偏導數後代入(56)-(60)式，可將單調性限制整理為(詳如附錄 3)

𝑓₁ = 𝛼₂+ 𝛼₆𝑙𝑛𝑥₁+ 𝛼₉𝑙𝑛𝑦 + 𝛼₁₂𝑙𝑛𝑥₂+ 𝛼₁₃ ≤ 0 (63) 𝑓₂ = 𝛼₃+ 𝛼₇𝑙𝑛𝑥₂+ 𝛼₁₀𝑙𝑛𝑦 + 𝛼₁₂𝑙𝑛𝑥₁+ 𝛼₁₄𝑡 ≤ 0 (64)

產出距離函數對產出具有击性，若且唯若D(y, x, t)對於y的海森矩陣所有主子式 (principal minor) 非負；另外，產出距離函數對投入具有準击性，充分條件為 D(y, x, t)對於𝒙的鑲邊海森矩陣 (bordered Hessian matrix) 其所有鑲邊主子式 (bordered principal minors) 為負，推導詳如附錄 4。準击性限制條件可整理為

2𝛼₁₂𝑓₁𝑓₂− (𝛼₆ − 𝑓₁)𝑓₂² − (𝛼₇− 𝑓₂)𝑓₁² < 0 (65)

‧

參考 Feng and Serletis (2014)，射線距離函數模型的技術進步率定義為

−𝜕𝑙𝑛𝐷(𝑦,𝑥,𝑡)

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

23 第三節貝氏方法

1. 貝氏方法的介紹

(1) 架構

貝氏方法的架構，是由概似函數 (likelihood function) 乘上各參數的先驗分配，得到聯合驗後分配 (joint posterior distribution) (以下簡稱為驗後分配)，再根據驗後分配對各參數進行統計量的計算。其主要的特色在於先驗資訊的加入，使得參數估計中能帶有一些人為或已知的成分。應用在估計成本或距離函數時，最主要的優點是可以將單調性與曲度這些不等號限制條件，加諸於目標函數，由此估計得到的迴歸係數值，保證符合上述不等號限制條件。此外，貝氏方法將無效率項𝑢_𝑖𝑡視為隨機參數，由於加入先驗資訊 (先驗分配)，使得所有𝑢_𝑖𝑡可進行點估計與區間估計。相較之下，傳統的 MLE 法則是以條件帄均數 (conditional mean) 估計無效率值。

(2) 貝氏抽樣方法

待估參數的統計量是由驗後分配所決定，然而驗後分配可能是複雜的高維度分配，不易由積分得到各參數之邊際分配 (marginal distribution)。因此，需要模擬出複雜的驗後分配，從中重複抽取足夠多數的參數樣本，並以這些樣本估計參數的統計量。而馬可夫鏈蒙地卡羅法(Markov chain Monte Carlo, MCMC)，即為模擬高維度的複雜分配而使用的抽樣方法。其中有兩種方法最為常見，即 Gibbs sampling 與 Metropolis-Hasting。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

24

Gibbs sampling 的概念是，由驗後分配中推導各參數的條件分配後，對各參數的條件分配進行抽樣。而各參數抽取後的樣本帄均數，將會收斂至驗後分配中該參數的母體帄均值。此方法的關鍵在於需要推導出各參數的條件分配，因此驗後分配的型態很重要。由於驗後分配是由概似函數與先驗分配相乘，因此可透過先驗分配妥當的設定，間接地讓條件分配有著易於數學推導的型態。

相較於 Gibbs sampling，Metropolis-Hasting 法不需要知道條件分配的型態，

僅需能夠計算出某兩組參數樣本下，驗後分配的機率密度比值即可。其精神在於每次的抽樣，是根據前一次的參數樣本進行跳躍。設給定的參數向量為𝛚_𝒕，接著以𝛚_𝒕為中心，從某固定的提議分配 (proposal distribution) 中隨機抽樣，通常是選擇多維度常態分配 (multivariate normal distribution)，從中抽出下一組參數樣本𝛚_𝒕:𝟏。令𝑗(𝝎)為某參數樣本下所計算的驗後分配機率密度函數，而

𝑞(𝝎_𝒕:𝟏|𝝎_𝒕)為從𝛚_𝒕跳躍至𝛚_𝒕:𝟏之多維度常態分配機率密度。跳躍成功的機率稱 為接受率(acceptance rate)，以 r 表示，則𝑟 = 𝑚𝑖𝑛 *1,^𝑗(𝝎^𝒕+𝟏^)𝑞(𝝎^𝒕^|𝝎^𝒕+𝟏⁾

𝑗(𝝎_𝒕)𝑞(𝝎_𝒕+𝟏|𝝎_𝒕) +。若成功跳躍，則下個樣本即為𝛚_𝒕:𝟏，反之則停留在同樣的樣本𝛚_𝒕。以此規則不斷抽取參數樣本，各參數的樣本帄均數會收斂至驗後分配的母體帄均。此方法的優點在於不需要推導出條件分配，因此使用上較沒有限制，也能適用到更複雜的分配，譬如考慮限制條件的情況。相對的，此法的缺點在於抽取的參數樣本依賴於上一組的參數樣本，參數樣本間容易有較高的自我相關 (autocorrelation) 問題，導致模型收斂速度較慢³。

可參考 Patrick Breheny 所提供的教學資料，

http://web.as.uky.edu/statistics/users/pbreheny/701/S13/notes/2-28.pdf

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

25

(3) 貝氏區間估計

貝氏方法下的區間估計是透過可信區間 (credible interval) 的建立。在傳統統計學中的信賴區間屬於隨機區間，假設母體參數為固定且未知。然而貝氏方法的可信區間相反，為加入先驗資訊下建構出來的固定區間，但母體參數為隨機變數。因此兩者的解釋方式不同，可信區間解釋為母體參數位於此區間的機率。然而，不管是傳統的信賴區間或是可信區間，意義上都是為了對參數進行區間估計。

貝氏假設母體參數為隨機變數，因此我們可以用蒙地卡羅法所抽出的參數樣本取得樣本帄均數與標準差，計算出 95%的可信區間。最常用來決定區間上下分位數的方法有兩種，同尾 (equal-tail) 與最高驗後密度 (highest posterior density, HPD)。同尾可信區間意即 95%機率下，上下尾各為 2.5%之面積。由於面積對稱因此較為簡易，也較常被使用；最高密度可信區間是找出能使區間寬度極小化的上下分位數，其特色為上下分位數所計算的機率密度相等，意即這區間所包含的可能值都有著最高的驗後機率密度。然而在非對稱驗後機率密度的情況下，其上下尾的面積不同，實際使用時計算上下分位數較複雜。由於前者簡便與直觀，後續的實證分析，本文採用之。

(4) 貝氏模型診斷

參考 Flegal(2008)⁴，根據馬可夫鏈中央極限定理，若𝑔̅_𝑛為樣本帄均數，𝐸_𝜋𝑔為

在文檔中運用貝氏方法估計方向距離函數─考慮環境變數、單調性與曲度限制下之效率分析 - 政大學術集成 (頁 16-0)

環境變數

第二章 文獻回顧

第二節 環境變數

國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

9

第二節 環境變數

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

10

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

11

第三章 研究方法

第一節 方向距離函數

‧

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

14

‧

‧

‧

‧

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

20

‧

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

23

第三節 貝氏方法

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

24

可參考 Patrick Breheny 所提供的教學資料，

http://web.as.uky.edu/statistics/users/pbreheny/701/S13/notes/2-28.pdf

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

25

第二章文獻回顧

第二節環境變數

立政治大學

第二節環境變數

立政治大學

立政治大學

第三章研究方法

第一節方向距離函數

立政治大學

立政治大學

立政治大學

第三節貝氏方法

立政治大學

立政治大學