射線距離函數模型

第五章實證結果

第二節射線距離函數模型

為了與方向距離函數比較，參考O’Donnell and Coelli (2005)，本文另估計產出面射線距離函數，以下簡稱射線距離函數。射線距離函數定義為 O’Donnell and Coelli (2005) 與 Feng and Serletis (2014) 等。我們同樣設定為超越對數的形式，其優點在於具有相當的伸縮性，且易於滿足(52)式的一階齊次性，

‧

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

20

其中𝒘′為(61)式等號右方所有解釋變數 (包含截距項) 所構成的𝐾𝑇 × 10矩陣。𝜶 則為與其對應之10 × 1參數向量。其餘−ln𝒚, 𝝐, 𝜺都為𝐾𝑇 × 1向量。

2. 限制條件

參考O’Donnell and Coelli (2005) 與 Feng and Serletis (2014)，根據射線產出距離函數的單調性，其對產出y為非遞減且對投入𝑥₁, 𝑥₂為非遞增，意即

𝜕𝐷(𝑦,𝑥,𝑡)

𝜕𝑦 ≥ 0、^{𝜕𝐷(𝑦,𝑥,𝑡)}

𝜕𝑥₁ ≤ 0 與 ^{𝜕𝐷(𝑦,𝑥,𝑡)}

𝜕𝑥₂ ≤ 0。由(53)式，針對y, 𝑥₁, 𝑥₂取偏導數後代入(56)-(60)式，可將單調性限制整理為(詳如附錄 3)

𝑓₁ = 𝛼₂+ 𝛼₆𝑙𝑛𝑥₁+ 𝛼₉𝑙𝑛𝑦 + 𝛼₁₂𝑙𝑛𝑥₂+ 𝛼₁₃ ≤ 0 (63) 𝑓₂ = 𝛼₃+ 𝛼₇𝑙𝑛𝑥₂+ 𝛼₁₀𝑙𝑛𝑦 + 𝛼₁₂𝑙𝑛𝑥₁+ 𝛼₁₄𝑡 ≤ 0 (64)

產出距離函數對產出具有击性，若且唯若D(y, x, t)對於y的海森矩陣所有主子式 (principal minor) 非負；另外，產出距離函數對投入具有準击性，充分條件為 D(y, x, t)對於𝒙的鑲邊海森矩陣 (bordered Hessian matrix) 其所有鑲邊主子式 (bordered principal minors) 為負，推導詳如附錄 4。準击性限制條件可整理為

2𝛼₁₂𝑓₁𝑓₂− (𝛼₆ − 𝑓₁)𝑓₂² − (𝛼₇− 𝑓₂)𝑓₁² < 0 (65)

‧

參考 Feng and Serletis (2014)，射線距離函數模型的技術進步率定義為

−𝜕𝑙𝑛𝐷(𝑦,𝑥,𝑡)

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

23 第三節貝氏方法

1. 貝氏方法的介紹

(1) 架構

貝氏方法的架構，是由概似函數 (likelihood function) 乘上各參數的先驗分配，得到聯合驗後分配 (joint posterior distribution) (以下簡稱為驗後分配)，再根據驗後分配對各參數進行統計量的計算。其主要的特色在於先驗資訊的加入，使得參數估計中能帶有一些人為或已知的成分。應用在估計成本或距離函數時，最主要的優點是可以將單調性與曲度這些不等號限制條件，加諸於目標函數，由此估計得到的迴歸係數值，保證符合上述不等號限制條件。此外，貝氏方法將無效率項𝑢_𝑖𝑡視為隨機參數，由於加入先驗資訊 (先驗分配)，使得所有𝑢_𝑖𝑡可進行點估計與區間估計。相較之下，傳統的 MLE 法則是以條件帄均數 (conditional mean) 估計無效率值。

(2) 貝氏抽樣方法

待估參數的統計量是由驗後分配所決定，然而驗後分配可能是複雜的高維度分配，不易由積分得到各參數之邊際分配 (marginal distribution)。因此，需要模擬出複雜的驗後分配，從中重複抽取足夠多數的參數樣本，並以這些樣本估計參數的統計量。而馬可夫鏈蒙地卡羅法(Markov chain Monte Carlo, MCMC)，即為模擬高維度的複雜分配而使用的抽樣方法。其中有兩種方法最為常見，即 Gibbs sampling 與 Metropolis-Hasting。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

24

Gibbs sampling 的概念是，由驗後分配中推導各參數的條件分配後，對各參數的條件分配進行抽樣。而各參數抽取後的樣本帄均數，將會收斂至驗後分配中該參數的母體帄均值。此方法的關鍵在於需要推導出各參數的條件分配，因此驗後分配的型態很重要。由於驗後分配是由概似函數與先驗分配相乘，因此可透過先驗分配妥當的設定，間接地讓條件分配有著易於數學推導的型態。

相較於 Gibbs sampling，Metropolis-Hasting 法不需要知道條件分配的型態，

僅需能夠計算出某兩組參數樣本下，驗後分配的機率密度比值即可。其精神在於每次的抽樣，是根據前一次的參數樣本進行跳躍。設給定的參數向量為𝛚_𝒕，接著以𝛚_𝒕為中心，從某固定的提議分配 (proposal distribution) 中隨機抽樣，通常是選擇多維度常態分配 (multivariate normal distribution)，從中抽出下一組參數樣本𝛚_𝒕:𝟏。令𝑗(𝝎)為某參數樣本下所計算的驗後分配機率密度函數，而

𝑞(𝝎_𝒕:𝟏|𝝎_𝒕)為從𝛚_𝒕跳躍至𝛚_𝒕:𝟏之多維度常態分配機率密度。跳躍成功的機率稱 為接受率(acceptance rate)，以 r 表示，則𝑟 = 𝑚𝑖𝑛 *1,^𝑗(𝝎^𝒕+𝟏^)𝑞(𝝎^𝒕^|𝝎^𝒕+𝟏⁾

𝑗(𝝎_𝒕)𝑞(𝝎_𝒕+𝟏|𝝎_𝒕) +。若成功跳躍，則下個樣本即為𝛚_𝒕:𝟏，反之則停留在同樣的樣本𝛚_𝒕。以此規則不斷抽取參數樣本，各參數的樣本帄均數會收斂至驗後分配的母體帄均。此方法的優點在於不需要推導出條件分配，因此使用上較沒有限制，也能適用到更複雜的分配，譬如考慮限制條件的情況。相對的，此法的缺點在於抽取的參數樣本依賴於上一組的參數樣本，參數樣本間容易有較高的自我相關 (autocorrelation) 問題，導致模型收斂速度較慢³。

可參考 Patrick Breheny 所提供的教學資料，

http://web.as.uky.edu/statistics/users/pbreheny/701/S13/notes/2-28.pdf

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

25

(3) 貝氏區間估計

貝氏方法下的區間估計是透過可信區間 (credible interval) 的建立。在傳統統計學中的信賴區間屬於隨機區間，假設母體參數為固定且未知。然而貝氏方法的可信區間相反，為加入先驗資訊下建構出來的固定區間，但母體參數為隨機變數。因此兩者的解釋方式不同，可信區間解釋為母體參數位於此區間的機率。然而，不管是傳統的信賴區間或是可信區間，意義上都是為了對參數進行區間估計。

貝氏假設母體參數為隨機變數，因此我們可以用蒙地卡羅法所抽出的參數樣本取得樣本帄均數與標準差，計算出 95%的可信區間。最常用來決定區間上下分位數的方法有兩種，同尾 (equal-tail) 與最高驗後密度 (highest posterior density, HPD)。同尾可信區間意即 95%機率下，上下尾各為 2.5%之面積。由於面積對稱因此較為簡易，也較常被使用；最高密度可信區間是找出能使區間寬度極小化的上下分位數，其特色為上下分位數所計算的機率密度相等，意即這區間所包含的可能值都有著最高的驗後機率密度。然而在非對稱驗後機率密度的情況下，其上下尾的面積不同，實際使用時計算上下分位數較複雜。由於前者簡便與直觀，後續的實證分析，本文採用之。

(4) 貝氏模型診斷

參考 Flegal(2008)⁴，根據馬可夫鏈中央極限定理，若𝑔̅_𝑛為樣本帄均數，𝐸_𝜋𝑔為母體參數之期望值，則

√𝑛(𝑔̅_𝑛 − 𝐸_𝜋𝑔)→ 𝑁(0, 𝜎^𝑑 _𝑔²) (80)

為 James Marshall Flegal 於 2008 年所寫的文章，請參考

http://www.faculty.ucr.edu/~jflegal/Final_Thesis_twosided.pdf

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

26

由於𝜎_𝑔²未知，需用樣本統計量 𝜎̂_𝑔²估計得到。𝜎̂_𝑔²的計算，可藉由群組帄均 (batch means)。設總抽樣次數為n = ab，分成 a 群，每群有 b 個樣本 (通常令a = b = √𝑛)。

各群組帄均可表示為 𝑌̅_𝑗 =¹

𝑏∑^𝑗𝑏𝑖<(𝑗;1)𝑏:1𝑥_𝑖 j = 1, … , a (81) 𝜎̂_𝑔² = ^𝑏

𝑎;1∑^𝑎_𝑗<1(𝑌̅_𝑗− 𝑔̅_𝑛)² (82) 蒙地卡羅誤差 (Monte Carlo standard error, MC error)定義為^𝜎^̂^𝑔

√𝑛，來自於蒙地卡羅抽樣時，以樣本帄均數估計母體帄均數所造成的誤差，相當於統計學中估計值之標準誤。

貝氏估計方法下，檢測估計值收斂與否，常見的診斷方法如 Geweke、Gelman and Rubins 等。然而，如Fernández et al. (2000) 提到，方向距離函數加入參數限制條件時，由於不能證明參數的母體帄均數與標準差等統計量存在，故這些診斷方法不能夠直接應用。我們轉而參考後續 Lin and Lan (2010)⁵ 所使用的比較簡易判斷方法，即利用蒙地卡羅誤差，若某參數之蒙地卡羅誤差小於 5%的樣本標準差，即將該參數估計值視為收斂。

2. 貝氏方法在方向距離函數的設定

(1) 方向距離函數下的先驗分配

貝氏方法涉及到先驗資訊的給定，參考 (19) 式，模型中的待估參數為𝜷、𝜎²、 𝑢_𝑖𝑡與其高階參數𝜆^;1。參考 Feng and Serletis (2014)，𝜷的先驗分配設定為

𝑝(𝜷) ∝ 𝐼(𝜷 ∈ 𝑅_𝑗^𝜷) (83)

可參考 Erwin T. J. Lin and Lawrence W. Lan, ―Measuring Firm-specific Efficiencies with Bayesian

Stochastic Distance Function‖，於 2010 年之研討會論文。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

27

其中𝐼(˙)為1 或 0 的指標函數；𝑅_𝑗^𝜷為能滿足單調性與曲度限制的𝜷集合，j=0 為無限制，j=1 則需同時滿足單調性與曲度限制。

為了驗後分配的推導方便，以𝑕 = ¹

𝜎²作𝜎²的替換變數，𝑕的先驗分配設定為 𝑝(𝑕) ∝ ¹

𝑕 (84) 其中𝑕 = ¹

𝜎²> 0，此設定與 O’Donnell and Coelli (2005) 與 Feng and Serletis (2014) 相同，屬於無資訊先驗分配 (non-informative prior)，可以簡化後續 h 之條件分配的推導過程。

𝑢_𝑖𝑡的先驗分配設定為指數分配

𝑝(𝑢_𝑖𝑡|𝜆^;1) = 𝐸𝑥𝑝(𝑢_𝑖𝑡|𝜆^;1) (85) 根據 Broeck et al. (1994)，指數分配對於先驗分配的選取是較穩健的。另一優點為簡化條件分配的推導，因此我們同樣選擇指數分配。

(85)式需要給定其分配之參數𝜆^;1先驗分配，設定為指數分配

𝑝(𝜆^;1) = 𝐸𝑥𝑝(𝜆^;1|𝜌^∗) (86) 以方向距離函數而言，𝜌^∗為資料期間內對無效率值的先驗認知。在無限制模型，

由於沒有帄均無效率值的資訊，採用 Feng and Serletis (2014)同樣的方法，設 𝜌^∗ = 50% × 𝑦̅，同時嘗詴設定不同的𝜌^∗，作為穩健性 (robustness) 檢查。Feng and Serletis (2014) 的實證結果，確認給定不同高階參數𝜌^∗，參數估計值具有穩健性。

在我們後續的實證分析中，結果也是如此。而在有限制模型，設定𝜌^∗為無限制模型且無環境變數下所估計的無效率值中位數。

‧

參考 Feng and Serletis (2014)，將驗後分配積分，可得各參數的條件分配，

分別為

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

29

𝑕與𝜆^;1的隨機抽樣，相當於分別從 (90) 與 (92) 式的伽瑪分配 (Gamma distribution) 中抽取。而𝒖的抽樣，相當於從 (91) 式的截斷常態分配 (truncated normal distribution) 中抽取。抽樣𝜷的 (89) 式則較為麻煩，由於出現指標函數，

該條件分配並非常態分配，無法直接藉由 Gibbs Sampling 抽出滿足限制條件的參數樣本。然而，我們還是能藉由常態分配與指標函數的數值相乘，得到機率密度的數值。因此我們針對𝜷抽樣時，可以仿照 O’Donnell and Coelli (2005)，使用 Metropolis-Hasting，該方法下，我們抽出的𝜷樣本帄均也將收斂到𝜷條件分配的母體帄均。由於我們只針對 Gibbs sampling 中難以抽樣的某條件分配，採用 Metropolis-Hasting 抽樣方法，故可稱為 Metropolis-Hasting Within Gibbs⁶。

3. 貝氏方法在射線距離函數的設定

(1) 射線距離函數下的先驗分配

貝氏方法在射線距離函數與在方向距離函數的設定形式是類似的。參考 (61) 式，模型中的待估參數為𝛂、𝜎_𝜀²、𝜖_𝑖𝑡與其高階參數𝜆_𝜖^;1。𝛂的先驗分配設定為 𝑝(𝛂) ∝ 𝐼(𝛂 ∈ 𝑅_𝑗^𝜶) (93) 其中𝐼(˙)為1 或 0 的指標函數；𝑅_𝑗^𝜶為能滿足單調性與曲度限制的𝜶集合，j=0 為無限制，j=1 則需同時滿足單調性與曲度限制。

為了驗後分配推導方便，以𝑕_𝜀 = ¹

𝜎_𝜀²作𝜎_𝜀²的替換變數，𝑕_𝜀的先驗分配設定為 𝑝(𝑕_𝜀) ∝ ¹

𝑕_𝜀 (94)

可參考 Patrick Breheny，http://web.as.uky.edu/statistics/users/pbreheny/701/S13/notes/2-28.pdf

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

30

𝜖_𝑖𝑡的先驗分配設定為指數分配

𝑝(𝜖_𝑖𝑡|𝜆_𝜖^;1) = 𝐸𝑥𝑝(𝜖_𝑖𝑡|𝜆^;1_𝜖 ) (95)

指數分配之參數𝜆_𝜖^;1先驗分配，同樣設定為指數分配

𝑝(𝜆_𝜖^;1) = 𝐸𝑥𝑝(𝜆_𝜖^;1| − ln (𝜌_𝜖^∗)) (96) 𝜌_𝜖^∗為資料期間內對技術效率值的先驗認知，採用 Feng and Serletis (2014)同樣的設定，設𝜌_𝜖^∗ = 0.83。同時嘗詴設定不同的𝜌_𝜖^∗，結果顯示在不同𝜌_𝜖^∗下對於參數估計是穩健的。

(2) 射線距離函數下的驗後分配

如果誤差項𝜺假設為常態分配，可推導出概似函數為 𝐿(−𝑙𝑛𝒚|𝛂, 𝑕_𝜀, 𝝐, 𝜆_𝜖^;1) = ∏ ∏ 8√^𝑕^𝜀

2𝜋× 𝑒𝑥𝑝 0−^𝑕^𝜀

2 (−𝑙𝑛𝑦_𝑖𝑡− 𝒘^′_𝒊𝒕𝛂 − 𝜖_𝑖𝑡)²19

𝑇𝑡<1

𝐾𝑖<1 ∝

𝑕_𝜀^𝐾𝑇² 𝑒𝑥𝑝 ,−^𝑕^𝜀

2 𝒗_𝜺′𝒗_𝜺- (97) 其中𝒗_𝜺= (−ln𝒚 − 𝒘^′𝛂 − 𝝐)。

結合概似函數與各參數的先驗分配，可得驗後分配 𝑓(𝛂, 𝑕_𝜀, 𝝐, 𝜆_𝜖^;1| − 𝑙𝑛𝒚) ∝ 𝑕_𝜀^𝐾𝑇^{2 ;1}exp ,−𝑕_𝜀

2 𝒗_𝜺′𝒗_𝜺- 𝐼(𝛂 ∈ 𝑅_𝑗^𝜶)

× ∏^𝐾_𝑖<1∏^𝑇_𝑡<1,𝜆^;1_𝜖 𝑒𝑥𝑝(−𝜆_𝜖^;1𝜖_𝑖𝑡)-× 𝑒𝑥𝑝 (ln (𝜌_𝜖^∗)𝜆_𝜖^;1) (98) 由於無法直接從高維度的驗後分配中抽取參數樣本，因此同樣利用先前提到的 Gibbs sampling，從各參數的條件分配中分別抽樣。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

31

(3) 射線距離函數下的條件分配

各參數的條件分配分別為

𝑝(𝛂| − 𝑙𝑛𝒚, 𝑕_𝜀, 𝝐, 𝜆_𝜖^;1) ∝ 𝑓_{𝑁𝑜𝑟𝑚𝑎𝑙}(𝛂|𝒃_𝛂, 𝑕_𝜀^;1(𝒘𝒘′)^;1) 𝐼(𝛂 ∈ 𝑅_𝑗^𝜶) (99) 𝑝(𝑕_𝜀| − 𝑙𝑛𝒚, 𝛂, 𝝐, 𝜆_𝜖^;1) ∝ 𝑓_{𝐺𝑎𝑚𝑚𝑎}(𝑕_𝜀|^𝐾𝑇

2 ,¹

2𝒗_𝜺′𝒗_𝜺) (100) 𝑝(𝝐| − 𝑙𝑛𝒚, 𝛂, 𝑕_𝜀, 𝜆_𝜖^;1) ∝ 𝑓_{𝑁𝑜𝑟𝑚𝑎𝑙}(𝝐| − 𝑙𝑛𝒚 − 𝒘^′𝛂 − (𝑕_𝜀𝜆_𝜀)^;1𝜾_𝑲𝑻, 𝑕_𝜀^;1𝐈_𝐊𝐓)

× ∏^𝐾_𝑖<1∏^𝑇_𝑡<1𝐼(𝜖_𝑖𝑡 ≥ 0) (101) 𝑝(𝜆_𝜖^;1| − 𝑙𝑛𝒚, 𝛂, 𝑕_𝜀, 𝝐) ∝ 𝑓_{𝐺𝑎𝑚𝑚𝑎}(𝜆_𝜖^;1|𝐾𝑇 + 1, 𝝐^′𝜾_𝑲𝑻− ln (𝜌^∗)) (102) 其中𝒃_𝛂 = (𝒘𝒘′)^;1𝒘,−𝑙𝑛𝒚 − 𝝐-，𝐈_𝐊𝐓為KT × 𝐾𝑇的單位矩陣，𝜾_𝑲𝑻為由 1 組成的 KT × 1向量。

𝑕_𝜀與𝜆_𝜖^;1為從伽瑪分配中抽樣，而𝝐是從截斷常態分配中抽樣。𝛂的抽樣較麻煩，由於指標函數的存在，使得該條件分配並非常態分配，無法直接藉由 Gibbs sampling 抽出滿足限制條件的參數樣本。因此仿照在方向距離函數模型下的做法，

如同(89)式使用 Metropolis-Hasting。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

32 第四節環境變數

1. 環境變數模型

在先前方向距離函數的模型設定中，假設𝑢_𝑖𝑡~𝐸𝑥𝑝(𝜆^;1)，對於所有𝑢_𝑖𝑡的都給定相同的先驗分配參數𝜆^;1。然而，先驗分配參數的設定也會影響後續的參數

在文檔中運用貝氏方法估計方向距離函數─考慮環境變數、單調性與曲度限制下之效率分析 - 政大學術集成 (頁 25-89)

第五章 實證結果

第二節 射線距離函數模型

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

20

‧

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

23

第三節 貝氏方法

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

24

可參考 Patrick Breheny 所提供的教學資料，

http://web.as.uky.edu/statistics/users/pbreheny/701/S13/notes/2-28.pdf

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

25

為 James Marshall Flegal 於 2008 年所寫的文章，請參考

http://www.faculty.ucr.edu/~jflegal/Final_Thesis_twosided.pdf

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

26

可參考 Erwin T. J. Lin and Lawrence W. Lan, ―Measuring Firm-specific Efficiencies with Bayesian

Stochastic Distance Function‖，於 2010 年之研討會論文。

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

27

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

29

可參考 Patrick Breheny，http://web.as.uky.edu/statistics/users/pbreheny/701/S13/notes/2-28.pdf

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

30

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

31

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

32

第四節 環境變數

第五章實證結果

第二節射線距離函數模型

立政治大學

立政治大學

第三節貝氏方法

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

第四節環境變數