• 沒有找到結果。

第五章 實證結果

第二節 射線距離函數模型

為了與方向距離函數比較,參考O’Donnell and Coelli (2005),本文另估計產 出面射線距離函數,以下簡稱射線距離函數。射線距離函數定義為 O’Donnell and Coelli (2005) 與 Feng and Serletis (2014) 等。我們同樣設定為超越 對數的形式,其優點在於具有相當的伸縮性,且易於滿足(52)式的一階齊次性,

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

20

其中𝒘′為(61)式等號右方所有解釋變數 (包含截距項) 所構成的𝐾𝑇 × 10矩陣。𝜶 則為與其對應之10 × 1參數向量。其餘−ln𝒚, 𝝐, 𝜺都為𝐾𝑇 × 1向量。

2. 限制條件

參考O’Donnell and Coelli (2005) 與 Feng and Serletis (2014),根據射線產出 距離函數的單調性,其對產出y為非遞減且對投入𝑥1, 𝑥2為非遞增,意即

𝜕𝐷(𝑦,𝑥,𝑡)

𝜕𝑦 ≥ 0、𝜕𝐷(𝑦,𝑥,𝑡)

𝜕𝑥1 ≤ 0 與 𝜕𝐷(𝑦,𝑥,𝑡)

𝜕𝑥2 ≤ 0。由(53)式,針對y, 𝑥1, 𝑥2取偏導數後代 入(56)-(60)式,可將單調性限制整理為(詳如附錄 3)

𝑓1 = 𝛼2+ 𝛼6𝑙𝑛𝑥1+ 𝛼9𝑙𝑛𝑦 + 𝛼12𝑙𝑛𝑥2+ 𝛼13 ≤ 0 (63) 𝑓2 = 𝛼3+ 𝛼7𝑙𝑛𝑥2+ 𝛼10𝑙𝑛𝑦 + 𝛼12𝑙𝑛𝑥1+ 𝛼14𝑡 ≤ 0 (64)

產出距離函數對產出具有击性,若且唯若D(y, x, t)對於y的海森矩陣所有主子 式 (principal minor) 非負;另外,產出距離函數對投入具有準击性,充分條件為 D(y, x, t)對於𝒙的鑲邊海森矩陣 (bordered Hessian matrix) 其所有鑲邊主子式 (bordered principal minors) 為負,推導詳如附錄 4。準击性限制條件可整理為

2𝛼12𝑓1𝑓2− (𝛼6 − 𝑓1)𝑓22 − (𝛼7− 𝑓2)𝑓12 < 0 (65)

參考 Feng and Serletis (2014),射線距離函數模型的技術進步率定義為

−𝜕𝑙𝑛𝐷(𝑦,𝑥,𝑡)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

23

第三節 貝氏方法

1. 貝氏方法的介紹

(1) 架構

貝氏方法的架構,是由概似函數 (likelihood function) 乘上各參數的先驗分 配,得到聯合驗後分配 (joint posterior distribution) (以下簡稱為驗後分配),再根 據驗後分配對各參數進行統計量的計算。其主要的特色在於先驗資訊的加入,使 得參數估計中能帶有一些人為或已知的成分。應用在估計成本或距離函數時,最 主要的優點是可以將單調性與曲度這些不等號限制條件,加諸於目標函數,由此 估計得到的迴歸係數值,保證符合上述不等號限制條件。此外,貝氏方法將無效 率項𝑢𝑖𝑡視為隨機參數,由於加入先驗資訊 (先驗分配),使得所有𝑢𝑖𝑡可進行點估 計與區間估計。相較之下,傳統的 MLE 法則是以條件帄均數 (conditional mean) 估計無效率值。

(2) 貝氏抽樣方法

待估參數的統計量是由驗後分配所決定,然而驗後分配可能是複雜的高維度 分配,不易由積分得到各參數之邊際分配 (marginal distribution)。因此,需要模 擬出複雜的驗後分配,從中重複抽取足夠多數的參數樣本,並以這些樣本估計參 數的統計量。而馬可夫鏈蒙地卡羅法(Markov chain Monte Carlo, MCMC),即為 模擬高維度的複雜分配而使用的抽樣方法。其中有兩種方法最為常見,即 Gibbs sampling 與 Metropolis-Hasting。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

24

Gibbs sampling 的概念是,由驗後分配中推導各參數的條件分配後,對各參 數的條件分配進行抽樣。而各參數抽取後的樣本帄均數,將會收斂至驗後分配中 該參數的母體帄均值。此方法的關鍵在於需要推導出各參數的條件分配,因此驗 後分配的型態很重要。由於驗後分配是由概似函數與先驗分配相乘,因此可透過 先驗分配妥當的設定,間接地讓條件分配有著易於數學推導的型態。

相較於 Gibbs sampling,Metropolis-Hasting 法不需要知道條件分配的型態,

僅需能夠計算出某兩組參數樣本下,驗後分配的機率密度比值即可。其精神在於 每次的抽樣,是根據前一次的參數樣本進行跳躍。設給定的參數向量為𝛚𝒕,接 著以𝛚𝒕為中心,從某固定的提議分配 (proposal distribution) 中隨機抽樣,通常 是選擇多維度常態分配 (multivariate normal distribution),從中抽出下一組參數樣 本𝛚𝒕:𝟏。令𝑗(𝝎)為某參數樣本下所計算的驗後分配機率密度函數,而

𝑞(𝝎𝒕:𝟏|𝝎𝒕)為從𝛚𝒕跳躍至𝛚𝒕:𝟏之多維度常態分配機率密度。跳躍成功的機率稱 為接受率(acceptance rate),以 r 表示,則𝑟 = 𝑚𝑖𝑛 *1,𝑗(𝝎𝒕+𝟏)𝑞(𝝎𝒕|𝝎𝒕+𝟏)

𝑗(𝝎𝒕)𝑞(𝝎𝒕+𝟏|𝝎𝒕) +。若成功跳 躍,則下個樣本即為𝛚𝒕:𝟏,反之則停留在同樣的樣本𝛚𝒕。以此規則不斷抽取參 數樣本,各參數的樣本帄均數會收斂至驗後分配的母體帄均。此方法的優點在於 不需要推導出條件分配,因此使用上較沒有限制,也能適用到更複雜的分配,譬 如考慮限制條件的情況。相對的,此法的缺點在於抽取的參數樣本依賴於上一組 的參數樣本,參數樣本間容易有較高的自我相關 (autocorrelation) 問題,導致模 型收斂速度較慢3

3

可參考 Patrick Breheny 所提供的教學資料,

http://web.as.uky.edu/statistics/users/pbreheny/701/S13/notes/2-28.pdf

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

25

(3) 貝氏區間估計

貝氏方法下的區間估計是透過可信區間 (credible interval) 的建立。在傳統 統計學中的信賴區間屬於隨機區間,假設母體參數為固定且未知。然而貝氏方法 的可信區間相反,為加入先驗資訊下建構出來的固定區間,但母體參數為隨機變 數。因此兩者的解釋方式不同,可信區間解釋為母體參數位於此區間的機率。然 而,不管是傳統的信賴區間或是可信區間,意義上都是為了對參數進行區間估 計。

貝氏假設母體參數為隨機變數,因此我們可以用蒙地卡羅法所抽出的參數樣 本取得樣本帄均數與標準差,計算出 95%的可信區間。最常用來決定區間上下分 位數的方法有兩種,同尾 (equal-tail) 與最高驗後密度 (highest posterior density, HPD)。同尾可信區間意即 95%機率下,上下尾各為 2.5%之面積。由於面積對稱 因此較為簡易,也較常被使用;最高密度可信區間是找出能使區間寬度極小化的 上下分位數,其特色為上下分位數所計算的機率密度相等,意即這區間所包含的 可能值都有著最高的驗後機率密度。然而在非對稱驗後機率密度的情況下,其上 下尾的面積不同,實際使用時計算上下分位數較複雜。由於前者簡便與直觀,後 續的實證分析,本文採用之。

(4) 貝氏模型診斷

參考 Flegal(2008)4,根據馬可夫鏈中央極限定理,若𝑔̅𝑛為樣本帄均數,𝐸𝜋𝑔為 母體參數之期望值,則

√𝑛(𝑔̅𝑛 − 𝐸𝜋𝑔)→ 𝑁(0, 𝜎𝑑 𝑔2) (80)

4

為 James Marshall Flegal 於 2008 年所寫的文章,請參考

http://www.faculty.ucr.edu/~jflegal/Final_Thesis_twosided.pdf

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

26

由於𝜎𝑔2未知,需用樣本統計量 𝜎̂𝑔2估計得到。𝜎̂𝑔2的計算,可藉由群組帄均 (batch means)。設總抽樣次數為n = ab,分成 a 群,每群有 b 個樣本 (通常令a = b = √𝑛)。

各群組帄均可表示為 𝑌̅𝑗 =1

𝑏∑𝑗𝑏𝑖<(𝑗;1)𝑏:1𝑥𝑖 j = 1, … , a (81) 𝜎̂𝑔2 = 𝑏

𝑎;1∑𝑎𝑗<1(𝑌̅𝑗− 𝑔̅𝑛)2 (82) 蒙地卡羅誤差 (Monte Carlo standard error, MC error)定義為𝜎̂𝑔

√𝑛,來自於蒙地卡羅 抽樣時,以樣本帄均數估計母體帄均數所造成的誤差,相當於統計學中估計值之 標準誤。

貝氏估計方法下,檢測估計值收斂與否,常見的診斷方法如 Geweke、Gelman and Rubins 等。然而,如Fernández et al. (2000) 提到,方向距離函數加入參數 限制條件時,由於不能證明參數的母體帄均數與標準差等統計量存在,故這些診 斷方法不能夠直接應用。我們轉而參考後續 Lin and Lan (2010)5 所使用的比較簡 易判斷方法,即利用蒙地卡羅誤差,若某參數之蒙地卡羅誤差小於 5%的樣本標 準差,即將該參數估計值視為收斂。

2. 貝氏方法在方向距離函數的設定

(1) 方向距離函數下的先驗分配

貝氏方法涉及到先驗資訊的給定,參考 (19) 式,模型中的待估參數為𝜷、𝜎2、 𝑢𝑖𝑡與其高階參數𝜆;1。參考 Feng and Serletis (2014),𝜷的先驗分配設定為

𝑝(𝜷) ∝ 𝐼(𝜷 ∈ 𝑅𝑗𝜷) (83)

5

可參考 Erwin T. J. Lin and Lawrence W. Lan, ―Measuring Firm-specific Efficiencies with Bayesian

Stochastic Distance Function‖,於 2010 年之研討會論文。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

27

其中𝐼(˙)為1 或 0 的指標函數;𝑅𝑗𝜷為能滿足單調性與曲度限制的𝜷集合,j=0 為無 限制,j=1 則需同時滿足單調性與曲度限制。

為了驗後分配的推導方便,以𝑕 = 1

𝜎2作𝜎2的替換變數,𝑕的先驗分配設定為 𝑝(𝑕) ∝ 1

𝑕 (84) 其中𝑕 = 1

𝜎2> 0,此設定與 O’Donnell and Coelli (2005) 與 Feng and Serletis (2014) 相同,屬於無資訊先驗分配 (non-informative prior),可以簡化後續 h 之條件分配 的推導過程。

𝑢𝑖𝑡的先驗分配設定為指數分配

𝑝(𝑢𝑖𝑡|𝜆;1) = 𝐸𝑥𝑝(𝑢𝑖𝑡|𝜆;1) (85) 根據 Broeck et al. (1994),指數分配對於先驗分配的選取是較穩健的。另一優點 為簡化條件分配的推導,因此我們同樣選擇指數分配。

(85)式需要給定其分配之參數𝜆;1先驗分配,設定為指數分配

𝑝(𝜆;1) = 𝐸𝑥𝑝(𝜆;1|𝜌) (86) 以方向距離函數而言,𝜌為資料期間內對無效率值的先驗認知。在無限制模型,

由於沒有帄均無效率值的資訊,採用 Feng and Serletis (2014)同樣的方法,設 𝜌 = 50% × 𝑦̅,同時嘗詴設定不同的𝜌,作為穩健性 (robustness) 檢查。Feng and Serletis (2014) 的實證結果,確認給定不同高階參數𝜌,參數估計值具有穩健性。

在我們後續的實證分析中,結果也是如此。而在有限制模型,設定𝜌為無限制模 型且無環境變數下所估計的無效率值中位數。

參考 Feng and Serletis (2014),將驗後分配積分,可得各參數的條件分配,

分別為

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

29

𝑕與𝜆;1的隨機抽樣,相當於分別從 (90) 與 (92) 式的伽瑪分配 (Gamma distribution) 中抽取。而𝒖的抽樣,相當於從 (91) 式的截斷常態分配 (truncated normal distribution) 中抽取。抽樣𝜷的 (89) 式則較為麻煩,由於出現指標函數,

該條件分配並非常態分配,無法直接藉由 Gibbs Sampling 抽出滿足限制條件的參 數樣本。然而,我們還是能藉由常態分配與指標函數的數值相乘,得到機率密度 的數值。因此我們針對𝜷抽樣時,可以仿照 O’Donnell and Coelli (2005),使用 Metropolis-Hasting,該方法下,我們抽出的𝜷樣本帄均也將收斂到𝜷條件分配的 母體帄均。由於我們只針對 Gibbs sampling 中難以抽樣的某條件分配,採用 Metropolis-Hasting 抽樣方法,故可稱為 Metropolis-Hasting Within Gibbs6

3. 貝氏方法在射線距離函數的設定

(1) 射線距離函數下的先驗分配

貝氏方法在射線距離函數與在方向距離函數的設定形式是類似的。參考 (61) 式,模型中的待估參數為𝛂、𝜎𝜀2、𝜖𝑖𝑡與其高階參數𝜆𝜖;1。𝛂的先驗分配設定為 𝑝(𝛂) ∝ 𝐼(𝛂 ∈ 𝑅𝑗𝜶) (93) 其中𝐼(˙)為1 或 0 的指標函數;𝑅𝑗𝜶為能滿足單調性與曲度限制的𝜶集合,j=0 為無 限制,j=1 則需同時滿足單調性與曲度限制。

為了驗後分配推導方便,以𝑕𝜀 = 1

𝜎𝜀2作𝜎𝜀2的替換變數,𝑕𝜀的先驗分配設定為 𝑝(𝑕𝜀) ∝ 1

𝑕𝜀 (94)

6

可參考 Patrick Breheny,http://web.as.uky.edu/statistics/users/pbreheny/701/S13/notes/2-28.pdf

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

30

𝜖𝑖𝑡的先驗分配設定為指數分配

𝑝(𝜖𝑖𝑡|𝜆𝜖;1) = 𝐸𝑥𝑝(𝜖𝑖𝑡|𝜆;1𝜖 ) (95)

指數分配之參數𝜆𝜖;1先驗分配,同樣設定為指數分配

𝑝(𝜆𝜖;1) = 𝐸𝑥𝑝(𝜆𝜖;1| − ln (𝜌𝜖)) (96) 𝜌𝜖為資料期間內對技術效率值的先驗認知,採用 Feng and Serletis (2014)同樣的設 定,設𝜌𝜖 = 0.83。同時嘗詴設定不同的𝜌𝜖,結果顯示在不同𝜌𝜖下對於參數估計是 穩健的。

(2) 射線距離函數下的驗後分配

如果誤差項𝜺假設為常態分配,可推導出概似函數為 𝐿(−𝑙𝑛𝒚|𝛂, 𝑕𝜀, 𝝐, 𝜆𝜖;1) = ∏ ∏ 8√𝑕𝜀

2𝜋× 𝑒𝑥𝑝 0−𝑕𝜀

2 (−𝑙𝑛𝑦𝑖𝑡− 𝒘𝒊𝒕𝛂 − 𝜖𝑖𝑡)219

𝑇𝑡<1

𝐾𝑖<1 ∝

𝑕𝜀𝐾𝑇2 𝑒𝑥𝑝 ,−𝑕𝜀

2 𝒗𝜺′𝒗𝜺- (97) 其中𝒗𝜺= (−ln𝒚 − 𝒘𝛂 − 𝝐)。

結合概似函數與各參數的先驗分配,可得驗後分配 𝑓(𝛂, 𝑕𝜀, 𝝐, 𝜆𝜖;1| − 𝑙𝑛𝒚) ∝ 𝑕𝜀𝐾𝑇2 ;1exp ,−𝑕𝜀

2 𝒗𝜺′𝒗𝜺- 𝐼(𝛂 ∈ 𝑅𝑗𝜶)

× ∏𝐾𝑖<1𝑇𝑡<1,𝜆;1𝜖 𝑒𝑥𝑝(−𝜆𝜖;1𝜖𝑖𝑡)-× 𝑒𝑥𝑝 (ln (𝜌𝜖)𝜆𝜖;1) (98) 由於無法直接從高維度的驗後分配中抽取參數樣本,因此同樣利用先前提到的 Gibbs sampling,從各參數的條件分配中分別抽樣。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

31

(3) 射線距離函數下的條件分配

各參數的條件分配分別為

𝑝(𝛂| − 𝑙𝑛𝒚, 𝑕𝜀, 𝝐, 𝜆𝜖;1) ∝ 𝑓𝑁𝑜𝑟𝑚𝑎𝑙(𝛂|𝒃𝛂, 𝑕𝜀;1(𝒘𝒘′);1) 𝐼(𝛂 ∈ 𝑅𝑗𝜶) (99) 𝑝(𝑕𝜀| − 𝑙𝑛𝒚, 𝛂, 𝝐, 𝜆𝜖;1) ∝ 𝑓𝐺𝑎𝑚𝑚𝑎(𝑕𝜀|𝐾𝑇

2 ,1

2𝒗𝜺′𝒗𝜺) (100) 𝑝(𝝐| − 𝑙𝑛𝒚, 𝛂, 𝑕𝜀, 𝜆𝜖;1) ∝ 𝑓𝑁𝑜𝑟𝑚𝑎𝑙(𝝐| − 𝑙𝑛𝒚 − 𝒘𝛂 − (𝑕𝜀𝜆𝜀);1𝜾𝑲𝑻, 𝑕𝜀;1𝐈𝐊𝐓)

× ∏𝐾𝑖<1𝑇𝑡<1𝐼(𝜖𝑖𝑡 ≥ 0) (101) 𝑝(𝜆𝜖;1| − 𝑙𝑛𝒚, 𝛂, 𝑕𝜀, 𝝐) ∝ 𝑓𝐺𝑎𝑚𝑚𝑎(𝜆𝜖;1|𝐾𝑇 + 1, 𝝐𝜾𝑲𝑻− ln (𝜌)) (102) 其中𝒃𝛂 = (𝒘𝒘′);1𝒘,−𝑙𝑛𝒚 − 𝝐-,𝐈𝐊𝐓為KT × 𝐾𝑇的單位矩陣,𝜾𝑲𝑻為由 1 組成的 KT × 1向量。

𝑕𝜀與𝜆𝜖;1為從伽瑪分配中抽樣,而𝝐是從截斷常態分配中抽樣。𝛂的抽樣較麻 煩,由於指標函數的存在,使得該條件分配並非常態分配,無法直接藉由 Gibbs sampling 抽出滿足限制條件的參數樣本。因此仿照在方向距離函數模型下的做法,

如同(89)式使用 Metropolis-Hasting。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

32

第四節 環境變數

1. 環境變數模型

在先前方向距離函數的模型設定中,假設𝑢𝑖𝑡~𝐸𝑥𝑝(𝜆;1),對於所有𝑢𝑖𝑡的都 給定相同的先驗分配參數𝜆;1。然而,先驗分配參數的設定也會影響後續的參數

在先前方向距離函數的模型設定中,假設𝑢𝑖𝑡~𝐸𝑥𝑝(𝜆;1),對於所有𝑢𝑖𝑡的都 給定相同的先驗分配參數𝜆;1。然而,先驗分配參數的設定也會影響後續的參數

相關文件