行政院國家科學委員會補助專題研究計畫
V 成果報告 □期中進度報告中國大陸城市生產效率之估計:貝氏隨機效率前緣函數之應用
計畫類別:V 個別型計畫 □ 整合型計畫
計畫編號:NSC 94 - 2415 -H - 004 - 015 -
執行期間:2005 年 8 月 1 日至 2007 年 1 月 31 日
計畫主持人:林祖嘉
成果報告類型(依經費核定清單規定繳交):V 精簡報告 □完整報告
本成果報告包括以下應繳交之附件:
V 赴國外出差或研習心得報告一份
□赴大陸地區出差或研習心得報告一份
□出席國際學術會議心得報告及發表之論文各一份
□國際合作研究計畫國外研究報告書一份
處理方式:除產學合作研究計畫、提升產業技術及人才培育研究計
畫、列管計畫及下列情形者外,得立即公開查詢
□涉及專利或其他智慧財產權,□一年□二年後可公開查詢
執行單位:國立政治大學經濟學系
中 華 民 國 96 年 6 月 14 日
中國大陸城市生產效率之估計:貝氏隨機效率前緣函數之應用
摘要 中國自1979年改革開放迄今已有25年,從最初採行的經貿特區制度,到現 今的東南沿海城市全面繁榮,且有逐漸往內陸城市發展的趨勢,每個城市發展均 有其特色,這樣的特色可能來自於地理因素、最初發展的產業型態、或者是法令 上的限制等,相較台灣而言,中國城市發展的面貌其差異會來得更大。 在此潮流之下,比較兩岸三地城市競爭力的差異與排名遂成為學術界熱門的 課題,每個城市均有其特徵,但仍須依賴有效的統計指標進行彙整,在衡量企業 相對競爭力與生產力的上,以隨機效率前緣(Stochastic Frontier Approach)模型 最受界青睞。其特徵是能將影響生產力的因素參數化,供研究者進行實證上的比 較,在資料屬性差異不大且產業特徵能有效量化的前提下,傳統的隨機效率前緣 模型能有效的推估相對競爭力高低,但假使分析的對象存在許多無法量化的因 素,這時傳統模型便面臨很大的挑戰。 本研究仍將延續隨機效率前緣的分析架構,並嘗試以各種不同的生產函數進 行推估,來檢視城市效率排名的變化,唯推估時,本文將採用貝氏(Bayesian) 技巧進行推論,藉助馬可夫(Markovian)的收斂性質,反覆進行抽樣,將無法量 化的因素分配化,以此來修正傳統模型的缺失。 關鍵詞:城市競爭力、MCMC、貝氏、隨機效率前緣一、前言 城市間相對競爭力的比較,在現今的研究文獻上,大多以計算指標的方式來 呈現,如計算人均所得排名、企業管理排名等,1但卻沒有一統一的統計量來大 致衡量城市的相對競爭力。主要因影響一個城市發展的因素實在太多,所得的提 高固然首要之務,但伴隨而來的貧富不均、犯罪率的增加,卻會對一個城市的發 展產生負面的影響;地理因素的差異與天然資源蘊藏量的多寡使得有效量化相對 困難,而法令上的規範與產業獎勵措施在每個省分更是不盡相同,中國當局為鼓 勵產業西進或抑制沿海城市發展過快所衍生的問題,會採用不同的法令規範。除 此之外,外人投資行為在城市發展的過程中亦佔據主導性的地位,部分城市或特 定區域形成一完整的產業供給鍊,且各俱特色,相較於已開發國家,開發中國家 的外人投資對該國產業發展具有決定性的影響,中國亦不例外,但有時我們很難 真正區分投資來源為純粹的外國資本或與當地資本的合資,然反映在統計數據 上,僅為一加總後的投資總額,研究者很難真正去瞭解其中的內容為何,乃至於 所投資的產業屬性。 由於我們的分析對象遠比分析一般產業來的複雜,在傳統的隨機效率前緣模 型(以下簡稱SFA)下,必須採用大量的虛擬變數或相對應的變數來過濾影響城市 發展的因子,假使變數掌握得宜,在樣本數夠大的前提下,亦能有效分析相對競 爭力的差異。然本研究分析的城市數目為285個,樣本的數目尚可,但實際估計 時卻可能遭遇需多困難,許多影響城市發展的因素無法有效量化,甚至是無法有 效量化,這些影響對城市效率估計可能是決定性的影響,以統計術語而言,相當 於是遺漏重要變數,整個推論與估計都形成偏誤,當然效率也就不可能被精確的 衡量出來。2 面對這種情況,貝氏推估的應用便顯的理所當然,因真實的參數無法精確的 被估計,也可說因樣本的不同而影響參數的估計,貝氏分析遂將無法量化的影響 轉化成一分配,此一分配代表無法量化因素或樣本差異對模型估計參數的影響, 並將此影響傳遞至效率的估計,因此我們所關心的估計參數,包括城市效率皆以 分配的方式呈現。 國內文獻以貝氏估計的方式進行SFA模型的推論並不多見,國外文獻則以 Koop, Steel and Osiewalski(1995)使用貝氏技巧推估Greene(1990)文中所使用
資料,3來重新詮釋SFA模型(Bayesian SFA,以下簡稱BSFA),並指出兩者間的
差異。因此本研究以BSFA推論中國城市競爭力排名,在議題上及方法上皆是首 創,此為本文的主要貢獻。同時,本研究也將呈現不同生產函數設定對推論的影 響,來檢視模型與效率排名的強韌性(robustness)。
本文的架構如下,在本節之後,第二節為SFA與BSFA理論模型的差異,並 著重於BSFA下MCMC(Markov Chain Monte Carlo)性質的說明;第三節為資料 說明與變數選取說明;第四節為實證結果說明;第五節為結論。 二、SFA模型與貝氏推論架構 1 詳見中國城市競爭力報告。 2 中國城市競爭力報告一書中以為數不少的指標來衡量不同因層面對城市發展的影響,最終進行 加總以一總指標的方式來標示城市競爭力,然以計量的角度而言,有限的樣本數目使我們無法進 行類似的工作。 3 Greene(1990)分析美國 123 個電廠的效率比較。
(一)、SFA模型
隨機效率前緣模型以Aigner, Lovell and Schmidt(1977)與Meeuseu and Van Den Broeck(1977)(以下簡稱ALSMB)率先提出,爾後相關研究皆簡稱為 SFA,其理論模型如下:
∑
+ − + = n i i ni n i x v u y ln ln β0 β (1) 其中y 為廠商產出,i x 為廠商投入要素,i ~ (0, ) 2 u i iidN v σ ,ui ~iidN (0,σv2) + iv 為測量誤差項(measurement error component),u 為生產不效率項(technical i
inefficient component) , 且 u 不 必 然 為 Half-Normal 分 配 , 亦 可 為i
Truncated-Normal分配、指數分配、Gamma分配,4計算生產效率時,Jondrow,
Lovell, Materov and Schmidt (1982)與Battese and Coelli(1988)的定義略有差
異,5但差異不大。
實際上,在生產過程中影響最終產出與廠商使用效率,並不僅是生產要素而 已,而產業的競爭程度、企業的管理能力、與員工的素質等,均會影響要素投入 與產出間的關係,乃至於最終的生產效率。針對生產要素外因素對效率的影響, Kumbhakar, Ghosh and Mcguckin(1991)(以下簡稱KGM)修正了生產不效率項 的假設假設為ui ~N (γz′i,σu2)
+
,6 Huang and Liu(1994)進一步設定外生變數及
生 產 要 素 與 外 生 變 數 的 交 乘 項 會 影 響 廠 商 的 生 產 效 率(Non-Neutrally) , 即 i i i i i i f x g z x v y =ln ( ;β)− ( , ;δ)+ −ε
ln ;而Lovell and Vanden Eeckaut(1994)、
Caudill, Ford and Gropper(1995)與Hadri(1999)提出不效率項具有異質變異 (Heteroscedasticity)性質,即ui =exp{ ′γzi}ηi,而ηi ~ N+(1,ση2)。7Wang(2002) 同時考慮Kumbhakar, et al(1994)與Simlar, et al(1991)等文獻的設定,假設
) , ( ~ i i2 i N u u + σ ,其中ui = ziδ , exp( ) 2 γ σi = zi ,使模型同時具備異質變異與非
單 調(Non-Monotonic) 特 性 ,8 而 Cornwell, Schmidt and Sickles(1990) 、
Kumhbakar(1990)與Battese and Coelli(1992)則分別考慮資料呈現panel時,時
間因素對估計效率時的影響。SFA模型發展至此已是相當成熟,在分析對象的資 訊能有效量化與樣本數足夠前提下,SFA模型已足夠將廠商的相對效率估計出 來。 (二)、BSFA模型 假使分析的對象包含的資訊太多,卻沒有足夠的統計數據有效量化,在這種 情況下推估就容易產生錯誤的結論。而城市競爭力比較相對產業研究考慮的因素 更多也更為複雜,如何衡量居住品質、貧富差距、交通便利、城市地理特色、法 4 Greene(1980a,b)與 Stevenson(1980)採用更一般化的設定,將 i u 假設為Gamma 分配。 5 通常以期望值定義下估計的效率較常使用,假使資料變異程度較大,期望值通常較無意義,因 此需以中位數替代,詳見Kumbhakar and Lovell(2000)。
6 Kumbhakar, Ghosh and McGuckin(1991)修正原本兩階段估計下的矛盾,直接將影響生產效率 的因素與生產要素一同置入概似函數中,文獻統稱為一階段估計。
7 因必須保證變數為正,通常設定變異數為一指數函數,如此函數中的解數變數其估計係數不必 須限定為正,使得模型更具一般化。
令規範與外人投資行為等,很難有一個有效的統計指標能充分代表,甚至其中大 部分的因素無法有效量化。若有些因素是影響城市競爭力的生產要素或者是影響 效率的因子,然而在資訊有限的情況下會產生嚴重的偏誤推論,使得估計值的一 致性與有效性的性質遭受破壞,此時的推論將不具有可靠性,換言之,我們並無 法得知真正的估計參數為何,甚至估計值的信賴區間都可能出現錯誤。 貝氏技巧的的應用適時的彌補了這個缺陷,將資訊的不充分或樣本不足對模 型的影響引導至一事前分配(prior distribution),此一事前分配代表我們對估計參 數 的 不 確 定 性 , 結 合 概 似 函 數 後 便 可 得 到 推 論 參 數 的 事 後 分 配(posterior distribution)。同時,拜個人電腦優異的計算速度,與抽樣方法的更新,使貝氏
推論可以更簡單的進行。Van der Broeck, et al(1994)與Koop, Steel , Osiewalski,
et al(1995)(以下簡稱VKSO)首先將貝氏技巧應用在SFA模型,該研究採用 ALSMB的SFA架構,說明在貝氏推估與傳統概似函數估計的差別,成功開啟了 BSFA之門。理論上,VKSO的模型雖考慮的產業中不確定性因素的影響,但仍 是相當簡化的架構,即假設無法量化的因素對所有樣本的影響都是一致的,BSFA 中 所 有 的 估 計 參 數 不 擁 有 特 定 效 果 , 以 簡 單 迴 歸 模 型 為 例 : ) , ( ~ α iβ i σ2 i iidN x u y + + ,式中α 與β的分配不因樣本的差異而改變,這樣的 設定假使能有效簡化分析對象,或控制樣本來源的差異,則其推論仍具有可靠 性,但假使無法量化的因素對樣本的影響不同,則VKSO的模型顯然無法刻畫此 一效果,於推論時仍難免產生偏誤。 傳統計量架構處理樣本性質差異時,多採用虛擬變數的方式處理,允許具有 某些特性的樣本其截距項的估計值不同,或者進一步考量交乘效果,使估計參數 的斜率依研究者設定而產生變化,但這樣的處理方式又衍生出其他問題,過多的 交乘項可能損失太多的自由度,亦可能發生線性重合的問題,某種程度上,虛擬 變數的使用受到一定程度的限制。此外,假使研究者有事前資訊或經由某些檢定 發現殘差呈現異質變異(Hetroscedasticity)的情形,除進一步檢視模型設定與樣 本性質外,通常採用FGLS(Feasible Generalizing Least Square Method)來消除 此 一 殘 差 效 果 。 假 使 在 資 料 產 生 型 態 許 可 的 情 況 下 , 研 究 者 可 採 用 SUR(Seemingly Unrelated Regression)或Panel的架構來進行估計,但對樣本的 限制就更多了,此時虛擬變數的使用受到更大的限制。 貝氏估計在處理此一異質效果顯然更具彈性,其概念是允許不同性質或不同 來 源 的 樣 本 擁 有 其 特 定 的 分 配 ,9相 關 貝 氏 分 析 文 獻 均 稱 此 為Hierarchical Model。本文的研究標的為中國城市競爭力比較,每個城市或區域均有其獨特 性,假使研究者事前以地理區位的方式劃分城市,並以虛擬變數表達其差異性, 傳 統 計 量 法 會 浪 費 太 多 的 自 由 度 , 以 貝 氏 架 構 而 言 則 會 增 加 抽 樣 的 維 度 (dimension),使得我們不易得到收斂後的分配,10而採用SUR架構必須保證樣本 能夠等分的劃分,然本研究的劃分方式顯然無法滿足此一條件,要同時解決區域 劃分問題與無法量化因素對此劃分區域的不同影響,為建立模型時的一大考驗, 貝氏架構下的hierarchical效果能同時考慮此二者對估計時的影響。以下,我們 將實際說明貝氏推論下Hierarchical Model的運作過程。 我們以ALSMB模型為例,如式(1)所示,我們將部分符號簡化,並重述如下: 9
文獻有時稱此為 random effect,VKSO 的模型通常稱為 fixed effect。
10 除不易得到收斂分配外,尚須考慮事前分配給定的問題,不當的事前分配可能導致模型無法 收斂,但維度過大亦有相同問題,此時研究者將無法區分因維度過大或不當的事前分配何者導致 模型無法收斂。
yi =α+xi′β +vi −ui (2) 其中x 為一i (k−1)×1的向量,代表每一城市關於投入要素的資訊, i 為城市的數 目,β亦為一(k−1)×1的向量,代表投入要素的估計係數,α 則為截距項,v 仍i 為測量誤差,來自一 (0,σ2) N 的獨立同分配隨機數列,u 為不效率項,為方便理i 論說明,本文在此設定u 來自一指數分配,即i Exp(θ),亦具有獨立同分配的性 質。在貝氏分析模式下,我們必須對相關估計參數賦予一事前分配,以VKSO的 設定為例說明,我們首先假設產出來自一條件常態分配,即: ) , ( ~ α iβ i σ2 i iidN x u y + ′ − (3) 此一設定是根據我們對v 的假設而來,事實上,也就是傳統概似函數對i v 的認i 知,接著對式(3)中的相關參數賦予一適當事前分配。其中關於α 與β,我們假 設其分別來自一常態分配,即α ~iidN(0,σα2)與β ~iidN(0,σβ2),而有關u 的分i 配,我們已給定是來是一參數為θ 的指數分配,VKSO進一步設定參數θ 亦來自
一參數為−log(r∗)的指數分配,文獻通常稱−log(r∗)為Hyperparameter,11有關
如何給定−log(r∗)將於實證結果時再行說明,最後有關σ2的事前分配,VKSO 設定σ2 的倒數來自一參數為a 與0 a1的Gamma分配,即 ~ ( 0, 1) 2 a a iidG − σ ,12同 樣的,有關a 與0 a1的給定我們同樣於實證結果時一併說明。 理論上,我們已由傳統的概似函數估計轉換成貝氏分析,其中給于相關估計 參數事前分配即表示無法量化因素對參數估計時可能的影響,透過機率的概念來 傳達研究者對某些估計參數認知上的風險。換句話說,傳統估計方法在衡量某一 估計參數的影響時,是以t值表示其顯著性,其間不存在模糊空間,這樣的判斷 標準有時過於武斷,特別當模型遺漏重要變數時,可能會使t值發生誤判,甚至 是估計符號上的逆轉,此時,貝氏估計則將之以分配的方式呈現,該參數可能以 0為中心而呈現一對襯分配,當分配的形狀相對集中,我們可說該估計係數對模 型的影響相對一致,相反的,假使分配顯得相對離散,則表示該參數對模型的影 響可能存在不同的效果。不論實際集中型態的分配或較為離散的分配在傳統迴歸 分析下可能同時呈現一不顯著的結論,此為兩種估計方式最大差別之處。 前段我們簡單說明了VKSO模型的相關設定,值得注意的是,此時所有樣本 均服從相同的α 與β的事後分配,我們已說明過這樣的設定某些情況下有些不合 理,特別是研究者擁有某些事前資訊時,而本文也由此切入hierarchical架構來 說明其優越之處,我們首先將式(2)改寫如下: i i j j i j i x v u y =α + ′ β + − (2)’ 11 Hyperparameter 通常為研究者自行設定,並且調整係數來測試其他參數或模型的敏感性 (sensitivity) ; 不 過 , 其 設 定 並 非 無 限 制 , 不 當 的 參 數 設 定 可 能 使 模 型 無 法 收 斂 , 詳 見 Gelman(2004,CH6)。 12 貝氏架構下通常將模型變異數的事前分配均表示成倒數的形式,且稱之為精確度(precision), 而不稱為變異數,因事前分配的精確度(precision)與樣本訊息加權後形成推論參數的事後分配, 因此文中給定事前分配是以變異數倒數的方式呈現。
我們將樣本區分為 j 組,每組的樣本數n 可以不相同,但加總後必須等於總樣本j 數(即N =
∑
nj),並允許估計參數αj與βj的分配依組別而有所不同,此時,我 們進一步給予αj與βj相關的事前機率分配: ) , ( ~ α σα αj N (4) ) , ( ~ β Ω βj N (5) 式(4)說明每個組別的常數項均來自一參數為α 與σα的常態分配,與VKSO的設 定 差 異 不 大 , 但 式(5) 的 設 定 即 為 hierarchical 架 構 下 的 不 同 之 處 ,β 為 一 1 ) 1 (K − × 的 向 量 , 代 表 我 們 給 于 βj 事 前 分 配 中 的 平 均 數 , Ω 則 為 一 ) 1 ( ) 1(K − × K − 的正定相關變異矩陣(positive definite covariance matrix),13矩陣
中數值的給定關係到研究者對研究標的的認知,此部分我們於稍後章節有進一步
說明,而有關u 與i v 的事前分配給定,我們依舊維持與VKSO的設定。 i
我們將相關估計參數的事前分配結合式(2)’的概似函數,改寫成一事後聯合 機率分配函數(joint posterior distribution)的型態,如下所示:
) , , , }, { }, ({ ) , | , , }, { }, ({α β θ σ2 π α β β θ σ2 π j j Ω y x ∝ j j Ω
∏
= − ⎥⎦ ⎤ ⎢⎣ ⎡− + − − ′ × n i j j i i u x y 1 2 2 2 / 1 2 } }) { } { ( 2 1 exp ) 2 {( α β σ πσ )) } ({ ) } ({ 2 1 exp( ) 2 ( )} exp( { ( 1)/2 1/2 1 1 β β β β π θ θ − × Ω − − ′Ω − × − − − − =∏
j j K n i i u (6) 其中π({αj},{βj},β,σ2,θ,Ω)∝π({αj})π(βj)π(β)π(σ2)π(θ)π(Ω) (7) 我們於式(4)與式(5)及VKSO說明了有關αj、βj、σ2、θ 的事前分配給定,此外, 我們進一步設定式(5)中的β 與Ω 亦服從一事前機率分配,14如下所示: ) , ( ~ β σβ β iidN m (8) ) , ( ~ ( 1) 1 R WK− γ − Ω (9) 式(8)設定β 中的(K-1)個元素皆來自常態分配,式(9)則是關於變異矩陣中每一元 素的產生方式,此分配稱之為Wishart distribution,15特別是對角線的元素,因 其關係到(K-1)個解釋變數的變異數,式中的γ 與 R 為其參數,此外,我們亦以倒 數的方式呈現,理由同註12的說明。 進行實證說明時,研究者通常對感興趣的參數進行個別敘述,例如u ,欲達i 13 部分文獻在處理有關αj與βj的設定時,有時會直接將αj納入βj中呈現,此時β為一K×1的 向量,當然Ω則變為一K × K的正定矩陣,進行實證分析時,我們將採用此一模式設定參數的 事前分配。 14給予 hyperparameter 一事前分配,貝氏分析稱為 hyperprior distribution。 15 詳見 Zellner(1971,p.395)。
此一目的,我們必須將不必要的參數加以積分 (integrating out),也就是將不需 要推論的參數進行積分的動作來平均化對欲知參數的影響,即我們只關心某一參 數的邊際條件事後機率(marginal conditional posterior distribution),而非聯合事 後機率分配。
∫
∫
∫
∫
∫
Ω Ω = Ω Ω θ σ β α π α β σ θ α β σ θ θ σ β α π(u| , , , , ,x,y) ( , , , , ,u|y,x)d d d d d (10) 要有效的完成(10)式的積分在貝氏理論發展之初並非一件易事,特別是模型為高 維度時,模型的聯合事後機率分配函數可能沒有一個確定的形式(closed form), 16使用模擬的方式必須耗費很長的時間,且不一定能保證正確。 拜抽樣方法的更新,對於我們關心的邊際條件事後機率分配可以較容易的方 式得到,Gibbs-Sampling與Metropolis-Hastings algorithm便是本研究將採用的 抽樣法,17Gibbs-Sampling是利用反覆抽樣的方式,給予所有的推論參數一任意 起使值,當模型達到收斂後,每一參數的邊際條件分配會與起使值無關,其演算 法如下: y x from Draw i 1 (1i1), , ) ( 1 − − θ θ π θ y x from Draw i 2 (i21), , ) ( 2 − − θ θ π θ …… y x from Draw k ik i k , , ) 1 ( ) ( − − θ θ π θ 將每一次抽樣出的參數值當成下一個參數邊際分配的起使值,反覆進行此一步 驟,直至所有參數均收斂為止。 (三)、參數的邊際條件事後分配 } {βj 的條件機率分配:我們於式(5)、式(8) 、式(9)說明了有關{βj}的事前分配 與Hyperparameter相對應的事前分配,此時研究者關心的事後邊際分配如下: ] , ˆ [ ~ , , , , }, { | } {βj αj β σ θ Ω u Nk−1 βj B (11) 其中 ] ) )( ( [ ˆ 2 1 1 σ α β β −∑
= − + + Ω = j n j j j j j j u y x B 1 2 1 1 ] [ − = −∑
′ + Ω = σ j n j j jx x B 16 此處指的確定的形式(closed form)為一般我們常見的分配型態,如常態分配,藉由觀察分配 參數,研究者便能得知分配的形狀。沒有確定的形式的分配,指的是無法藉由參數的觀察而得知 分配的變化,但仍符合連續性與積分後為1 的基本假設。17 Gibbs-Sampling 與 Metropolis-Hastings algorithm 的 方 法 , 請 詳 見 Roberts, Smith(1993,1994)。
} {αj 的條件機率分配:與{βj}相似,每個組別擁有各自的截距項: ] , ˆ [ ~ , , , , }, { | } {αj βj β σ θ Ω u N αj A (12) 其中 ] ) ( [ ˆ 2 1 1 σ β α σ α α−
∑
= ′ − + + = j n j j j j j j x u y A 1 2 1 ] [ − + − = σ σα nj A 2 σ 的條件機率分配:為一Gamma分配的型態 ] 2 ] ) ( ) ( [ , 2 [ ~ , , , }, { , } { 1 1 0 2∑
= − ′ − − + + + Ω n i i j j i j i i j j x u y a n a G u β α θ β β α σ (13) 1 − Ω 的條件機率分配:事後分配仍為一Wishart分配的型態 } ] ) )( ( [ , { ~ , , , }, { , } { 1 1 1 ) 1 ( 2 1 − = − − − + +∑
− − ′ Ω j n j j j K j j β β θ u σ W r n R β β β β α (14) β 的條件機率分配: ) , ( ~ , , , , } { }, { ( 1) 1 2 n n N u j n j j K j j Ω Ω∑
= − β θ σ β α β (15) i u 的條件機率分配:雖u 的事前分配設定為一指數分配,但經過併項後成為一常i 態分配的型態,18其中I(ui ≥0)代表當抽樣出的u 大於0時,才接受此一數值,i 否則需重新抽樣,直至u 大於0為止。i 19 ~ , , , }, { }, {αj βj β σ2 Ωθ i u ) 0 ( ) ) ( , ) ( ) ) (( ) (( + ′ − − 2 + ′Ω 2 + ′Ω ⋅ ≥ i i j j i j j i i j i j x y x x x x I u N α β θ σ σ (16) θ 的條件機率分配:事後分配為Gamma分配。 ) log , 1 ( ~ , , , }, { }, { 1 2∑
= ∗ − + Ω n i i j j β β σ u G n u r α θ (17) 根據以上的說明,我們進行抽樣的順序如下: 18 貝氏架構中,通常會假設參數的事前分配為同一族群(family),例如指數族群(expontinal family ),文獻亦稱之為 conjugate prior distribution,當參數具有 conjugate prior distribution 特 性時,事後分配經併項容易得到確定的形式(closed form),如此抽樣過程會簡化許多。19 通常進行此類似的抽樣工作時並不會直接從式(16)的事後分配進行抽樣,而會經由類似的分 配,如指數分配、Gamma 分配等可以涵蓋目標函數的已知分配進行抽樣,如此一來,可使得抽 樣工作簡單許多。
1、進行{βj}的條件機率分配抽樣 2、進行{αj}的條件機率分配抽樣 3、σ2的條件機率分配抽樣 4、β 的條件機率分配抽樣 5、Ω 的條件機率分配抽樣 6、u 的條件機率分配抽樣 i 7、最後θ 的條件機率分配抽樣,i=1,….,N。 當然,我們會檢視這樣的過程是否達到Markov收斂,來確認模型處於一穩定 (stationary)狀態,方能進行相關推論。 三、資料來源與基本統計量 (一)、資料來源 本研究主旨為中國城市競爭力估計,資料來源以中國統計局2005年城市年 鑑中的相關數據為主,我們選取了285個城市當作本次研究的標地城市,範圍從 沿 海 城 市 如 上 海 、 廣 州 至 極 內 陸 的 新 疆 城 市 烏 魯 木 齊 , 依 本 文 將 採 用 的 Hierarchical Model,我們必須將所有城市依某些特性做事前的區分,在此我們 採用行政區劃分的方式來區隔275個城市,我們簡單的分成29個區塊,每個區塊 的城市數目不一,最小的區塊僅有一個城市,如北京、上海、重慶、天津、烏魯 木齊,廣東省區塊則有21個城市,每個區塊擁有各自的效率前緣分配。 在概念上,我們將每個城市假想成一個廠商,以該地的總產出,即GDP, 當作城市的產出,影響產出的因素即投入要素,為城市人口數與累積固定資本, 就如同是一個廠商的資本投入與勞動投入一般。但衡量城市發展的另一重要因 素,即土地面積,土地面積對一城市長期發展有決定性的影響,較大的土地面積 代表城市有較大的腹地,能夠提供城市進一步發展的潛在可能性。因此,本研究 使用了城市人口、城市土地面積、城市累積資本作為投入要素項,同時因區域的 差異使得這三個投入要素對城市產出有不同的影響,透過hierarchical架構,我 們可以以較容易的方式考量此一層面的影響。 (二)、基本統計量 接著我們觀察產出項與四個投入要素的基本統計量,如表一所示,在285個 城市中,城市總產出以上海最高,高達9001389.43萬美元,最低的為寧夏的固 原,僅約43322.66萬美元,平均而言,285個城市的產出平均值約691791.37萬 美元,標準差約915757.13萬美元,城市間總產出的變異不可謂不大,高生產總 值的城市大多位於沿海城市或特別行政區,生產總值較低的城市則大多位於內陸 都市,顯示城市間存在一定程度的貧富不均,在城市總人口分佈方面,其差異程 度不比生產總值來得小,平均人口數約411.75萬人,標準差約289.00萬人,人 口數最多的城市為四川的重慶,人口總數達3144.23萬人之多,而人口數最少的 城市為甘肅的嘉裕關,總人口數僅16.76萬人,在城市的固定資本形成上,城市 間的差異亦頗大,城市固定資本最多的城市為上海,高達3726870.29萬美元, 最少的為黑龍江的伊春,僅25670.79萬美元,平均而言,固定資本投資總額約 在281603.96萬美元水準,標準差約為385560.23萬美元,在城市建設面積方面, 除部分極端值拉大標準差外,如上海、天水、北京,城市間的面積差異不至太大, 平均而言,約109.12平方公里,標準差約316.49平方公里,最小的城市面積為
甘肅的隴南,僅約3平方公里,面積最大的城市則為甘肅的天水4129.00平方公 里。 表一:變數基本統計量表 變數 平均數 標準差 最小值 最大值 產出 城市生產總值(萬美元) 691791.37 915757.13 43322.66 9001389.43 生產要素 城市總人口(萬人) 411.75 289.00 16.76 3144.23 固定資產投資總額(萬美元) 281603.96 385560.23 25670.79 3726870.29 城市建設用地面積(平方公里) 109.12 316.49 3.00 4129.00 資料來源:本研究 整體而言,沿海城市在產出規模、固定投資金額、人口數目均較內陸城市高 出許多,但這樣並不意味著沿海城市的資源配置效率較佳,相反的,還可能出現 過度投資或勞動邊際產出低落的現象,而內陸城市卻可能因本身就擁有豐富的觀 光資源,雖人口不多、資本累積較慢,但產出並未呈相同幅度的減少。 四、實證結果 在實際估計過程中,我們將由VKSO模型出發再進行Hierarchical Model下的 設定,藉此觀察模型中的推論參數是否有顯著的變化與配適度是否改善,同時分 別嘗試Cobb-Douglas、Translog、CES三種生產函數設定下城市估計效率的排 序是否產生顯著變化。我們於理論介紹的部分採用u 的來源為指數分配為例進行i 說明,此處,我們將進一步嘗試將u 設定為Gamma分配、Half-Normal時對參數i 估計,乃至於城市效率估計與城市效率排序的影響,以此來檢定模型與相關事前 分配設定的強韌性。 我們於式(11)至式(16)說明每個參數估計參數的邊際事後分配,其中有若干 估計係數的事前分配中的參數值尚未明確給定,如式(5)、式(6)、式(8)、式(9) 及式(17)中的−log(r∗)值,這些參數的給定關係到事前分配與樣本在事後分配中 的相對地位。20一般而言,假如研究者沒有事前資訊時,都會給定事前分配為一
Jeffery non-informative prior的形式,21即事前分配的變異數無窮大,使得
const ∝ ) (α
π 或π(β)∝const,使得抽樣時參數差異的來源為樣本性質所主導,
我們對於本文中部分事前分配的給定亦將使用Jeffery non-informative prior的概 念。 我們首先就式(4)、式(5)的中關於{αj}與{βj}事前分配中相關參數的給定進 行說明,此外,我們於估計時將{αj}與{βj}視為其變異來自一共變異矩陣,即Ω 則為一K× 的共變異矩陣,K {βj}則成為一K×1的向量,理論介紹時,我們設 定{αj}獨立來自一常態分配則為一特例。 22而有關式(8)的 ) , ( ~ β σβ β iidN m 的給 20 此處指的相對地位是指研究者對樣本複雜度的認知,需給于事前分配多大的強度。 21 Jeffery non-informative 表示我們對推論參數沒有任何知訊或不知母體參數為何,因此假設推 論參數事前分配的變異數無限大(精確度為 0),此時在事後分配中,事前分配比重相對樣本的比 重低很多,甚至微不足道,事後分配完全由樣本平均數或特性主導,詳見Zellner(1971)。 22 Tsionas(2002)與 Huang(2004)中,設定截距項不具有 random effect,僅為 fixed effect,當模
定,依non-informative prior的概念,我們假定其來自一N(0,100000)的常態分 配,23,式(9)關於Ω 的來源為−1 ) , ( R WK γ ,我們假定 R 為一1×IK的矩陣、γ 數值 為1,24,σ−2 事前分配中a 、0 a1參數的給定,我們仍依VKSO的設定,給于 001 . 0 1 0 = a =
a 。最後關於(17)中的−log(r∗)值,VKSO指出−log(r∗)設定即我們
認 知 的median efficiency , 也 就 是 Exp(θ)中 的θ 係 數 且 θ =−log(r*) , 而
) exp( i i u r = − ,當r* =1代表我們假設所有廠商具有完全效率,VKSO於該研究設 定r* =0.875,日後研究相關議題的研究也都採用此一設定,然並非所有研究對 象均適合此一假設,本文嘗試了不同的 * r 設定下對的模型表現後,決定以 85 . 0 * = r 為作為事前分配的參數設定。25在有關Half-Normal模型的事前分配設定 方 面 , 此 處 我 們 假 設 不 效 率 u 來 自 一i (0, ) 1 − + θ N , 城 市 效 率 推 論 值 為 ) exp( i i u eff = − ,且仍設定θ =−log(r*)。 除此之外,在u 設定為一Gamma分配時狀況時,我們需額外稍做說明,此i
時我們假定 ui ~Gamma(φ,θ),而φ ~Inv−Gamma(d1,d2),同時設定d1 =3.5、
7
2 =
d ,26換句話說,我們認為影響城市效率的因素在排除投入要素與產出的關
係之後,仍存在不確定的因素,在指數分配與Half-Normal下,我們認為影響效
率的因素僅有一項,即Exp(θ),且θ ~iidExp(−log(r∗)),此時我們額外加入一不
確定因素φ。增加參數便是增加抽樣的維度,有可能使得模型不易收斂,但假使 樣本的確存在Exp(θ)描述之外的不確定性,則增加φ此一參數反而有助於強化模 型的配適度。 (一)、Fixed Effect 說明模型中相關的事前分配設定後,我們進入實際模擬的過程,抽樣模擬的 過程中,本文預先設定10000次的模擬抽樣次數,27前5000次為滿足模型收斂的 次數,我們僅記錄後5000次的模擬數值,並以此作為相關參數推論的依據,同
時以DIC(Deviance Information Criterion)值作為模型表現優劣的參考依據,28我
們將一併列於表中,以下說明將以不同的生產函數為區隔並表列之,首先我們看 到固定效果(fixed effect)下Cobb-Douglas生產函數的表現,如表二所示。
型同時存在fixed effect 與 random effect 時,貝氏分析通常稱此為 mixture model。 23 此時分配的平均數並不重要,因分配的變異數相當大。 24 在生產函數為 Translog 與 CES 時,因抽樣的維度增加,我們會調整 R矩陣中數值的給定。 25 在比較不同設定下的收斂性質與檢測條件後,最終採用 85 . 0 * = r ,其餘數值設定下的結果, 本文不在此進行比較與敘述。 26 Tsionas(2000)研究中,以數值模擬的方式進行模型敏感度測試,將樣本的變異控制在一定程 度內,本文將φ與θ設定於同樣來自一 Gamma 分配時,無法有效到達收斂條件,顯示這樣的 設定無法有效將不效率的訊息隔離出,部分原因可能來自資料本身的性質,部分原因可能來自φ 與θ 同時為 Gamma 分配時,使抽樣時無法區別資料來源的差異,因此本文採用 Griffen 和 Steel(2004)的設定,將φ改設為Inv-Gamma,以此加強資料來源的差異性。 27 假使模型較為複雜,而起始值選取不當,或事前分配無法有效過濾出有效知訊,較少的模擬 次數必然無法達到收斂要求,詳見Gelman(2004,CH6)。 28 衡 量 不 同 貝 氏 模 型 的 表 現 方 法 很 多 , 其 中 常 見 的 指 標 為 Deviance Information Criterion(DIC),其概念是測量預測誤差加上傳統概似函數預測值與貝氏預測值的差異,數值愈 小代表模型表現愈佳,詳見Gelman(2004,CH6)。
由表二發現,三種不同分配設定下參數的方向皆呈現一致,參數估計值差距 並不大,城市總人口的邊際影響大約是在0.30左右,由標準差在0.0311至0.0315 的離散程度來看,顯示人口變數對城市產值有顯著的影響,固定資產投資金額的 邊際影響約在0.6474至0.6496的水準之間,標準差在0.0295至0.0309間顯示該 參數的顯著性,城市建設用地面積面積對城市產出的影響約在0.1992至0.2016 間的水準,標準差亦同樣顯示其影響性。以規模產出而言,三種投入要素的邊際 效果相加後到達1.1的水準以上,顯示整體而言中國城市產出增加的速度仍在上 升階段,此一特性為開發中國家常有之特徵,本文估計的結果亦顯示符合此一特 徵。以三種分配的模型變異數σ2差距來看,以Half-Normal分配下的變異最小, 僅約0.1036,餘二者都在0.11以上的離散程度,而θ因本身來自於假設上的不 同,故不具有共同比較的基礎。以DIC值的標準衡量下,三種分配下的DIC值差 距並不大,皆在-360的水準左右, Half-Normal分配下的DIC值略低於餘二者, 但並不顯著, 同時我們也發現,增加影響效率不確定性的來源,如Gamma分配下的結果,未 能顯著提升模型的配適度,但也不致使模型發生無法收斂的結果。 接著我們看到效率估計的表現,我們將285個城市估計出的效率值加以平均 後列於表中,並同時計算城市間效率的標準差,29來檢視城市間效率的差異程 度,理論上,我們希望模型及使用的變數能有效過濾生產要素與產出間的關係, 且能同時釐清城市實際生產點與效率前緣的差距,以此來判斷285個城市生產效 率的差異,假使模型變數選取不當,或者對不效率產生的方式有所誤判(指對效 率項分配的假設),即使達到貝式估計所要球的收斂條件,依舊不能區分城市效 率的差異,此時,估計出來的效率值將顯示285個城市間競爭力差異不大,這是 我們所不樂見的,也於實際認知的情形不符合,以下所有模型的實證分析,我們 將同時觀察效率平均數與標準差的變化。在Cobb-Douglas下的城市效率估計, 指數分配與Gamma分配的平均值都在92%以上,Half-Normal分配下僅約89%, 但卻較能有效區隔城市間效率的差異,其標準差達0.0456,餘二者僅約0.0264 與0.0281左右,此一層面的考量仍顯示效率項假設為Half-Normal分配時有略佳 的篩選能力。 29 我們估計出來的城市效率亦呈現一分配型態,以指數分配為例,其分配如式(16)所示,我們依 舊取每一城市事後效率分配下的平均數作為效率估計值,而城市間效率的差異即以 275 個城市估 計值的標準差作為代表。
表二:Cobb-Douglas 生產函數表(fixed effect)
參數\效率項分配 Exp Half-Normal Gamma
常數項 1.1800(0.9530,1.4070) (0.1152)(a) 1.2340(1.0110,1.4540) (0.1140) 1.1960(0.9656,1.4320) (0.1184) 城市總人口 0.3080(0.2467,(0.0312) 0.3692) 0.3058(0.2436,(0.0315) 0.3675) 0.3076(0.2462,(0.0311) 0.3686) 城市建設用地面積 0.2016(0.1447.0.2587) (0.0290) 0.2011(0.1480,0.2535) (0.0269) 0.1992(0.1437,0.2554) (0.0286) 固定資產投資總額 0.6474(0.5864,(0.0309) 0.7078) 0.6490(0.5907,(0.0295) 0.7078) 0.6496(0.5897,(0.0305) 0.7091) θ 18.1100(11.53,(5.1220) 31.52) 48.2400(31.99,(10.5100) 72.3) 21.5100(12.36,(6.6560) 37.99) φ - - 1.742 (0.7339,(0.9001) 4.073) σ2 0.1167(0.1022,(0.007604) 0.1318) 0.1036(0.08912,(0.007509) 0.1185) 0.1148(0.0981,(0.008367) 0.1308) 效率平均值(b) 標準差 0.9450 (0.0264) (0.0456) 0.8948 (0.0281) 0.9244 DIC -358.0470 -363.9280 -360.6630 資料來源:本研究。 附註:a.參數推論值為抽樣平均數,右邊括號內分別為 2.5%及 97.5%分位數,下方括號則為標 準差。 b.效率平均值指的是 285 個城市的總效率平均值,下方括號為其標準差。
檢視Cobb-Douglas生產函數在三個效率分配下的結果後,我們接著觀察 CES生產函數下相關參數的表現,結果列於表三:
表三:CES 生產函數表(fixed effect)
參數\效率項分配 Exp Half-Normal Gamma
常數項 2.1780(0.8581, 3.555) (0.684)(a) 2.2990(0.9118, 3.677) (0.6996) 2.2040(0.8347, 3.592) (0.6982) 城市總人口 1.4760(0.7793, 2.18) (0.3521) 1.4850(0.7645, 2.193) (0.3672) 1.4800(0.7565, 2.184) (0.364) 城市建設用地面積 -0.1583(-0.5391, 0.286) (0.2105) -0.1350(-0.54, 0.2875) (0.2086) -0.1624(-0.555, 0.2778) (0.2089) 固定資產投資總額 -0.1610(-1.072, 0.7178) (0.4523) -0.1920(-1.085, 0.7100) (0.4651) -0.1615(-1.0740, 0.7550) (0.4635) (城市總人口- 城市建設用地面積)2 -0.0301(-0.0931, 0.0344) (0.0326) -0.0266(-0.0923, 0.0410)(0.0339) -0.0298(-0.0948, 0.0358)(0.0329) (城市總人口- 固定資產投資總額)2 0.2011(0.0874, 0.3189) (0.0583) 0.2030(0.0859, 0.3201) (0.0604) 0.2019(0.0825, 0.3195) (0.0603) (城市建設用地面積- 固定資產投資總額)2 -0.0467(-0.1116, 0.0265) (0.0351) -0.0449(-0.1123, 0.0245) (0.0350) -0.0475(-0.1142, 0.0260) (0.0351) θ 22.1700(13.0300, 40.0300)(6.8350) 51.8500(33.8700, 79.0900)(11.5200) 26.0500(13.8800, 47.9800)(9.4580) φ - - 1.8680(0.6974, 5.072) (1.072) σ2 0.1172(0.1032, 0.1309) (0.0071) 0.1021(0.0880, 0.117) (0.0074) 0.1151(0.0986, 0.1299) (0.0080) 效率平均值(b) 標準差 0.9539 (0.0179) 0.8982 (0.0429) 0.9322 (0.0208) DIC -365.5060 -376.0100 -367.9410 資料來源:本研究。 附註:(a).參數推論值為抽樣平均數,右邊括號內分別為 2.5%及 97.5%分位數,下方括號則為標 準差。 (b).效率平均值指的是 285 個城市的總效率平均值,下方括號為其標準差。 CES生產函數相較於Cobb-Douglas生產函數而言多了不同要素間使用量差 異的二次式參數,以貝氏的角度而言,即增加抽樣的維度。由表三我們發現,參 數的估計值在不同分配設定下尚稱穩定,參數分配的平均數皆呈同一方向,其數 值略有差異,這顯示出估計結果的強韌性,強化了我們對估計結果的信心。需值 得注意的是,部分參數分配的2.5%分位數與97.5%分位數的方向呈現不一致的 情形,如城市建設用地面積,這顯示投入要素影響城市產出的管道不必然為同一 方向,傳統計量模型對此一現象可能反映在t統計量的不顯著,當然也無法考量 估計參數因樣本差異的導致的不確定性,而不同效率分配導致不同的估計結果則 是提醒研究者使用或過度信賴單一模型可能帶來的風險,表三中其他參數亦有類 似的現象,此處不再多加說明。在模型變異數σ2的估計上,三者略有差異, Half-Normal下分配的平均數為0.1021,Gamma分配與指數分配分配則分別為 0.1151與0.1172,顯然在Half-Normal分配下能未能解釋的變異較小,反映在DIC 值的估計上,三者依序為-365.506、-376.010與-367.941,依舊以Half-Normal 分配呈現較佳的配適度,此一結論除與Cobb-Douglas生產函數的結果相同,且
幅度略高,同時因使用的變數較多,DIC值皆較低於前者。最後我們看到效率估 計的情況,對應效率項假設下,CES與Cobb-Douglas下依舊得到較高的效率平 均值,同樣的,Half-Normal分配下的效率分配假設依舊較能有效區隔城市效率 的差異,標準差達0.0429,其平均效率值在0.8982左右。 最後我們看到 Translog 生產函數下的相關參數估計,其結果列於表四,與 CES 不同之處,Translog 生產函數將每一投入要素的二次式與要素間的乘積作 為額外的解釋變數,包含原有的 3 個解釋變數,解釋變數到達 9 個,抽樣的維 度比 Cobb-Douglas 設定下多了 285*6 個,此時檢視收斂條件時需格外小心。 Translog 下的參數估計結果如 CES 一般,部分參數事後分配的 2.5%分位數與 97.5%分位數顯示不同的方向,如固定資產投資總、城市建設用面積等,此外不 同分配下的同一估計參數分配平均值仍顯示相同方向,不因高維度與分配設定的 差異而有顯著的變化,這顯示模型對生產投入過程有較一致性的看法。在模型變 異數σ2 的估計方面,有左至右依序為 0.1159、0.0993 與 0.1132,依舊以 Half-Normal 下呈現較低的模型變異。以 DIC 的衡量標準還看,依序為-365.241、 -382.420 與-371.191, Half-Normal 設定仍優於其餘二者,值得注意的事,相 較於CES 函數設定,DIC 值顯示每個分配改善模型配適的能力並未增進多少, DIC 值的差距約在 0 至 5 不等,但我們卻增加了 3 個解釋變數,顯然地,CES 生產函數相對具有抽樣時的效益且不致喪失太多的解釋能力。在城市效率估計 上, Half-Normal 仍較能區隔城市效率的差異, Gamma 分配與指數分配下的 標準差則較CES 時增加少許。 整體來說,以生產函數的角度來看,CES 與 Translog 生產函數設定下模型 的表現明顯優於Cobb-Douglas,三種u 的事前分配皆得到同樣結論;另一方面,i 以u 事前分配設定的角度來看,很明顯地,Half-Normal 分配下的模型配適度明i 顯優於另二者,且隨著生產函數的複雜有明顯增加的趨勢,不論在DIC 的測度、 母體變異數的估計與城市效率的區隔均呈現同樣的結論。大致而言,fixed effect 下的估計結果呈現解釋變數越多模型配適越佳,同時以Half-Normal 描述u 時得i 到較好的估計結果。Greene(1990)文中計算各種不同u 的分配設定下其效率估i 計值間的相關係數,30此處我們亦以生產函數為劃分,計算其相關係數來顯示不 同u 的事前分配是否對效率估計的排序有顯著影響,其結果列於表五。 i 30 Grenne(1990)的研究在 Truncated-Normal、Half-Normal、Gamma、Exponential 分配設定 下的效率值,研究對象為美國 123 個供電單位的數據,並同時計算前兩種分配的相關係數,與 後兩種分配效率值的相關係數,以此來斷定研究對象效率的排序是否有顯著變化。
表四:Translog 生產函數表(fixed effect)
參數\效率項分配 Exp Half-Normal Gamma
常數項 0.0652(-2.2740,2.486) (1.2030)(a) -0.1918(-2.5580,2.2950) (1.2070) 0.0481(-2.3360,2.4110) (1.2000) 城市總人口 2.0900(1.1760,(0.4554) 2.9800) 2.1020(1.1760,(0.4643) 3.015) 2.0880(1.1950,(0.4565) 2.9850) 城市建設用地面積 -0.1813(-0.8044,0.4734) (0.3208) -0.2761(-0.8834,0.3282) (0.3087) -0.1995(-0.8087,0.4295) (0.3133) 固定資產投資總額 0.3585(-0.7570,(0.5517) 1.4300) 0.5103(-0.5862,(0.5511) 1.5700) 0.3818(-0.7005,(0.5506) 1.4610) (城市總人口)2 0.1589(0.0142,0.3071) (0.0746) 0.1778(0.0245,0.3351) (0.0789) 0.1602(0.0151,0.3073) (0.0750) (城市建設用地面 積)2 -0.0722(-0.1367,0.0100) (0.0367) -0.0649(-0.1262,(0.0314) -0.0017) -0.0730(-0.1356,(0.0348) 0.0036) (固定資產投資總 額)2 0.1375(-0.0156,0.2936) (0.0778) 0.1310(-0.0172,(0.0771) 0.2827) 0.1350(-0.0142,(0.0770) 0.2865) 城市總人口x 城市建設用地面積 0.0988(-0.1058,0.3031) (0.103) 0.1367(-0.0650,(0.1024) 0.3342) 0.1004(-0.1000,(0.1034) 0.3059) 城市總人口x 固定資產投資總額 -0.5239(-0.7950,-0.2478) (0.1386) -0.5566(-0.8273,-0.2796) (0.1393) -0.5253(-0.7931,-0.2557) (0.1374) 城市建設用地面積x 固定資產投資總額 0.0781(-0.0997,0.2230) (0.0816) 0.0738(-0.0696,0.2136) (0.0718) 0.0814(-0.085,0.2201) (0.0768) θ 21.5700(12.1500,(6.9590) 38.6000) 49.82(32.8000,(10.9800) 74.5400) 24.8600(13.0500,(8.3460) 45.1800) φ - - 1.8530(0.73050,(1.0590) 4.6080) σ2 0.1159(0.1000,0.1299) (0.0076) 0.0993(0.0840,(0.0079) 0.1152) 0.1132(0.0953,(0.0085) 0.1288) 效率平均值(b) 標準差 0.9524 (0.0192) 0.8962 (0.0450) 0.9293 (0.0226) DIC -365.2410 -382.4200 -371.1910 資料來源:本研究。 附註:(a).參數推論值為抽樣平均數,右邊括號內分別為 2.5%及 97.5%分位數,下方括號則為標 準差。 (b).效率平均值指的是 285 個城市的總效率平均值,下方括號為其標準差。 表五:效率估計值相關係數表(fixed effect)
相關係數\模型 Cobb-Douglas CES Translog 指數、Half-Normal 0.9585 0.9757 0.9754 指數、Gamma 0.9955 0.9953 0.9952 Half-Normal、Gamma 0.9802 0.9887 0.9906 資料來源:本研究。 由表五可發現,在給定生產函數下,指數分配與Gamma分配的相關係數幾 乎 接 近1,這樣的結果並不令人意外,因兩種分配本來就屬同一族群,但 Greene(1990)的結果僅顯示兩種分配下相關係數僅為0.746,當然研究的標的與 使用的方法不同會影響效率值的估計,但本研究的結果顯然更具說服力,城市競 爭力的排名並未因事前分配的改變而產生劇烈變化,依舊維持一定的排序,其餘 兩個配對組合下亦都在0.95以上,在生產函數為Trnaslog下的Half-Normal與
Gamma相關係數亦相當接近1,此一結果同樣顯示不同設定下的強韌性,本文 在此亦根據不同生產函數與u 分配下得到的效率值,表列效率值最高與最低的部i 分城市,31如表六所示。 表六:部分城市效率值(fixed effect) 模型\城市 城市效率排序1至5名 城市效率排序281至285名 北京 綏化 大慶 茂名 泉州 貴陽 百色 麗江 固原 天水 C-D 指數 (0.9805) (0.9766) (0.9761) (0.9757) (0.9756) (0.8526) (0.8522) (0.8449) (0.8107) (0.7283) 北京 大慶 綏化 茂名 玉溪 百色 貴陽 麗江 固原 天水 C-D Half-Normal (0.9756) (0.9666) (0.9662) (0.9654) (0.9650) (0.7583) (0.7571) (0.7492) (0.7195) (0.6645) 北京 綏化 大慶 茂名 玉溪 百色 貴陽 麗江 固原 天水 C-D Gamma (0.9696) (0.9635) (0.9633) (0.9621) (0.9618) (0.8312) (0.8300) (0.8233) (0.7897) (0.7189) 北京 泉州 玉溪 大慶 茂名 麗江 貴陽 百色 天水 固原 Translog 指數 (0.9822) (0.9786) (0.9783) (0.978) (0.9764) (0.8837) (0.8832) (0.8800) (0.8621) (0.8423) 北京 泉州 玉溪 大慶 茂名 麗江 貴陽 百色 天水 固原 Translog Half-Normal (0.9757) (0.9702) (0.9693) (0.9672) (0.9647) (0.7645) (0.7613) (0.7581) (0.7460) (0.7221) 北京 泉州 玉溪 大慶 茂名 麗江 貴陽 百色 天水 固原 Translog Gamma (0.9709) (0.9652) (0.9645) (0.9635) (0.9625) (0.8532) (0.8520) (0.8505) (0.8389) (0.8134) 北京 大慶 玉溪 泉州 茂名 百色 天水 中衛 麗江 固原 CES 指數 (0.9833) (0.979) (0.9787) (0.9782) (0.9772) (0.8973) (0.8963) (0.8947) (0.8841) (0.835) 北京 大慶 泉州 玉溪 茂名 貴陽 百色 中衛 麗江 固原 CES Half-Normal (0.9781) (0.9688) (0.9684) (0.9684) (0.9643) (0.7787) (0.7774) (0.7754) (0.7637) (0.7158) 北京 玉溪 大慶 泉州 茂名 百色 天水 中衛 麗江 固原 CES Gamma (0.9718) (0.9654) (0.9653) (0.965) (0.9625) (0.8698) (0.8691) (0.8662) (0.8522) (0.8122) 資料來源:本研究。 附註:每一欄為所屬排位城市,括號內則為其事後效率分配的平均數。 表六顯示的排名狀況其實相當一致,在285個城市中,不論生產函數型態與 效率的事前分配為何,北京市皆為樣本中效率最高的城市,2至4名的排名依生 產函數與事前分配的不同略有變動,但城市組成大致固定,且多為具有特定資源 的城市,如大慶產油、玉溪等。而我們所熟知的沿海城市反而未在前幾名的城市 排名中,如上海、廣州等,32此一現象可能來自人們預期沿海城市的前景,使人 口急速湧入導致生產力過剩的問題,再者,此一預期行為亦可能使資本投入增加 而造成機器設備使用率不足的問題,這使得城市產出的總量很大,但每人得到的 產出值可能付出過高的代價所致。 效率排名居後的城市,大多是位於邊陲地帶,且特殊資源較為稀少的城市, 表六的右半部顯示城市組成的內容大致固定,仍依生產函數與事前分配的差異略 呈排名不同,大致而言,模型的推論相當一致。 31 本文比較前 5 名與後 5 名的排名,因其樣本狀態數極端值,觀察不同效率分配與生產函數下 對離群值的掌握能力,有助於瞭解不同設定下對樣本分佈的解讀,假使事前分配設定不當或模型 未達收斂時,容易導致不同分配或不同生產函數的城市排名發生重大改變,稍後的 random effect 模型亦將進行相同的檢視。 32 廣州約在 50 名左右,上海更落到 180 名以外。
簡單來說,從生產函數的估計係數與生產效率的事後分配來看,VKSO模型 下的表現尚稱穩定,城市排名亦顯示高度的相關性,以生產函數來看,CES與 Translog的表現優於Cobb-Douglas,效率的事前分配設定方面,則以Half-Normal 略優於於二者。 (二)、Random Effect 在hierarchical架構中,我們由理論介紹已知每個區域擁有各自的生產過 程,因此,投入要素k與總產出的關係可描述成βk +{βj}k, j 表示我們事前分 割的29個區域,βk即為式(15)所示、{βj}k為式(11),通常研究者關心的是βk的 事後分配,而非{βj}k或整個βk +{βj}k的事後分配,33除非研究者有特殊目的, 才會針對區域生產係數討論,例如研究者要瞭解北京與上海關於要素k,對產出 的影響何者較大時,我們便將(βk +{βj}k)−(βk +{βh}k)={βj}k −{βh}k便可得知 此一效果。34因此以下僅表列βk的分配情形,而不進行{βj}k的敘述,如此也方 便比較與VKSO模型的差異。 如同VKSO的實證說明一樣,我們仍將以生產函數的不同分別進行表列,並 以三種不同的效率事前分配,來觀察估計係數的變化與模型的配適能力,以下我 們先由Cobb-Douglas的生產函數設定下的抽樣結果進行說明,如表七所示。
表七:Cobb-Douglas 生產函數表(random effect)
參數\效率項分配 Exp Half-Normal Gamma
常數項 1.1720(0.8514,1.4850) (0.1618)(a) 1.2040(0.8891,1.5170) (0.1603) 1.1930(0.8684,1.5040) (0.1598) 城市總人口 0.2585(0.1224,(0.0702) 0.3978) 0.2538(0.1164,(0.0700) 0.3930) 0.2574(0.1213,(0.0690) 0.3956) 城市建設用地面積 0.1535(0.0301,0.2762) (0.0630) 0.1476(0.0238,0.2713) (0.0633) 0.1504(0.0281,0.2733) (0.0622) 固定資產投資總額 0.6847(0.5562,(0.0639) 0.8101) 0.6938(0.5677,(0.0634) 0.8192) 0.6881(0.5666,(0.0616) 0.8080) θ 19.8500(12.6500,(5.5470) 33.7100) 53.9300(37.4700,(10.2100) 77.3800) 22.7500(13.5700,(6.0700) 37.6200) φ - - 1.8000(0.8071,(0.8024) 3.8650) σ2 0.0741(0.0578,(0.008056) 0.0893) 0.0504(0.0331,(0.0089) 0.0679) 0.0692(0.0484,(0.0096) 0.0859) 效率平均值(b) 標準差 (0.0261) 0.9496 (0.0505) 0.9007 (0.0306) 0.9260 DIC -537.3250 -672.8930 -558.1180 資料來源:本研究。 附註:(a).參數推論值為抽樣平均數,右邊括號內分別為 2.5%及 97.5%分位數,下方括號則為標 準差。 33 有關 hierarchical 架構下估計係數的呈現方式通常以 Box-Plot 的方式表示,而不表列每一區 域的分配情形,因區域的劃分可能很多,一一表列浪費過多的篇幅且顯的瑣碎。 34 假使有關 k j} {β 的抽樣點數值皆大於{βh}k 的每一數值(需按抽樣時的順序比較,如 5000 個 記錄點下比較每一紀錄點兩邊數值的大小),計算{βj}k >{βh}k個數佔整體抽樣次數的比例,即 為{βj}k >{βh}k的可能性。
(b).效率平均值指的是 285 個城市的總效率平均值,下方括號為其標準差。
相較表二的結果,我們發現城市總人口的邊際貢獻皆呈現下降的情況,約由 0.3降至0.25左右,三種效率分配皆同,僅幅度略有差異,城市建設用面積此一 要素亦呈現下降的情形,約由0.20降至0.15左右,資本要素一項則略呈上升,由 0.65升至0.68左右,以平均數的角度來看,fixed effect與random effect的變化並 不大,但標準差卻呈現倍增的情形,大約有兩倍的增幅,這表示參數部分的精準 度由29個區位的分配所吸收,區位差異使的要素投入與產出的關係因而產生變 化,而使得平均投入要素的分配顯得較為鬆散,此一現象亦符合我們的猜測。同 時,參數分配的2.5%分位數與97.5%分位數皆呈相同方向,這說明平均而言, 三種投入要素使用越多,總產出越多的關係不變。35 在模型離散程度的衡量方面,相較VKSO模型,表七中模型變異數的分配顯 然集中許多,平均數都呈現顯著的下降,尤以效率事前分配為Half-Normal下降 最多,由0.1036減少至0.0504最大,顯示增加模型的複雜度的確有助於未解釋 變異的減少,區位差異也的確造成生產行為上的差異。反應在DIC值上亦如此, 相較表二中的任一分配下均顯示DIC值明顯下降,特別是Half-Normal分配下表現 最優,由-363.9280降至-670.3980,遠遠超過其餘二者下降的幅度。效率估計方 面,表二與表七的結果顯示其平均效率值差異並不大,但random effect下的標 準差在分配為後二者時卻略微加大,表示區隔城市競爭力差異的能力加強,這是 吾人所樂見的。 我們緊接著看到CES生產函數估計下的相關參數估計,其結果列於表八,如 下所示。 比較表三的VKSO的模型與表八的random effect模型,我們發現投入要素事 後分配的平均數差異相當大,此外,還有部分參數發生符號轉換的現象,如固定 資產投資總額、(城市總人口-城市建設用地面積)2 等,同時我們亦發現參數分配 的標準差加大的幅度比生產函數為Cobb-Douglas時更加劇烈,造成此一現象的 原因有幾個可能性,一為增加解釋變數後使產出與投入的關係變的較複雜, random effect相較於fixed effect的抽樣維度迅速增加使二者呈現顯著差異,第二 為貝氏應用本身的問題,因本文採用的hierarchical架構假設區域差異造成的影 響,來自一多變量的常態分配,即我們假設共變異矩陣來自一式(9)的Wishart分 配,事後分配亦同,假使區域劃分後的樣本,解釋變數彼此存在些許的相關性,
就會造成random effect與fixed effect估計結果的差異,36因此這樣的結果並不令
我們意外,稍後的Translog模型存在此一現象。 35 部分區域效果可能出現 2.5%分位數與 97.5%分位數方向不同的情形,但平均而言仍是正向的 關係。 36 在 Wishart 分配中,雖然事前分配我們假設投入要素間的相關性為 0,但結合樣本訊息後得到 的事後分配,變數間還是會有相關性,因此式(14)的事後 Wishart 分配的對角線外的元素仍會產 生一相關性的分配,此一相關性便會影響VKSO 與 random effect 下的結果。再者,我們給定 Wishart 事前分配的過程中,需對對角線中的元素進行給定,理由同註(12),但有時會造成模型 無法收斂,因此需個別調整每一對角線元素的強度,當解釋變數越多,調整的次數會更加頻繁, 這也是形成fixed effect 與 random effect 估計結果的原因之一。
表八:CES 生產函數表(random effect)
參數\效率項分配 Exp Half-Normal Gamma
常數項 1.3360(-2.4860,4.9950) (1.8760)(a) 1.4580(-2.5180,5.2440) (1.9810) 1.3820(-2.5230,5.0630) (1.9300) 城市總人口 0.7615(-1.0610,(0.9433) 2.6470) 0.7151(-1.1950,(0.9623) 2.5840) 0.7279(-1.1290,(0.9557) 2.6010) 城市建設用地面積 -0.1432(-1.8770,1.6110) (0.8860) -0.0598(-1.8900,1.8090) (0.9287) -0.1088(-1.9040,1.6710) (0.9015) 固定資產投資總額 0.4910(-1.9090,(1.2350) 3.0070) 0.4570(-1.9720,(1.2970) 3.0780) 0.4841(-2.0180,(1.2690) 3.0220) (城市總人口- 城市建設用地面積)2 0.0244(-0.1779,(0.1056) 0.2343) 0.0384(-0.1711,(0.1081) 0.2525) 0.0264(-0.1796,(0.1061) 0.2371) (城市總人口- 固定資產投資總額)2 0.0988(-0.1926,(0.1479) 0.3944) 0.0942(-0.2086,(0.1519) 0.3899) 0.0941(-0.1970,(0.1501) 0.3903) (城市建設用地面積- 固定資產投資總額)2 -0.0529(-0.3063,(0.1258) 0.1889) -0.0438(-0.3069,(0.1334) 0.2215) -0.0490(-0.3034,(0.1284) 0.2043) θ 17.7500(11.6200,(4.5360) 29.2500)49.8500(36.0500,(8.5230) 69.5600) 21.2300(12.6300,(5.7190) 34.4700) φ - - 2.0250(0.8175,(1.0110) 4.7350) σ2 0.0648(0.0443,(0.0101) 0.0842) 0.0366(0.0182,(0.0096) 0.0559) 0.0561(0.0265,(0.0138) 0.0798) 效率平均值(b) 標準差 (0.0288) 0.9442 (0.0501) 0.8972 (0.0347) 0.9127 DIC -559.1270 -800.5120 -616.8140 資料來源:本研究。 附註:(a).參數推論值為抽樣平均數,右邊括號內分別為 2.5%及 97.5%分位數,下方括號則為標 準差。 (b).效率平均值指的是 285 個城市的總效率平均值,下方括號為其標準差。 表八的結果顯示城市效率的事前分配對投入要素分配的影響,相對於 Cobb-Douglas 而有些許的加大,如城市建設用地面積,但大致而言,產出與投 入的結構尚稱穩定,未因抽樣維度增加使不同效率分配下的估計參數出現方向變 換的情形,由參數分配的平均與2.5%分位數與 97.5%分位數可得知此一事實。 模型變異數亦一如我們預期般的結果,解釋變數增加使為解釋變異減少,且幅度 較 Cobb-Douglas 時增加不少,特別是 Half-Normal 分配下的變異數由 0.5040 減至 0.0366,較指數分配與 Gamma 分配展現更佳的配適能力。DIC 值亦有同 樣的趨勢,除Half-Normal 分配的 DIC 值由-672.8930 減至-800.5120 最佳外, 另二分配亦有顯著的進步,顯然在CES 生產函數下,我們較相信效率產生的型 態為一 Half-Normal 分配。有關城市效率衡量上,Half-Normal 分配依舊是三者 中區隔城市差異能力最強的設定,估計係數與 Cobb-Douglas 下的結果相差不 大。 最後我們看到random effect下的Translog生產函數估計實證結果,如表九所 示。
表九:Translog 生產函數表(random effect)
參數\效率項分配 Exp Half-Normal Gamma
常數項 1.9450(-3.3170,7.3880) (2.7330)(a) 2.1220(-3.6340,8.1040) (2.9940) 2.1660(-3.6680,7.9490) (2.9670) 城市總人口 1.5250(-0.7010,(1.1210) 3.7330) 1.5670(-0.7517,(1.1690) 3.8500) 1.5170(-0.7334,(1.1260) 3.6990) 城市建設用地面積 0.7993(-1.2590,2.8310) (1.0440) 0.8912(-1.3360,3.1560) (1.1490) 0.8684(-1.2960,2.9990) (1.1150) 固定資產投資總額 -0.4378(-3.2150,(1.4150) 2.3940) -0.5310(-3.6400,(1.5610) 2.5100) -0.5295(-3.4960,(1.5500) 2.5330) (城市總人口)2 0.0859(-0.2503,0.4201) (0.1712) 0.0924(-0.2598,0.4567) (0.1814) 0.0903(-0.2401,0.4300) (0.1699) (城市建設用地面積)2 -0.0749(-0.3301,(0.1299) 0.1811) -0.0429(-0.3052,(0.1353) 0.2278) -0.0670(-0.3233,(0.1304) 0.1997) (固定資產投資總額)2 0.1673(-0.2332, 0.5432) (0.1934) 0.1862(-0.2223,0.5976) (0.208) 0.1794(-0.2386,0.5698) (0.2058) 城市總人口x 城市建設用地面積 -0.1947(-0.5976,0.2291) (0.2101) -0.2030(-0.6365,(0.2234) 0.2429) -0.1960(-0.5918,(0.2061) 0.2061) 城市總人口x 固定資產投資總額 -0.2618(-0.7923,0.2643) (0.2661) -0.2755(-0.8402,(0.2814) 0.2664) -0.2632(-0.7721,(0.2633) 0.2647) 城市建設用地面積x 固定資產投資總額 0.0232(-0.4591,0.5021) (0.2417) -0.0118(-0.5258,0.4980) (0.2609) 0.0023(-0.4744,0.5028) (0.2525) θ 17.1400(11.4400,(4.24700) 27.8800) 41.4700(31.1500,(5.9300) 54.1400) 22.6400(13.7900,(5.8640) 37.0100) φ - - 2.4750(0.9784,(1.2990) 5.9470) σ2 0.0617(0.0408,0.0819) (0.0107) 0.0317(0.0175,(0.0085) 0.0495) 0.0525(0.0291,(0.0126) 0.0770) 效率平均值(b) 標準差 0.9426 (0.0304) (0.0515) 0.8904 (0.0357) 0.9017 DIC -578.0780 -878.2400 -644.1470 資料來源:本研究。 附註:(a).參數推論值為抽樣平均數,右邊括號內分別為 2.5%及 97.5%分位數,下方括號則為標 準差。 (b).效率平均值指的是 285 個城市的總效率平均值,下方括號為其標準差。
對照表八的 CES 生產函數與表四的 VKSO 模型,Translog 函數下的結果仍
然呈現穩定的參數表現,除少數參數如(城市建設用地面積)2 與城市建設用地面 積x 固定資產投資總額有較明顯的差異外,其餘生產要素分配的平均數並無太大 差距。部分參數仍有2.5%分位數與 97.5%分位數方向不一致的問題,顯示投入 與產出管道的各種可能性,而參數標準差仍較 VKSO 模型時高出許多,且估計 參數亦與表四有較大的差異,造成的原因已於說明CES 生產函數實證結果時提 到。 在衡量模型的表現上,母體變異數較表八縮減了少許,幅度依效率事前分配 略有差異,仍以Half-Normal分配下結果有顯著優勢。在DIC值測量方面, Half-Normal分配優於其餘二者的幅度進一步加大,由-800.5120至-878.2400, 顯然的,在Translog模式下,我們仍舊相信城市效率分配為一Halif-Normal分配 的型態,區隔城市競爭力的差異仍一如以往的以Half-Normal分配最優。 在hierarchical效果的實證說明後,如同探討在fixed effect一般,我們仍將檢 視不同效率分配設定下城市排名的相關係數,我們仍是以計算每一生產函數下,
不同u 的事前分配是否影響城市效率的排序,結果如表十所示。 i
表十:效率估計值相關係數表(random effect)
相關係數\模型 Cobb-Douglas CES Translog 指數、Half-Normal 0.9642 0.9685 0.9654 指數、Gamma 0.9947 0.9932 0.9906 Half-Normal、Gamma 0.9846 0.9895 0.9888 資料來源:本研究。 由表十我們發現,random effect下的結果仍舊以指數分配與Gamma分配下 的相關性最高,三種生產函數皆維持在0.99以上,其餘兩種配對也都都在0.96 以上,與表五的fixed effect模式比較,結果相當接近,也都優於Greene(1990) 的結果。 除城市效率排名的相關係數外,我們依舊列出每種生產函數與每種效率分配 下排名前5名與後5名的城市,其目的除比較排名的差異外,亦可與表五的結果 進行比較,如表十一所示。 與表六的結果比較,表十一的城市競爭力排名變化較大,不若VKSO模型穩 定,大致來說,生產函數的形式主導了排名的起伏,給定生產函數時,三種不同 效率的事前分配下的城市排名相當一致,一旦改變生產函數的形式,城市排名就 發生較顯著的改變,但排名後5位的城市變化不若前5名來得大。排名居前的城 市大致上仍是擁有特殊資源的城市居多,如大慶、茂名、玉溪、鞍山等,排名居 後的城市依舊以偏遠地區的邊境城市較多。 五、結論 本文採用貝氏概念結合SFA模型來估計兩岸城市相對競爭力,藉由馬可夫性 質有效的完成此一過程。同時依區域特性劃分樣本,進行Hierarchical Model模 型下的配適能力,並分別嘗試了不同生產函數設定與不同效率項分配的實證結 果,大致上獲得不錯的結果。以生產函數的角度來看,考慮較複雜產出投入關係 得到越佳的估計結果,我們也指出生產函數的型態在本研究居主導性地位。以效 率分配的而言,Half-Normal分配在模型中擁有相對優勢,在VKSO模型中幅度 來不算太大,但隨著本研究進入random effect的架構,並採用較複雜的生產函數 後,配適能力的優劣便更明顯的區隔出來。單純以模型配適的角度來看,我們較 相信城市競爭力的差異服從一Half-Normal分配,生產函數型態為Translog,估 計結果亦顯示區域因素造成的樣本差異的確存在。 然本研究尚有未臻完善之處,僅考慮三種投入要素與產出的關係過於簡 化分析,城市發展的面貌遠比企業生產過程複雜,許多外生因素亦是決定城市發 展的指標,但礙於資料受限與量化過程困難的因素,僅能進行如上研究。未來將 考量更多影響城市產出外的因素,來共同判斷城市競爭力的變化。除此之外,將 一併加入兩岸三地等相關城市,如香港、澳門、台灣城市來進行城市競爭力的比 較。