• 沒有找到結果。

第二章、 研究設計

第四節 分析方法與資料來源

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

31

的非正式款項──國內貸款──與各省城鎮人均可支配收入,以及各省二級產業總產值 呈現正向強相關,而各省的人口數亦與二級產業總產值有正向強相關,其 Pierson R 分別皆高達 0.7 以上,不宜同時作為解釋模型的自變數。因此作者將各項資金援助及 表現──二級產業總產值、能源及產業總產值、國家預算內資金以及國內貸款──皆以 各省該年度的 GDP 作為母數,取各變數在單位 GDP 上的比例做為解釋模型的自變 數,此能更正確地解釋各項變數對依變數的影響關係。確定解釋變數的獨立性後,即 以之來估計 GDP 增長率以及節能政績的模型。

第四節 分析方法與資料來源

一、兩個案選用的統計模型

本研究的個案 A 為 GDP 增長率的解釋模型,其依變數為連續變數,因此適用於 以最小平方法函數來對多個自變數與依變數的關係進行建模的「多元線性迴歸型」

(Multiple Linear Regression Model)。此模型是以單純的線性關係來預測函數,因此 解釋方式較為容易,可直接以自變數的預測平均係數值,來推估其增減對依變數變化 的影響。

而本研究個案 B──十一五節能指標考核──的分析模型則採用「有序勝算對數模 型」(Ordered Logit)。因節能考核指標屬於有序多分類的依變數,該類變數的值並非 連續變數而是類別變數,然而相比於只有兩個值的虛擬變數,有序多分類的依變數則 具有兩個以上的類別,雖類別之間的距離無法測量,但卻有大小或高低等級可以依序 排列,且該變數類別的間距不必然是定距的,其機率分布也非常態分佈,因此違反了 線性迴歸模型的基本設定,不能直接使用線性迴歸模型來進行統計分析,而須以有序 勝算對數來分析。30該模型的係數值,可觀察解釋變數對依變數的影響方向為何以及 是否顯著,如當係數值為正值時,若解釋變數 x 越高則依變數落入越高序類的可能性 越高。但仍需換算為勝算比(odds ratio)或機率(probability)才能明確地解釋依變數 的變化。

30 一般而言,對有序多分類變數的分析除了有序勝算對數外,亦可運用「有序多機率單元模型」

(Ordered Probit),兩者的分析結果相同,差別是有序勝算對數模型的係數較大,大約是有序機率單 元模型係數的 1.81 倍。本研究將採用有序勝算對數模型作為實證分析的模型,又稱為「累積勝算對 數模型」(cumulative logit model)。詳請參見 Alan Agresti, Analysis of Ordinal Categorical Data (Hoboken, NJ: Wiley, 2010), pp. 46-47.

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

32

須特別說明的是,有序勝算對數模型中有一強烈的假定──同一個解釋變數 x 的 迴歸係數β不論在哪一個式子中都等值──亦即解釋變數 x 對依變數的影響,不論是在 依變數哪兩類程度的比較,其影響程度是一致的,此即「平行迴歸假定」(parallel regression assumption)。31若有序多分類勝算對數模型無法通過平行迴歸假定的檢驗,

則拒絕解釋變數 x 在每一類程度相比的影響性是一致的,須改以「廣義有序勝算對 數」(generalized ordered logit model)估計之。然而,本研究一大限制在於節能考核指 標的官方評比僅有公布三個年份,即使有 30 個省份(扣除西藏)的 3 年資料,其觀 察值仍不夠足以進行平行回歸假定的檢驗。若另外以統計年鑑中的數據自行計算 2006 以及 2010 年的節能指標作為依變數,則可能會有無法解決的誤差產生,因我們 無法得知官方的評分方式確切為何,且 2006 年一票否決的方案尚未公布,效力無法 溯及既往,因此非正式關係對其的影響也將有所不同。侷限於此,本研究暫時接受該 模型平行迴歸的假定成立,先觀看解釋變數在整體程度模型中的影響為何。然而,此 亦將增加本研究的限制與風險,若該模型事實上未能通過平行迴歸的假定,可能有重 要的解釋變數、或變數間交互作用將被忽略。為降低此侷限之風險,作者著力以理論 之探查、交互作用之嘗試以及質性研究的討論等,作為彌補。

二、檢證論點的模型設定

本研究的主要論點,除了提出有無非正式關係對幹部政績有顯著影響外,亦認為 屬於不同關係派別的幹部,其政績表現會有顯著的差異,且此差異將在不符合幹部經 濟利益的政策上更為明顯。然而,因在省級領導有無非正式關係的變數中為無關係類 別的領導,在非正式派別變數中的類別亦皆為無關係,此二變數的 Pierson R 相關性 高達 0.8 以上,不宜同時放入解釋模型,因此,在本研究兩個案中,皆將以有無非正 式關係與非正式關係派別兩變數估計兩組不同的模型,以觀看其效果的差異。作者將 統計模型圖繪於下圖 2-1。此外,省委書記及省長的職務差別有不同的政績考核項目,

因此極其追求晉升的政治動機可能會展現在不同的政策上。為確定究竟是哪一個職位 身分在本研究所選取的兩個政策上有強烈的政治動機,本研究亦將在兩個案中,分別 建構省長與省委書記的個人特徵對於該省政績表現的影響。

三、資料來源

31 黃紀、王德育,質變數與受限依變數的迴歸分析,(台北:五南出版社,2012),頁 153、156-158。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

33

本研究解釋變數中關於省份年度數據,以及個案 A 的依變數──GDP 增長率──

的資料來源,皆取自中華人民共和國國家統計局每年度所頒布的中國統計年鑑,加以 計算編碼而成;而個案 B 中的依變數──十一五節能考核表現程度──則是取自中華人 民共和國國家發展和改革委員之年度公告。32而本研究關於領導個人特徵的變數中,

年齡、教育程度、族群、性別等資訊主要收集整理新華網的幹部簡歷,非正式關係則 是整理簡歷中各省級領導與中央政治局常委在同事、同學、同鄉、親戚等關係,再輔 以媒體新聞(排除與官方政治立場鮮明對立的大紀元、新唐人等媒體)及學術文章等 作為分類的檢驗。

圖 2-1 統計模型圖

32 「2007 年各省自治區直轄市節能目標完成情況」,中華人民共和國國家發展和改革委員會,2008 年 7 月 30 日,http://hzs.ndrc.gov.cn/newjn/200807/t20080730_228454.html;「發改委公告 2008 年各省 自治區直轄市節能目標完成情況」,騰訊網,2008 年 7 月 30 日,

http://news.qq.com/a/20091026/000035.htm;「2009 年各省自治區直轄市節能目標完成情況」,中國 網,2008 年 7 月 30 日,http://www.china.com.cn/policy/txt/2010-06/25/content_20345239.htm。

兩種自變數設定 兩個案依變數設定

「有無」非正式關係

(有或沒有,虛擬變數)

非正式關係「派別」

(胡溫、江系、其他、無關係,類別變數)

個案 A:

年度 GDP 成長率(連續變數)

個案 B:

年度節能指標考核程度(順序變數)

個案 A

年齡優勢、教育程度、少數民族、女性、單位 GDP 二級產 業總產值、單位 GDP 國內預算資金、單位 GDP 國內貸款、

城鎮人均可支配所得、人口數、直轄市與否、三大區域

個案 B

年齡優勢、教育程度、少數民族、女性、單位 GDP 能源密集 產業資產投資額、單位 GDP 國內預算資金、單位 GDP 國內 貸款、城鎮人均可支配所得、人口數、碳消費量、三大區域 控制變數

資料來源:作者繪製。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

34