本研究探討2004 年至 2011 年之間,21 家企業的研發能力、加入時間和規模 對於研發績效的影響,屬於縱橫面資料 ( Panel data ),故以統計軟體 STATA 11.0
87 陳建男、朱文儀,規模、年齡、廠商成長與績效之關係,管理評論第二十五卷第四期,2006
年10 月,頁 1-26。
54
做為分析工具,將資料進行 Panel data 模式分析。
而Panel data 模式又可以分成固定效果模型 ( Fixed effects model ) 和隨機效 果模型 ( Random effects model ),兩者的差別在於對截距項的定義不相同,若截 距項與自變數之間具有相關性,則稱為固定效果模型;如果截距項與自變數之間 不具有相關性,則為隨機效果模型,而屬於固定效果模型或是隨機效果模型則以 Hausman 檢定進行判斷。
壹、 研究模型
根據前面的研究假設和變數定義,本研究將企業研發能力、加入專利聯盟的 時間、企業的規模、員工人數和年齡等變數設計下列迴歸模型:
Y = β β + β + β + β + β X 其中,
Y = 研發績效 ( Innovation Performance ) = 研發能力 ( R&D capability )
= 加入專利聯盟的時間 ( Time ) = 企業的規模 ( Size )
= 企業的員工人數 ( Employee ) X = 企業的年齡 ( Age )
固定效果模型 一.
固定效果模型又可以稱為虛擬變數法 ( least square dummy variable method, LSDV ),其特色在於能夠兼顧橫斷面 ( cross section ) 與時間序列 ( time series ) 同時存在的資料,同時容許樣本之間具有差異性,以一固定的截距項象徵每一個 樣本的不同之處,但並不會隨時間而改變。表示方法則是讓每一研究樣本對應同 一個虛擬變數,當對應其他不同的樣本觀察值時,這個虛擬變數的數值就會變為
55
零。假設 Fi 代表第 i 家廠商的虛擬變數,則可以表示為:
= 1, i = 1
0, otherwise = 1, i = 2
0, otherwise … = 1, i = 3 0, otherwise
其迴歸式表示如下:
= ∑ + ∑ + (4-1)
其中,
i = 1,2,…,n 家廠商 t = 1,2,…,t 期
k = 1,2,...,k 個自變數
為固定截距項且每家廠商有不同的結構,用虛擬變數表示:
當 j=1 時, = 1;當 j≠1 時, = 0
為第 k 個自變數的第 i 家企業,時間有 t 期 ~ iid ( 0, )
因此,不同廠商會有不同的截距項,可以用來找尋因為廠商之間差異性所產 生的遺漏變數對依變數所造成的影響。利用不同的截距項來控制這個變數,就可 以排除模型設定上的誤差。要了解廠商之間是否真有異質性存在,則利用F 統計 量進行判斷:
:
β = β = ⋯ = β:
β 並不完全相等F(t − 1, nt − t − k) = ⁄(⁄( )) (4-2)
56
其中,u 是未受限之 LSDV 模型,r 為受限制的 OLS 模型, 是判定係數。
當F 統計量大於其對應之臨界值時,將會拒絕虛無假設 ,亦即表示會有廠商效 果的存在。
另外,若要探討時間序列彼此的差異性,亦即截距項會隨時間不同改變,但 是不會隨著廠商不同而改變,則稱為時間效果,也可以用虛擬變數來表示,迴歸 式如下:
= ∑ + ∑ + ∑ + (4-3)
其中,
i = 1,2,…,n 家廠商 t = 1,2,…,t 期
k = 1,2,...,k 個自變數
為固定截距項的不部份且不隨時間而有差異,用虛擬變數表示:
當 l=t 時, = 1;當 l≠ 時, = 0
為固定截距項且每家廠商有不同的結構,用虛擬變數表示:
當 j=1 時, = 1;當 j≠1 時, = 0
為第 k 個自變數的第 i 家企業,時間有 t 期 ~ iid ( 0, )
如欲要了解截距項是否會因為時間不同而改變,可以利用F 統計量來檢定。
:
δ = δ = ⋯ = δ:
δ 並不完全相等F(t − 1, nt − t − k) = ⁄(⁄( )) (4-4)
57
其中,u 是未受限之 LSDV 模型,r 為受限制的 OLS 模型, 是判定係數。
當F 統計量大於其對應之臨界值時,將會拒絕虛無假設 ,亦即表示會有時間效 果的存在。
隨機效果模型 二.
隨機效果模型與固定效果模型的一部份相當類似,但是隨機效果模型重視整 群母體的關係,並非個別樣本之間的差異,隨機效果模型也容許樣本之間具有差 異性存在或者允許時間不同,同時會假設整群母體內的相似度高,樣本之間的差 異截距項是隨機產生,不會隨時間而有變化。此模型的表示如下:
= + ∑ + = + + ∑ + (4-5) ( ) = 0, ( ) =
( , ) = 0, , = 0 ≠
其中,
i = 1,2,…,n 家廠商 t = 1,2,…,t 期
k = 1,2,...,k 個自變數
為截距項且每家廠商都不一樣,以隨機變數表示,即 = + 的期望值為 , 指截距的誤差項~iid ( 0, )
~ iid ( 0, )
如果 = 0,也就是 = 0 的時候,說明廠商之間的並無差異性。若欲檢 定此架設,除了可以用先前說明的F 統計檢定之外,也可以利用另外一種 LM 統 計量檢定方法,如下:
:
= 058
:
≠ 0LM = ( ) ∑∑ ∑∑ − 1 (4-6)
上式 (4-6) 為漸近 (1)的卡方分配, 為 OLS 模型的殘差項,當 (1)統計 量大於其對應的臨界值時,將會拒絕虛無假設 ,也就是說有廠商效果的存在。
除了允許廠商之間的差異性之外,尚可以允許時間序列的差異性,此時截距項會 因時間不同而有所變動,此模型可以延伸如下:
= + ∑ + = + + + ∑ + (4-7)
其中,
為截距項且每家廠商都不一樣,但都是以隨機變數表示,即 = + + 其差距為隨機變數。
的期望值為 , 與 為截距的誤差項。
~iid ( 0, ) 且 ~iid ( 0, ), ~ iid ( 0, )
貳、 Hausman 檢定
Hausman 檢定被用來做為使用固定效果或隨機效果模型的判斷依據,假設截 距誤差項與自變數之間具有統計相關性時,固定效果模型的結果將具有有效性 ( efficient ) 和一致性 ( consistent ),然而,隨機效果模型的估計將不具一致性,
所以此時會採用固定效果模型;反之,當截距誤差項與自變數之間不具有統計相 關性時,則會採用隨機效果模型。
用 Hausman 檢定來找出最適模型,判斷選用固定效果模型或是隨機效果模 型,在固定效果模型下用OLS 的估計是否較隨機效果模型下的 GLS 估計來的好。
這個檢定的虛無假設為cov( , ) = 0,對立假設為cov( , ) ≠ 0。在此虛無假 設之下,兩者的估計沒有差別。故以兩者之間的差距作檢定,估計向量差距的共 變異矩陣表示如下:
59
Var − = [ ] + − , − , (4-8)
其中,b 與 分別為 OLS 與 GLS 的估計量。Hausman 指出效率估計量與其和 無效率估計量之間差異的共變異數應該為靈,其隱含著:
Cov ( , ), = , − = 0 (4-9)
將式4-9 帶入式 4-8 可得下列結果:
Var − = [ ] − =∑ (4-10)
之後,Hausman 檢定可以用卡方檢定來判斷最適合的模型:
H = [ ] = − ∑ [ − ] (4-11)
而 Hausman 檢定可以運用卡方檢定 ( chi-squared, [ ] ) 來判斷出最適合 的模型,檢定方式表示如下:
= 0, ( , ) = 0,意即 與 為統計無關,則採隨機效果模型。
= 0, ( , ) ≠ 0,意即 與 為統計無關,則採固定效果模型。
Hausman 檢定統計量如下:
= − − − ~ [ ] (4-12)
k 為卡方檢定中的自由度, 為固定效果模型下的估計參數、 為隨機
效果模型下的估計參數,當 H > [ ] 時,會拒絕虛無假設 ,此時採用固定 效果模型;若 H < [ ] 時,會拒絕虛無假設 ,此時採用隨機效果模型。
60
研發能力 0.0001234 0.000971 0.0000263 0.0000336 加入專利聯
盟的時間 0.0111744 0.0114863 -0.0003119 0.0009417 企業規模 -0.2856188 -0.1610181 -0.1246007 0.0758456
員工人數 -0.0303166 -0.0676826 0.037366 0.0801823
以 Hausman 檢 定 的 結 果 為 ℎ (4) = −1.45,Prob > ℎ = 0.0000 <
0.05,因此,採用隨機效果模型較能夠解釋此模型,本研究將以隨機效果模型進 行後續的研究結果討論。
從各變數的基本統計資料顯示(見表 18),本研究共有 147 個樣本數,企業 研發能力的平均值為237.45,不過變異數高達 250.57,顯示各企業在該領域的研 發能力差異相當大,但受限於樣本數的緣故,並未再將企業依研發能力做區隔討 論;至於加入時間的平均值為 3,企業規模的平均值為 4.74;員工人數與企業年 齡的平均值則分別為5.11 和 66.9。