資料分析

本研究探討2004 年至 2011 年之間，21 家企業的研發能力、加入時間和規模對於研發績效的影響，屬於縱橫面資料 ( Panel data )，故以統計軟體 STATA 11.0

87 陳建男、朱文儀，規模、年齡、廠商成長與績效之關係，管理評論第二十五卷第四期，2006

年10 月，頁 1-26。

做為分析工具，將資料進行 Panel data 模式分析。

而Panel data 模式又可以分成固定效果模型 ( Fixed effects model ) 和隨機效果模型 ( Random effects model )，兩者的差別在於對截距項的定義不相同，若截距項與自變數之間具有相關性，則稱為固定效果模型；如果截距項與自變數之間不具有相關性，則為隨機效果模型，而屬於固定效果模型或是隨機效果模型則以 Hausman 檢定進行判斷。

壹、研究模型

根據前面的研究假設和變數定義，本研究將企業研發能力、加入專利聯盟的時間、企業的規模、員工人數和年齡等變數設計下列迴歸模型：

Y = β β + β + β + β + β X 其中，

Y = 研發績效 ( Innovation Performance ) = 研發能力 ( R&D capability )

= 加入專利聯盟的時間 ( Time ) = 企業的規模 ( Size )

= 企業的員工人數 ( Employee ) X = 企業的年齡 ( Age )

固定效果模型 一.

固定效果模型又可以稱為虛擬變數法 ( least square dummy variable method, LSDV )，其特色在於能夠兼顧橫斷面 ( cross section ) 與時間序列 ( time series ) 同時存在的資料，同時容許樣本之間具有差異性，以一固定的截距項象徵每一個樣本的不同之處，但並不會隨時間而改變。表示方法則是讓每一研究樣本對應同一個虛擬變數，當對應其他不同的樣本觀察值時，這個虛擬變數的數值就會變為

零。假設 Fi 代表第 i 家廠商的虛擬變數，則可以表示為：

= 1, i = 1

0, otherwise = 1, i = 2

0, otherwise … = 1, i = 3 0, otherwise

其迴歸式表示如下：

= ∑ + ∑ + (4-1)

其中，

i = 1,2,…,n 家廠商 t = 1,2,…,t 期

k = 1,2,...,k 個自變數

為固定截距項且每家廠商有不同的結構，用虛擬變數表示：

當 j=1 時， = 1；當 j≠1 時， = 0

為第 k 個自變數的第 i 家企業，時間有 t 期 ~ iid ( 0, )

因此，不同廠商會有不同的截距項，可以用來找尋因為廠商之間差異性所產生的遺漏變數對依變數所造成的影響。利用不同的截距項來控制這個變數，就可以排除模型設定上的誤差。要了解廠商之間是否真有異質性存在，則利用F 統計量進行判斷：

：

β = β = ⋯ = β

：

β 並不完全相等

F(t − 1, nt − t − k) = _⁄₍^⁄⁽ ⁾₎ (4-2)

其中，u 是未受限之 LSDV 模型，r 為受限制的 OLS 模型， 是判定係數。

當F 統計量大於其對應之臨界值時，將會拒絕虛無假設，亦即表示會有廠商效果的存在。

另外，若要探討時間序列彼此的差異性，亦即截距項會隨時間不同改變，但是不會隨著廠商不同而改變，則稱為時間效果，也可以用虛擬變數來表示，迴歸式如下：

= ∑ + ∑ + ∑ + (4-3)

其中，

i = 1,2,…,n 家廠商 t = 1,2,…,t 期

k = 1,2,...,k 個自變數

為固定截距項的不部份且不隨時間而有差異，用虛擬變數表示：

當 l=t 時， = 1；當 l≠ 時， = 0

為固定截距項且每家廠商有不同的結構，用虛擬變數表示：

當 j=1 時， = 1；當 j≠1 時， = 0

為第 k 個自變數的第 i 家企業，時間有 t 期 ~ iid ( 0, )

如欲要了解截距項是否會因為時間不同而改變，可以利用F 統計量來檢定。

：

δ = δ = ⋯ = δ

：

δ 並不完全相等

F(t − 1, nt − t − k) = _⁄₍^⁄⁽ ⁾₎ (4-4)

其中，u 是未受限之 LSDV 模型，r 為受限制的 OLS 模型， 是判定係數。

當F 統計量大於其對應之臨界值時，將會拒絕虛無假設，亦即表示會有時間效果的存在。

隨機效果模型 二.

隨機效果模型與固定效果模型的一部份相當類似，但是隨機效果模型重視整群母體的關係，並非個別樣本之間的差異，隨機效果模型也容許樣本之間具有差異性存在或者允許時間不同，同時會假設整群母體內的相似度高，樣本之間的差異截距項是隨機產生，不會隨時間而有變化。此模型的表示如下：

= + ∑ + = + + ∑ + (4-5) ( ) = 0, ( ) =

( , ) = 0, , = 0 ≠

其中，

i = 1,2,…,n 家廠商 t = 1,2,…,t 期

k = 1,2,...,k 個自變數

為截距項且每家廠商都不一樣，以隨機變數表示，即 = + 的期望值為， 指截距的誤差項~iid ( 0, )

~ iid ( 0, )

如果 = 0，也就是 = 0 的時候，說明廠商之間的並無差異性。若欲檢定此架設，除了可以用先前說明的F 統計檢定之外，也可以利用另外一種 LM 統計量檢定方法，如下：

：

= 0

：

≠ 0

LM = ₍ ₎ ^∑_∑ ^∑_∑ − 1 (4-6)

上式 (4-6) 為漸近 (1)的卡方分配，為 OLS 模型的殘差項，當 (1)統計量大於其對應的臨界值時，將會拒絕虛無假設，也就是說有廠商效果的存在。

除了允許廠商之間的差異性之外，尚可以允許時間序列的差異性，此時截距項會因時間不同而有所變動，此模型可以延伸如下：

= + ∑ + = + + + ∑ + (4-7)

其中，

為截距項且每家廠商都不一樣，但都是以隨機變數表示，即 = + + 其差距為隨機變數。

的期望值為，與為截距的誤差項。

~iid ( 0, ) 且 ~iid ( 0, )， ~ iid ( 0, )

貳、 Hausman 檢定

Hausman 檢定被用來做為使用固定效果或隨機效果模型的判斷依據，假設截距誤差項與自變數之間具有統計相關性時，固定效果模型的結果將具有有效性 ( efficient ) 和一致性 ( consistent )，然而，隨機效果模型的估計將不具一致性，

所以此時會採用固定效果模型；反之，當截距誤差項與自變數之間不具有統計相關性時，則會採用隨機效果模型。

用 Hausman 檢定來找出最適模型，判斷選用固定效果模型或是隨機效果模型，在固定效果模型下用OLS 的估計是否較隨機效果模型下的 GLS 估計來的好。

這個檢定的虛無假設為cov( , ) = 0，對立假設為cov( , ) ≠ 0。在此虛無假設之下，兩者的估計沒有差別。故以兩者之間的差距作檢定，估計向量差距的共變異矩陣表示如下：

Var − = [ ] + − , − , (4-8)

其中，b 與分別為 OLS 與 GLS 的估計量。Hausman 指出效率估計量與其和 無效率估計量之間差異的共變異數應該為靈，其隱含著：

Cov ( , ), = , − = 0 (4-9)

將式4-9 帶入式 4-8 可得下列結果：

Var − = [ ] − =∑ (4-10)

之後，Hausman 檢定可以用卡方檢定來判斷最適合的模型：

H = [ ] = − ∑ [ − ] (4-11)

而 Hausman 檢定可以運用卡方檢定 ( chi-squared， [ ] ) 來判斷出最適合的模型，檢定方式表示如下：

= 0, ( , ) = 0，意即與為統計無關，則採隨機效果模型。

= 0, ( , ) ≠ 0，意即與為統計無關，則採固定效果模型。

Hausman 檢定統計量如下：

= − − − ~ [ ] (4-12)

k 為卡方檢定中的自由度， 為固定效果模型下的估計參數、為隨機

效果模型下的估計參數，當 H > [ ] 時，會拒絕虛無假設，此時採用固定 效果模型；若 H < [ ] 時，會拒絕虛無假設，此時採用隨機效果模型。

研發能力 0.0001234 0.000971 0.0000263 0.0000336 加入專利聯

盟的時間 0.0111744 0.0114863 -0.0003119 0.0009417 企業規模 -0.2856188 -0.1610181 -0.1246007 0.0758456

員工人數 -0.0303166 -0.0676826 0.037366 0.0801823

以 Hausman 檢定的結果為 ℎ (4) = −1.45，Prob > ℎ = 0.0000 <

0.05，因此，採用隨機效果模型較能夠解釋此模型，本研究將以隨機效果模型進行後續的研究結果討論。

從各變數的基本統計資料顯示（見表 18），本研究共有 147 個樣本數，企業研發能力的平均值為237.45，不過變異數高達 250.57，顯示各企業在該領域的研發能力差異相當大，但受限於樣本數的緣故，並未再將企業依研發能力做區隔討論；至於加入時間的平均值為 3，企業規模的平均值為 4.74；員工人數與企業年齡的平均值則分別為5.11 和 66.9。

在文檔中專利聯盟對企業研發績效影響之研究 - 政大學術集成 (頁 63-70)

壹、 研究模型

：

：

：

：

：

：

貳、 Hausman 檢定

壹、研究模型