• 沒有找到結果。

(一) Freedman and Lane (1983)、ter Braak (1992)

資料配對方式為(𝑌𝑖, 𝑥𝑖, 𝑧𝑖),因此∑ 𝑥𝑛1 𝑖2、 ∑ 𝑧𝑛1 𝑖2、 ∑ 𝑥𝑛1 𝑖𝑧𝑖不會隨著排列方式

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

16

迴歸參數最小平方估計值。再將𝑢𝑖排列後對𝑣𝑖做迴歸,而∑ 𝑢𝑛1 𝜋𝑖、 ∑ 𝑢𝑛1 𝜋𝑖2

∑ 𝑣𝑛1 𝑖、 ∑ 𝑣𝑛1 𝑖2亦不會隨著排列方式而改變。此時欲探討之迴歸係數估計值為𝑏2𝜋 =

∑ 𝑣𝑖𝑢𝜋𝑖∑ 𝑣𝑖 ∑ 𝑢𝜋𝑖 𝑛1 𝑛1

𝑛 𝑛1

∑ 𝑣𝑛1 𝑖2(∑ 𝑣𝑖 𝑛1 )2

𝑛

,其變異數為

𝑠2(𝑏2𝜋) = 𝑀𝑆𝐸

∑ 𝑣𝑛1 𝑖2(∑ 𝑣𝑖 𝑛1 )2

𝑛

=

∑ (𝑢𝜋𝑖−𝑢̅̅̅̅̅)𝜋𝑖 2[∑ 𝑣𝑖𝑢𝜋𝑖

𝑛1 −𝑛𝑣̅𝑢𝜋𝑖̅̅̅̅̅̅]2

∑ (𝑣𝑖−𝑣̅)𝑛 2 1 𝑛1

(∑ 𝑣𝑛1 𝑖2(∑ 𝑣𝑖 𝑛1 )2

𝑛 )(𝑛−2)

,且𝑡2𝜋 = 𝑏2𝜋

𝑠(𝑏2𝜋)。

若∑ 𝑣𝑛1 𝑖𝑢𝜋𝑖越大,則𝑏2𝜋之值越大,𝑠2(𝑏2𝜋)則越小,因此𝑡2𝜋也會越大,故使用 𝑏2𝜋與𝑡2𝜋值架構之排列分配會相同,然而由於觀察到的𝑏2以及𝑡2值之計算方式與 排列分配的計算方式不同,兩個統計量所對應回各自的排列分配之相對位置有可 能並不相同,因此兩種統計量之檢定結果也可能有所差異。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

17

第二節 Kennedy(1995) 方法下,

𝒕𝟐

值自由度使用之探討

Anderson and Legendre (1999)、Anderson and Robinson (2001) 提及 Kennedy (1995)方法時,t 值的計算式中使用自由度𝑛 − 𝑝來進行計算,而非使用𝑛 − 2,藉 以考量解釋變數𝑋被用來計算𝑢𝑖、𝑣𝑖所造成的自由度損失。他們認為使用自由度 𝑛 − 𝑝來計算𝑡2值之型一誤差機率均有膨脹的效果(inflated),尤其在樣本數較小 的時候特別明顯;使用𝑛 − 2來進行計算則可降低膨脹的現象。本小節將就採取 自由度𝑛 − 2計算較為合理進行說明,並藉由統計模擬來進行驗證。

一、 自由度𝒏 − 𝟐的著眼點

根據文獻探討中的介紹,由於 Kennedy (1995)的方法在架構排列分配時,僅 考慮反應變數𝑌以及欲探討之解釋變數𝑍之淨關係,因此先將𝑌與𝑍當中,能被干 擾變數𝑋解釋的部分扣除後再進行討論。換句話說,就是將兩個殘差(𝑢𝑖對𝑣𝑖) 進行迴歸進而架構其排列分配。儘管計算這兩個殘差的過程涉及到其他參數的估 計,但在最後將𝑢𝑖視為新的反應變數值,𝑣𝑖視為新的解釋變數,並且將其他估計 值皆視為已知來進行迴歸估計時,最後僅需估計兩個參數,因此自由度應為𝑛 − 2。

二、 模擬驗證

此處將採用與 Anderson and Robinson (2001) 相同的模擬條件來產生資料,

藉以驗證上述的論述。假設模型中存在五個解釋變數:𝑋1、𝑋2、𝑋3、𝑋4以及欲探 討之變數𝑍,數值皆由均勻分配 U(0,3)隨機產生;解釋變數𝑍之係數設定為 0,其 餘解釋變數之係數和截距項均設定為 1;誤差項𝜀𝑖來自標準常態分配 N(0,1)。藉 由以上設定,進而產生反應變數值𝑦𝑖 = 1 + 1𝑥1𝑖+ 1𝑥2𝑖+ 1𝑥3𝑖+ 1𝑥4𝑖+ 0𝑧𝑖+ 𝜀𝑖並使用 Kennedy (1995)之排列方法產生排列分配(其中排列次數 M 為 999 次)。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

18

接著,分別使用𝑛 − 𝑝與𝑛 − 2這兩種自由度來計算最小平方估計值𝑏2𝜋之標準誤 𝑠(𝑏2𝜋),以產生 t 值統計量,分別以𝑡2𝜋(𝑛−𝑝) = 𝑏2𝜋

𝑠(𝑏2𝜋(𝑛−𝑝))、𝑡2𝜋(𝑛−2)= 𝑏2𝜋

𝑠(𝑏2𝜋(𝑛−2))表示,

其中𝑠(𝑏2𝜋(𝑛−𝑝)) = √𝑛−𝑝𝑆𝑆𝐸、𝑠(𝑏2𝜋(𝑛−2)) = √𝑆𝑆𝐸

𝑛−2。

此處將額外針對模擬結果初步以圖形作為比較,觀察各自由度下所產生之排 列分配是否與理論分配相符。此外亦進行 Kolmogorov–Smirnov 檢定(K-S test), 檢定各自由度下所產生之排列分配是否服從理論分配之拒絕次數。若拒絕比例過 高則表示使用該統計量架構之排列分配與理論分配較不符合,並且觀察拒絕比例 是否會隨著樣本數增加而有所變動。

圖 3.1 至 3.4 分別呈現不同樣本數(𝑛 = 10、40、70、100)的模擬結果,

以兩種自由度計算之𝑡2值排列分配,並各自與理論上之分配(𝑡(𝑛 − 𝑝)、𝑡(𝑛 − 2))

相互比較。可以發現藉由自由度𝑛 − 2架構之排列分配與理論分配較相符,在樣 本數較小的情況之下更為明顯;樣本數較大時,由於理論分配受到估計參數個數 的影響不大,因此不論使用何種自由度架構排列分配均與理論分配差異不大。

圖 3.1 兩種自由度架構之𝑡2值排列分配與理論分配 (樣本數為 10)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

19

圖 3.2 兩種自由度架構之𝑡2值排列分配與理論分配 (樣本數為 40)

圖 3.3 兩種自由度架構之𝑡2值排列分配與理論分配 (樣本數為 70)

圖 3.4 兩種自由度架構之𝑡2值排列分配與理論分配 (樣本數為 100)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

20

表 3.1 為在顯著水準α = 0.05 之下,藉由產生一萬組資料並考慮不同樣本數 以及兩種自由度之𝑡2統計量之型一誤差機率模擬結果以及 K-S 檢定之拒絕比例。

模擬結果顯示,若使用自由度為𝑛 − 𝑝之統計量,其型一誤差機率確實會呈現膨 脹的效果,且於樣本數較小時特別明顯;K-S 檢定之拒絕比例亦於樣本數較小時 較高,表示在樣本數較小時使用該自由度之統計量與理論分配是較不相符的。相 反地,使用自由度為𝑛 − 2之統計量其型一誤差與顯著水準均較接近,且其 K-S 檢定之拒絕比例也都較低。

表 3.1 型一誤差機率及 Kolmogorov–Smirnov 檢定拒絕率

型一誤差機率 K-S 檢定拒絕率

df n-p n-2 n-p n-2

n=10 0.1800 0.0813 1.0000 0.1122

n=20 0.0813 0.0519 0.6704 0.0580

n=30 0.0700 0.0519 0.2201 0.0506

n=40 0.0605 0.0488 0.1155 0.0468

n=50 0.0650 0.0538 0.0839 0.0520

n=60 0.0565 0.0465 0.0695 0.0493

n=70 0.0570 0.0504 0.0678 0.0527

n=80 0.0537 0.0479 0.0601 0.0480

n=90 0.0562 0.0509 0.0580 0.0514

n=100 0.0549 0.0505 0.0571 0.0511

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

21

第三節 Oja (1987)方法下設計變數值之探討

Oja (1987) 在提到設計變數𝑍時有給予條件∑ 𝑧𝑛1 𝑖 = 0,亦即該變數值加總為

零。本小節欲以模擬的方式,以兩個解釋變數為例(一共變項𝑋及一設計變數𝑍),

藉由驗證設計變數值扣除其平均值與否其型一誤差機率是否有所差異,來說明在 一般複迴歸模型下(亦即非實驗設計的情況),限制條件 ∑ 𝑧𝑛1 𝑖 = 0的必要性。

首先產生 1000 組資料集(dataset),假設樣本數為 20(n=20),μ為 5,𝛽1、 𝛽2分別為 2 和 0;解釋變數𝑋及𝑍皆來自均勻分配 U(0,3),誤差項𝜀𝑖來自標準常態 分配 N(0,1)。藉由以上設定產生反應變數值𝑦𝑖 = 5 + 2𝑥𝑖 + 0𝑧𝑖+ 𝜀𝑖,並分別考慮 標準化及非標準化之設計變數𝑍,以文獻探討中所介紹之方法產生排列分配(其 中排列次數 M 為 999),進而計算𝑝 − 𝑣𝑎𝑙𝑢𝑒。在顯著水準α = 0.05之下,計算 1000 個𝑝 − 𝑣𝑎𝑙𝑢𝑒小於顯著水準之比例即為型一誤差機率。

表 3.2 為考慮設計變數值扣除其平均值與否,執行 100 次之型一誤差機率平 均值及標準差。可以發現兩者平均值僅差 0.00001,標準差差距約為 0.00051,兩 者差異不大。

由於該方法原先架構於實驗設計的角度下,欲探討的變數為類別型變數,因 此有設計變數值加總為 0(∑ 𝑧𝑛1 𝑖 = 0)之條件。若推廣至一般複迴歸模型,則並 沒有其必要性。

表 3.2 設計變數值扣除平均與否之型一誤差機率平均值及標準差

平均值 標準差

扣除平均值 0.04930 0.00639

未扣除平均值 0.04959 0.00593

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

22

相關文件