• 沒有找到結果。

重複觀測量數之分析:多群體多變項線性成長模式的估計

N/A
N/A
Protected

Academic year: 2021

Share "重複觀測量數之分析:多群體多變項線性成長模式的估計"

Copied!
28
0
0

加載中.... (立即查看全文)

全文

(1)

溫福星 多群體多變項成長模式 51 教育科學研究期刊 第五十七卷第一期 2012 年,57(1),51-78

重複觀測量數之分析:

多群體多變項線性成長模式的估計

溫福星

* 東吳大學 國際經營與貿易學系

摘要

本研究利用「台灣教育長期追蹤資料庫」的一般分析能力與數學分析能力的四波調查結 果,配合男、女學生樣本進行多群體多條追蹤資料的線性成長模式估計。在考慮重複觀測資 料誤差項在不同時點的變異數非同質與不同時點間的共變數非獨立情況下,以及男、女學生 的不同成長軌跡,將誤差項結構設為無限制結構,利用虛擬變項交互項法與虛擬變項多樣本 法同時估計不同性別、不同能力的線性成長軌跡變化。由於全部追蹤資料樣本存在遺失值的 情形,本研究以階層線性模式(hierarchical linear modeling, HLM)軟體對完整資料 2,806 位學 生進行分析,其估計結果發現,在完整資料的兩條成長軌跡模式中,男、女學生誤差項共變 異數矩陣結構相同,但線性成長軌跡不恆等。除此之外,本文並對競爭模式比較的結果在文 章最後進行討論並提出相關的建議。 關鍵字:多群體分析、追蹤資料、巢套、階層線性模式、線性成長模式 通訊作者:溫福星,E-mail: wenft@scu.edu.tw 收稿日期:2010/09/22;修正日期:2011/03/30、2011/12/07;接受日期:2012/02/22。

(2)

52 多群體多變項成長模式 溫福星

壹、緒論

自從國內大型資料庫,例如臺灣高等教育整合資料庫、台灣教育長期追蹤資料庫(Taiwan Education Panel Survey, TEPS)等相繼建立起,教育科學的研究範疇逐漸從橫斷面分析開始往 追蹤資料的縱貫面分析前進,不僅是研究典範的轉移,也開始往多層次階層資料的架構邁進, 因此,有關追蹤資料的分析或是多層次模式(multilevel modeling, MLM),目前正受到教育學 界的高度重視(李敦義,2011;趙珮晴、余民寧、張芳全,2011)。 過去教育與心理研究的追蹤資料,大都以重複觀測的變異數分析取向進行資料分析,但 是這種重複觀測資料的分析在傳統的多變量分析中有兩個限制,第一是必須是完整的或是平 衡的資料結構設計(balanced design),也就是每位受試者都要有相同的重複觀測個數;第二是 雖然允許共變數分析但無法納入受試者的特徵或屬性,去解釋重複觀測資料的變化趨勢。而 計量經濟學的時間數列分析(time series analysis)又要求重複觀測的時點必須多於三十個方可 分析,因此晚近階層線性模式(hierarchical linear modeling, HLM)或混合模式(mixed model) 的成長模式(growth model)克服了上述兩項傳統多變量分析的限制,可以將不相等個數或不 同間距的重複觀測資料與受試者的特徵或屬性同時放在一個統計模式中進行分析。不僅如 此,更可以擴展到受試者所屬的環境(context)、組別(group)或實驗處理(treatment),以 檢視環境、組別或實驗處理的因素對受試者追蹤資料變化的影響。由於教育與心理研究的重 複觀測波次不多,以重複觀測量數描述較為適當,但考慮大部分的國內、外研究仍以追蹤資 料稱之,因此本研究重複觀測與追蹤資料是指相同的數據,同時這兩個名詞也交互於本研究 中使用。 有關重複觀測量數的分析方法除了 HLM 的取向外,結構方程模式(structure equation modeling, SEM)的潛在成長模式亦可以進行相同的資料分析。根據溫福星(2010)的研究整 理發現,兩種方法在特定條件下分析所得結果是一樣的,不過兩者具有下列主要的差異:一、 SEM 在處理測量誤的成長模式要比 HLM 有彈性與優勢;二、如果要探討兩條數列的程度 (level)(相當於 HLM 的截距項)與型態(shape)(相當於 HLM 的斜率項)參數之間的影響 關係,則 SEM 優於 HLM,但 HLM 的潛在變項迴歸(latent variable regression)也可以提供部 分 SEM 這樣的功能;三、但在第一層誤差項結構的設定上,則 SEM 的設定卻沒有比 HLM 來 得容易;四、甚至將追蹤資料的分析擴展到多層次的脈絡變項時,HLM 則要比 SEM 更加容 易與方便。總之,SEM 與 HLM 這兩種模式各有其擅長之處與限制,研究者可以選擇配合其 研究目的的適合方法,發揮 SEM 與 HLM 的特長方能夠與研究相得益彰。本研究之所以選擇 HLM的方式,在於其優點可以擴展到更高階的層次。此外,其不同群體成長軌跡的比較相對 簡單,不需像 SEM 一樣進行多群體 SEM 的估計,再加上許多參數的設限才能比較出不同群

(3)

溫福星 多群體多變項成長模式 53 體在某一軌跡參數上的差異。HLM 方法可以透過虛擬變項多樣本法與其對比檢定,一次的估 計即可進行調節效果或是多群體多變項多條軌跡的估計與檢定,甚至容易設定誤差項的共變 數結構。 在 HLM 的成長模式分析中,主要探討的是受試者重複觀測資料隨時間變化的趨勢為何? 例如,是線性成長或是二次曲線成長,以及探討受試者何種屬性特質,甚至受試者所屬的環 境變項如何影響成長軌跡的變化。由於重複觀測數據內屬於(nested within)受試者層級,因 此,追蹤資料的分析或是成長模式亦屬於廣義的多層次分析(multilevel analysis)。過去在 HLM研究追蹤資料的成長模式,大都研究一個變項的重複觀測數據或一條時間數列的變化, 鮮少研究兩個變項或以上的重複觀測數據或多條時間數列的成長模式,而 MacCallum、Kim、 Malarkey 與 Kiecolt-Glaser(1997)則利用虛擬變項編碼方式研究三條時間數列資料的線性成 長模式。鑒於國內大型資料庫有關追蹤資料的蒐集,同時研究多條時間數列或多個變項的重 複觀測數據的成長軌跡是未來研究的趨勢,因此,本研究第一個目的是因應過去國內文獻通 常只利用 HLM 或階層多變量線性模式模組(hierarchical multilevel linear model, HMLM)進 行一條成長軌跡的變化研究,忽略了可以同時研究兩條或以上成長軌跡的變化,所以本研究 利用 HLM 來示範如何進行多條追蹤資料的成長模式估計。同時研究多條成長軌跡的變化有兩 個好處,一來可以比較這些軌跡的變化是否相似,二來尚可檢視不同因素對這些軌跡的影響 是否相同,透過同時的多條成長軌跡之估計,可以進行成長軌跡參數間的差異檢定,達到上 述兩個目的。 除此之外,在大型資料庫的內涵方面,除了重複觀測資料的蒐集之外,另外一個研究重 點是異質性的(heterogeneous)分析,例如 SEM 的多群體模式(multi-group SEM),研究兩群 不同的母體,譬如在不同性別下其結構係數是否恆等據以作為性別為調節變項的研究。而國 內的臺灣高等教育整合資料庫或 TEPS,都會有公、私立學校與城市、鄉村的區分,因此研究 不同群體之下受試者追蹤資料成長軌跡的變化差異,可以視為異質性或是調節效果分析的檢 驗。此外,當研究者有足夠的理論或實徵證據支持成長軌跡具有異質性時,例如有性別差異 時,代表男、女學生的成長軌跡是不同時,此時學生的什麼特質屬性或是學校的什麼特徵會 影響這些軌跡的差異,可以在成長模式的 HLM 中加入學生或是學校的解釋變項納入模式一起 估計,以瞭解影響軌跡的機制。因此,如何同時估計不同群體的 HLM 成長模式是往更深入理 論驗證的必經之路。研究者研究追蹤資料分析至目前為止,在方法論上只有 Hedeker 與 Mermelstein(2007)、Verbeke 與 Molenberghs(2010)和 Wallace 與 Green(2002)利用 HLM 研究多群體追蹤資料的成長模式,以及 Bollen 與 Curran(2006)和 Duncan、Duncan 與 Strycker (2006)以 SEM 研究潛在成長模式(latent growth model)的多群體分析。鑒於過去的研究大 多將異質性的變項,例如性別視為解釋變項作為主效果,而未將它視為多群體的分類變項, 所以本研究的第二個目的即示範如何進行多群體追蹤資料的成長模式分析。由於 Bollen 與

(4)

54 多群體多變項成長模式 溫福星

Curran和 Duncan 等學者,以及 Hedeker 與 Mermelstein、Verbeke 與 Molenberghs 和 Wallace 與 Green的研究中都只探討一個變項追蹤資料成長模式的多群體研究,因此,本研究結合第一個 研究目的,利用 HLM 進行多群體多追蹤資料成長模式的估計,透過一次的軟體執行同時估計 出所有的參數,作為恆等性的比較或是調節效果的檢驗,甚至可以進一步擴充到多層次的多 群體多追蹤資料分析。由於本研究聚焦的是多群體的異質性,也就是不同群體間成長軌跡的 差異,至於受試者間成長軌跡的變異則不是本研究的研究重點。有關本研究的另一個重要性 在於研究方法的延伸,多變項重複觀測資料或多條成長軌跡是屬於受試者內設計(within subject design),而多群體則是受試者間設計(between subject design),如何結合這兩個設計如 同混合設計(mixed design)在縱貫資料上,是未來在實徵研究經常會遇見且必須要解決的課 題。換言之,重複觀測變項在受試者內的相關性是不能被忽略,特別是多個研究變項追蹤資 料間誤差項的獨立性假設常被違反。

貳、統計模式

為了簡化模式的介紹與估計的難度,本研究僅以線性成長模式來示範說明。在本節統計 模式的介紹中區分為三個部分,一個是多追蹤資料成長模式分析的設定,另一個是多群體分 析的設定,最後是兩者的結合,其相關原理介紹如下。

一、多追蹤資料成長模式設定

根據 MacCallum 等(1997)的設定,其多變項重複觀測資料的線性成長統計模式可以表 示成方程式(1)所示:

(

)

* k 0ik 1ik itk itk itk k

y

=

δ β

+

β

x

+

e

(1) 上式為多重複觀測資料的第一層線性模式,其中的

y

itk*為多變項重複觀測資料依變項, 而

δ

k為虛擬變項,當第

k

個依變項等於

k

*時,其

δ

k設為 1,否則為 0,用來捕捉第幾個多變

項數列。而方程式(1)等號右邊的括弧內為一線性成長模式:

β

0ik

+

β

1ik itk

x

+

e

itk,其中

x

itk為

時間變項,而

β

0ik為第 i 個受試者第

k

個追蹤資料的截距項或初始值,

β

1ik為其受試者的線性 成長趨勢或是斜率項,

e

itk則為其受試者在第

k

個變項第 t 點的誤差項。 而第二層則為個體層次,當沒有任何個體解釋變項時,在第

k

個重複觀測數據的截距項與 斜率項可以在多層次模式下表示成方程式(2)與(3): 0ik 0k

u

0ik

β

=

γ

+

(2)

(5)

溫福星 多群體多變項成長模式 55 1ik 1k

u

1ik

β

=

γ

+

(3) 方程式(2)與(3)即為一般多層次模式下隨機係數模型的設定,下標的

k

為第

k

條成長軌 跡,

γ

0k與

γ

1k為平均的總截距與總斜率,

u

0ik與

u

1ik分別為個體層次截距項與斜率項的誤差 項,用以表示第

i

個受試者與平均軌跡的差異。方程式(1)與(2)、(3)當然可以將兩層結構的重 複觀測層次與受試者層次擴展到三層結構的重複觀測、受試者與環境層次,亦可以將線性成 長模式擴充為二次成長曲線模式,必要時可以在方程式(1)加入隨時間變動(time-varying)的 解釋變項;而方程式(2)與(3)亦可以引進受試者層次的解釋變項進來,作為解釋成長軌跡變化 的影響因素。 除上述固定效果的設定外,其隨機效果的設定在方程式(1)的

e

itk一般都假設服從平均數為 0、變異數為

σ

k2的常態分配,亦即每一條成長軌跡的誤差項都是獨立同質的假設。而方程式(2) 與(3)的誤差項

u

0ik與

u

1ik亦假設服從為二元常態分配,其平均數都分別為 0、變異數分別為

τ

00 與

τ

11、共變數為

τ

01。這樣方程式(1)隨機效果的設定,在橫斷面的迴歸分析中是沒有問題, 但在重複觀測的追蹤資料卻常常不是如此。誤差項一般會發生各個觀測時點變異數非同質的 情況,以及觀測時點間的共變數不為 0 的非獨立現象,這樣的情況不僅發生在同一變項的追 蹤資料上,亦可能發生在不同數列變項間的交叉共變關係。因此,在本研究追蹤資料的多層 次模式中,會將第一層重複觀測層次的誤差項

e

itk設為非限制(unrestricted)結構,1換言之, 去估計各數列變項各個時點的殘差變異數與各時點間的殘差共變數,特別是不同變項間的同 期與跨期共變數。這樣的設定下產生兩個估計上的改變:(一)迴歸係數

γ

的估計相當於橫斷 面分析上的一般化最小平方法(generalized least squares)的估計,將誤差項

e

itk的變異數共變

數 考 慮 進 來 估 計 固 定 效 果 ;( 二) 方 程 式 (2) 與 (3) 第 二 層 誤 差 項 的 假 設 將 會 是 多 餘 的 (redundant),因為在第一層誤差項

e

itk的變異數共變數設為非限制時,是要估計所有觀測時 點的所有觀察變項誤差項的變異數共變數矩陣,也就是說,組間變異數

τ

的估計已被吸收到 itk

e

共變異數的設定中。因此,在本研究的分析策略中,是將方程式(2)與(3)的誤差項刪除設 為固定效果,將方程式(1)的誤差項變異數矩陣設為非限制模式。假設分析的重複觀測追蹤數 據有 K 個不同變項,而觀測時點則有 T 點,則第一層誤差項

e

itk的變異數共變數矩陣設定如方 程式(4)所示:

( )

itk KT KT

Var e

= Σ

× (4) 1 在單變量重複觀測數據的誤差項變異數共變數矩陣可以有精簡的模式選擇,但在多變量重複觀測數據現有 MLM 軟體只有非限制模式與對角線矩陣模式可以使用,其他的預設選項都是針對單變項重複觀測資料分析 而設計。

(6)

56 多群體多變項成長模式 溫福星 方程式(4)有個特徵,以兩條重複觀測數列為例,當觀測時點有四個時,則誤差項變異數 共變數矩陣的下三角矩陣共有三個區塊,以圖 1 誤差項間的相關係數來示範說明。圖 1 中對 角線部分的兩個下三角區塊矩陣是兩個重複觀測追蹤變項的各個時點誤差項的同期自我相關 係數與自我落後相關係數,分別以 0 1 ρ 與 0 2 ρ 來呈現。相關係數ρ的上標代表誤差項是否來自同 期,來自同期則為 0、不同期則以落後期數代替;下標代表的是第幾條數列變項,所以 2 1 ρ 代表 第一條數列變項落後兩期的自我相關係數,換言之,可能是 X2001 與 X2005 誤差項(以下皆 同)的相關、或是 X2003 與 X2007。除了對角線上同期的自我相關係數為 1 以外,其他落後 自我相關不管是否相同落後期可能都會不同。而剩下的最左下角區塊的 4×4 方陣,其相關係 數為兩個數列誤差項的交叉相關,同樣上標代表同期或是落後期數、下標代表是哪兩個時點 數列的誤差項。以 1 1,2 ρ 為例則是跨一期或落後一期的交叉相關係數,但誤差項可能來自 2001 的

X與 2003 的 Y、2003 的 X 與 2005 的 Y、2005 的 X 與 2007 的 Y,而 1 2,1 ρ 則為 2001 的 Y 與 2003 的 X、2003 的 Y 與 2005 的 X、2005 的 Y 與 2007 的 X 等狀況的誤差相關,且這些 1 1,2 ρ 與 1 2,1 ρ 未 必相同。理論上,落後期數愈多其誤差項自我相關或交叉相關會愈小。這樣兩個重複觀測變 項的同期與跨期交叉相關係數或共變數,是過去研究單一重複觀測變項、或是研究兩個重複 觀測變項但假設第一層誤差項為獨立時所沒有的部分,但這部分在同時估計多條追蹤資料的 成長模式時是不可或缺的地方。過去文獻都假設第一層觀測資料誤差項的變異數共變數矩陣 為獨立的對角線矩陣,顯然與實際情況不符,雖然現有 MLM 軟體可以提供各種誤差項結構, 例如 AR(1)與 TOEP 等精簡模式的估計(鄭天德,2011),但卻限制在一條成長軌跡的重複觀 測數據分析上,暫時無法應用到多條軌跡誤差項結構的使用。同時,Kwok、West 與 Green (2007)研究單一變項的重複觀測數據發現,忽略或誤設第一層誤差項結構將會導致迴歸係 數估計值標準誤的偏誤結果。

相關係數 X2001 X2003 X2005 X2007 Y2001 Y2003 Y2005 Y2007 X2001 0 1 ρ X2003 1 1 ρ 0 1 ρ X2005 2 1 ρ 1 1 ρ 0 1 ρ X2007 3 1 ρ 2 1 ρ 1 1 ρ 0 1 ρ Y2001 0 1,2 ρ 1 2,1 ρ ρ2,12 3 2,1 ρ ρ20 Y2003 1 1,2 ρ 0 1,2 ρ 1 2,1 ρ ρ2,12 1 2 ρ 0 2 ρ Y2005 2 1,2 ρ 1 1,2 ρ 0 1,2 ρ 1 2,1 ρ 2 2 ρ 1 2 ρ 0 2 ρ Y2007 3 1,2 ρ 2 1,2 ρ 1 1,2 ρ 0 1,2 ρ 3 2 ρ 2 2 ρ 1 2 ρ 0 2 ρ 圖1. 誤差項自我落後與變項同期跨期交叉相關示意。相同顏色代表相同落後期。

(7)

溫福星 多群體多變項成長模式 57

二、多樣本設定

本研究的多樣本設定以橫斷面迴歸分析策略來說明,在不失一般性下假設所分析的多群 體有兩個母體,例如是男、女不同性別的學生,其迴歸分析的依變項為

y

i,譬如為成就測驗, 解釋變項為

x

i,如父母社經地位。當理論層次上男、女學生的迴歸模式是不同時,也就是解 釋變項社經地位

x

i對成就測驗依變項

y

i的影響是不相等時(包含截距與斜率),我們可以分別 估計男、女學生依變項對解釋變項的迴歸模式,分別得到男、女學生樣本的截距項與斜率項。 如果要進一步比較男、女學生截距項或斜率項的差異時,必須採用獨立樣本的 t 檢定(Bollen & Curran, 2006)。當要比較的參數估計值愈多時,則要比較的 t 檢定也就愈多,則在型 I 錯誤率 的控制上就要相當小心。如果我們想要同時或一次估計這四個參數:男學生樣本的截距項與 斜率項、女學生樣本的截距項與斜率項時,可以採用的策略有兩個方式可以運用,依序介紹 如下:

(一)虛擬變項交互項法

其統計模式如方程式(5)所示:

(

)

0 1 2 3

=

+

+

+

×

+

i i i i i i

y

β

β

d

β

x

β

d

x

e

(5) 上式中的di為虛擬變項,當受試者屬於男學生時設為 1,否則為 0,換言之女學生為 0。 而di×xi為男學生虛擬變項與解釋變項

x

i的乘積項,

e

i為誤差項假設服從平均數為 0、變異數 為σ2的獨立同質常態分配。當樣本為女學生時,則 i d 為 0,其方程式(5)則簡化為方程式(6): 0 2

=

+

+

i i i

y

β

β

x

e

(6) 當樣本為男學生時,則

d

i為 1,則方程式(5)可以整理成方程式(7):

(

0 1

) (

2 3

)

=

+

+

+

+

i i i

y

β

β

β

β

x e

(7) 從方程式(6)與(7)中可以獲知,β0為女學生迴歸模式的截距項、β2為女學生迴歸模式的斜 率項,而β1為男學生迴歸模式中與女學生截距項的差異量,β3為男學生迴歸模式中與女學生 斜率項的差異量。虛擬變項交互項法可以同時估計這四個參數,做適當的轉換組合可以還原 男學生樣本的迴歸係數。不僅如此,同時也進行了男、女學生截距項與斜率項差異的檢定, 當β1顯著不為 0 時,代表男、女學生迴歸模式的截距項有顯著差異;同理,當β3顯著不為 0 時,則代表男、女學生的斜率項不恆等。這個方法可以同時估計兩個多群體樣本的截距項與

(8)

58 多群體多變項成長模式 溫福星 斜率項,並進行兩個群體迴歸係數估計值的顯著性差異考驗,不過其迴歸係數必須轉換方能 還原原先的意義。

(二)虛擬變項多樣本法

虛擬變項多樣本法的統計模式如方程式(8)所示:

(

)

(

)

1 0 2 0 3 1 4 1

=

+

×

+

+

×

+

i i i i i i i i

y

β

d

β

d

x

β

d

β

d

x

e

(8) 在方程式(8)中沒有截距項,解釋變項

x

i不變,新增兩個虛擬變項d0i與d 分別為女學生與1i 男學生樣本的設定值,當資料為女學生時則d0i設為 1、d 設為 0,若為男學生時則1i d0i設為 0、 1i d 設為 1。

(

d0i×xi

)

(

d1i×xi

)

分別為兩個虛擬變項d0i與d 和解釋變項1i

x

i的交乘項,當為女學 生樣本時d0i為 1,則

(

d0i×xi

)

x

i代表是女學生的解釋變項;當為男學生樣本時d 為 1,則1i

(

d1i×xi

)

x

i代表是男學生的解釋變項

x

i,則迴歸模式(8)可簡化為女學生的迴歸模式: 1 2

=

+

+

i i i

y

β

β

x e

(9) 與男學生的迴歸模式: 3 4

=

+

+

i i i

y

β

β

x e

(10) 換言之,方程式(8)的設定,β1與β2為女學生樣本的截距項與斜率項,而β3與β4為男學生樣本 的截距項與斜率項。方程式(8)亦可以表達成方程式(1)的設定,兩者最大的差異在於,方程式 (8)的誤差項只有一個,是假設男、女學生樣本的誤差項為同質(即男、女學生殘差變異數相 等)。 方程式(8)與方程式(5)所估計的結果與分別估計男、女學生迴歸線的估計值是一樣的,本 研究以 SPSS 軟體所附的 employee.sav 資料庫為例,示範這三種方法在男、女學生樣本有關教 育程度對現在薪資影響迴歸方程式的估計結果,其估計值如表 1 所示。 從表 1 中可以發現,分開估計方法與虛擬變項多樣本法的所有迴歸係數估計值皆一樣, 而虛擬變項交互項法的女學生樣本估計值也和這兩種方法一樣。當將男學生樣本參數估計值 (是一個差異量)加上女學生樣本的估計值後,其男學生樣本的迴歸係數也和其他兩種方法 相同,可以說這三種方法的估計結果是等價。但再觀察迴歸係數估計值的標準誤,只有虛擬 變項多樣本法與虛擬變項交互項法在女學生樣本是相同的,連估計殘差標準誤也是相同的 11,826.06,但在虛擬變項交互項法估計男學生樣本迴歸係數,所估計的是與女學生樣本的差異 量大小,連帶標準誤是差異量估計值的標準誤。所以,虛擬變項多樣本法的方程式(8)與虛擬

(9)

溫福星 多群體多變項成長模式 59 表 1 三種不同估計方法的結果比較 分開估計 虛擬變項交互項法 虛擬變項多樣本法 模式 參數 女 男 女 男 女 男 截距項 (標準誤) 4,437.38 (2,367.05) -19,541.16 (4,601.90) -4,437.38 -(4,376.64) -23,978.55 (5,697.64) 4,437.38 (4,376.64) -19,541.16 (3,648.02) 斜率項 (標準誤) 1,745.66 0-(188.12) 4,226.05 -0(312.34) 1,745.66 -(347.77) 2,480.39 -(426.91) 1,745.66 -(347.77) 4,226.05 -(247.60) 估計殘差 標準誤 -06,397.18 014,918.32 11,826.06 11,826.06 變項交互項法的方程式(5)可以視為相同的模式,只有在迴歸係數的參數化不同而已。而這兩 種方法的差異,在於虛擬變項交互項法可以直接檢定男、女學生樣本在截距項或斜率項估計 值是否有顯著差異,其差異反應在迴歸係數的差異量上,當差異量估計值達到顯著異於 0 時, 則就顯示這兩個樣本的估計值確實是不恆等的結果。至於虛擬變項多樣本法可以直接估計各 樣本的迴歸係數,而要檢定樣本間是否有差異則必須額外進行事後檢定,但其優勢在於多層 次架構下,可以直接拿這些迴歸係數作為結果變項,再進行多層次的分析,而虛擬變項交互 項法則不容易在多層次模式下解釋迴歸係數的意義,例如,高層解釋變項教師的自我效能解 釋了男、女學生斜率項差異量似乎不容易理解。

三、多群體多追蹤資料線性成長模式設定

本研究即結合了多樣本與多追蹤資料的設計,用來估計兩個群體在兩個變項追蹤資料的 線性成長模式,本研究的多樣本設定有兩個策略:虛擬變項交互項法與虛擬變項多樣本法, 由於這兩個方法是相同的模式,所以本研究在以下的示範分析中各示範一種。此外,考慮到 在第一層迴歸模式誤差項不同時間點的非同質與不同時間點間的非獨立現象,在誤差項的變 異數共變數矩陣設為非限制模式下,並且考慮到男、女學生樣本誤差項變異數共變數矩陣的 同質性與否,檢視這兩種方法在男、女學生同質與異質下的估計結果並加以比較。茲將本研 究所用以分析的模式呈現如下:

(一)男、女學生樣本誤差項變異數共變數矩陣同質模式(採用虛擬變項交互項法)

(

)

* 0 1 1 = = =k K

k ik + ik itk + itk itk k y δ β β x e (11) 0ik = 00k + 01k×gender dummy_ ik β γ γ (12) 1ik = 10k + 11k×gender dummy_ ik β γ γ (13)

(10)

60 多群體多變項成長模式 溫福星

( )

itk TK TK

Var e = Σ × (14)

方程式(11)為多變量迴歸模式,δ 為一虛擬變項,當資料來自第k k*個變項則為 1,否則為 0。x 為時間變項,而itk gender dummy_ ik為性別虛擬變項,本研究將女學生設為 0、男學生設 為 1。方程式(13)與(14)即類似為方程式(5)的設定,而方程式(14)為假設男、女學生為同質的條 件下誤差項變異數共變數矩陣的無限制結構。

(二)男、女學生樣本誤差項變異數共變數矩陣不同質模式(採用虛擬變項多樣本

法)

(

)

* * , 0 1 1, 1 k K l L kl kl kl itkl itkl itk l k l y = = δ β β x e = = =

+ + (15) 0kl= 0kl β γ (16) 1kl= 1kl β γ (17)

( )

itkl TKL TKL Var e = Σ × (18) 方程式(15)為多變項多樣本的線性成長模式設定,δkl為一虛擬變項,當資料來自第l 群* 體第k*個變項則為 1、否則為 0, itk x 為時間變項,β 為截距項、0kl β 為斜率項,而方程式(18)1kl 為整體誤差項變異數共變數矩陣的無限制結構,假設在男、女學生樣本、兩條時間數列各四 個觀測時點下,誤差項變異數共變數矩陣為一個 16×16 的矩陣,左上角的 8×8 矩陣是女學 生樣本在兩個重複觀測變項四個時點的變異數共變數矩陣,前 4×4 矩陣是第一個變項的四個 時點、後 4×4 矩陣是第二個變項的四個時點,剩下的是跨期交叉變項的共變數(如圖 1 所示); 而右下角的 8×8 矩陣是男學生樣本的誤差項變異數共變數矩陣,而右上角與左下角的 8×8 矩陣皆為 0 矩陣,代表受試者間設計的結果。

(三)第一層誤差項假設為獨立異質假設、第二層為隨機效果模式

為了和本研究所設定第一層次誤差項變異數的無限制結構相比較,本研究亦以一般文獻 上假設第一層誤差項為獨立但異質性假設、第二層迴歸係數方程式誤差項為隨機效果作為參 照模式,其統計模式設定如下:

(

)

* * , 0 1 1, 1 k K l L kl kl kl itkl itkl itk l k l y = = β β β x e = = =

+ + (19) 0kl= 0kl+u0kl β γ (20) 1kl= 1kl+u1kl β γ (21)

( )

kl Var u =T (22)

(11)

溫福星 多群體多變項成長模式 61

( )

(

2 2 2 2

)

11 12 itkl kt KT Var e =diag σ σ, ,,σ ,,σ (23)

參、實證分析

一、基本資料介紹

本研究據以分析的資料,取自於對全國進行抽樣調查 TEPS 中的公開版(張苙雲,2008), 採用的資料共進行四次(2001、2003、2005、2007 年)的調查。TEPS 資料庫中的「國中樣本」, 於 2001 年 9 月對當時的七年級學生進行第一波的資料蒐集,實際共完訪 333 所學校(1,244 個班級),到了 2003 年下半年再對已升上九年級的同一批學生進行第二次的資料蒐集,此階 段實際共完訪 333 所學校(1,938 個班級);第一波與第二波的國中樣本於 2004 年已進入高中、 高職或五專,第三波繼續追蹤約 4,000 名國中樣本學生,此批學生稱為追蹤樣本(Core Panel, CP)資料,亦即這批學生追蹤至高中/高職及五專的三年級,也就是在 2005 年與 2007 年分 別進行第三和第四波的資料蒐集。2001 年的第一波國中樣本資料原有 20,055 筆、到了 2003 年第二波國中樣本資料仍有 19,088 筆;但到了 2005 年,這一群國中追蹤樣本(CP)已經升上 高中,基於成本的考量下,TEPS 第三波樣本只有 4,000 多筆資料,而 TEPS 公開使用版僅釋 放資料的 70%,且每一波資料所釋放的樣本是採隨機的方式。 本研究採用 TEPS 公開版的四次(2001、2003、2005、2007 年)的調查資料,合併結果 共計有 13,978 位學生,採用以示範的多變項追蹤資料為「一般分析能力」與「數學分析能力」 (簡稱一般能力與數學能力),其能力的估計來自於 3 參數 IRT(item response theory)的估 計結果,該結果可以與各波各學程比較,而用以分群的多群體資料則以「性別」為示範變項, 再扣除資料庫中未填寫性別資訊後共計 13,959 位國中生樣本。由於資料來自對 13,959 位國中 生樣本的四次追蹤資料調查,可能因為受試學生其個人因素關係並未所有人都有這四次的調 查結果。其中,全資料庫中只有一次調查資料有 866 位,有兩次調查資料有 10,077 位,占分 析樣本資料的 72.2%,有三次調查資料有 205 位,四次調查皆完整的資料有 2,806 位,占分析 樣本的 20.1%。四次調查皆有的人數為 2,806 人,符合上述 TEPS 第三波樣本只有 4,000 多筆 資料,再加上 TEPS 公開使用版僅釋放資料的 70%,獲得的完整資料約 2,800 人。 由於整個資料庫有 13,959 人,但完整具有四波資料卻僅有 2,806 位,雖然 HLM 可以允許 追蹤資料含有遺失值,但全部資料與完整資料大小差異太過於懸殊,可能兩者的資料特徵所 欲代表的母體不盡相同。不管如何,本研究主要是進行方法論的探究,因此所選擇的樣本以 完整樣本為主,不過本研究仍對全部樣本進行一般描述性統計的介紹,而有關多群體多變項 資料的線性成長模式則以完整的 2,806 筆資料進行分析示範。茲將本研究的一般能力與數學能 力四波調查的平均數與變異數整理如表 2 所示,並且將具有完整四波資料的 2,806 位學生的結

(12)

62 多群體多變項成長模式 溫福星 表 2 四波調查的一般能力與數學能力敘述統計量摘要 全部樣本(N=13,959) 完整樣本(N=2,806) 樣本 變項波次 人數 平均數 變異數 平均數 變異數 一般能力1(2001年) 13,934 -0.02 1.01 0.37 0.91 一般能力2(2003年) 13,085 0.57 2.26 1.18 2.14 一般能力3(2005年) 2,972 2.22 1.91 2.24 1.85 一般能力4(2007年) 2,868 2.24 1.78 2.24 1.78 數學能力1(2001年) 13,934 -0.03 1.01 0.43 0.80 數學能力2(2003年) 13,085 0.59 1.70 1.21 1.39 數學能力3(2005年) 2,972 1.97 1.64 1.99 1.61 數學能力4(2007年) 2,868 1.82 2.72 1.83 2.71 果一併整理在旁一起比較。 從表 2 中可以發現,一般能力與數學能力在這四波的平均數上有遞增的現象,顯示出有 線性成長的趨勢。其中,數學能力的第四波平均數稍微低於第三波,同樣的現象也發生在完 整樣本的平均數上。至於在全部樣本的各期變異數方面,第一波一般能力的變異數最小為 1.01,然後在第二波達到最大為 2.26,然後依序下降到第四波的 1.78;而數學能力方面仍然在 第一波的變異數最小為 1.01,然後增加到第二波的 1.70,第三波則稍微下降到 1.64,但到了 第四波則又增加到 2.72。從上述的變異數資料顯示,兩個重複觀測資料的四波變異數有不同 質的現象,最大的變異數為最小變異數的二倍以上。而在完整樣本方面,一般能力在這四波 的變異數和全部樣本的變異數趨勢相似,但在數學能力方面卻是呈現遞增的現象,從第一波 最小的 0.80 一直增加到第四波的 2.71。綜觀全部與完整資料的結果發現,在第三波與第四波 的平均數與變異數,這兩個資料庫樣本有類似的結果,而最大的差異發生在第一波與第二波, 全部樣本的平均數都低於完整樣本的平均數,其數值都相當小。而在第三波與第四波平均數 與變異數之兩個樣本相當接近的原因,主要是樣本大都來自相同的受試者,樣本數從原先約 13,000人左右陡降到 2,800 人,造成前兩波數據極大的差異。 除從表 2 中可以發現受試者這兩個能力在這四波的變異數並非同質的現象外,表 3 呈現 的是這完整樣本兩個能力在這四波的自我落後相關與跨期交叉相關係數表,根據 2,806 位學生 樣本計算相關係數發現,一般能力的落後一期自我相關在 0.60 左右、落後兩期與三期的自我 相關在 0.54 與 0.57 之間。而在數學能力方面,落後一期的自我相關在 0.75 上下,落後兩期與 三期的自我相關在 0.62 與 0.70 之間,但都比一般能力的相關要高。在同期或跨期交叉相關方 面,其一般能力與數學能力相關係數則介於 0.54 與 0.83 之間,以上這些相關係數都達 .05 的

(13)

溫福星 多群體多變項成長模式 63 表 3 完整樣本四波調查的一般能力與數學能力相關係數 變項波次 一般1 一般2 一般3 一般4 數學1 數學2 數學3 數學4 一般能力1 1 一般能力2 .58 1 一般能力3 .56 .60 1 一般能力4 .54 .58 .64 1 數學能力1 .80 .64 .63 .59 1 數學能力2 .64 .83 .68 .66 .73 1 數學能力3 .60 .64 .81 .68 .68 .76 1 數學能力4 .54 .59 .63 .74 .62 .70 .73 1 顯著水準。從表 3 中可以發現,一般能力與數學能力這兩個變項的自我落後相關或跨期交叉 相關皆不低,稍微有依序遞減的趨勢,換言之,這兩個能力在這四波上存在有自我落後相關 與跨期交叉相關,若在一般成長模式的第二層只設隨機截距效果,此時誤差項結構是獨立的 假設可能被違反,而且存在不同變項成長模式誤差項可能存有交叉相關,這是過去文獻在處 理多條成長軌跡所沒有考慮到的地方。 表 4 呈現的是四波一般能力與數學能力共八個變項時點的男、女學生平均數與變異數統 計量,以及男、女學生獨立樣本平均數的差異檢定。從平均數的變化趨勢來看,女學生樣本 在一般能力與數學能力都是從第一波上升到第三波為最大,再稍微在第四波降下來。在男學 生樣本方面,一般能力變化趨勢是從第一波依序遞增到第四波,但第三波平均數稍微低於第 四波;至於數學能力方面,和女學生樣本一樣,在第三波的平均數達到最高,然後在第四波 再稍微下降,似乎隱含有二次曲線的可能,但為了示範目的簡化模型與解釋,在這裡仍以線 性成長模式配適樣本資料。而在變異數方面,女學生樣本在一般能力的四波變異數變化是在 第一波最小、第二波最大,然後再依序變小到第四波;但在男學生樣本的一般能力的四波變 異數,一樣是在第一波最小、第二波最大,然後掉到第三波再上升到第四波。至於數學能力 的四波變異數方面,不管是男學生還是女學生樣本都是從第一波依序上升到第四波為最大。 茲將男、女學生的一般能力與數學能力在這四波的時間趨勢變化,隨機抽取 5%樣本繪製 如圖 2 所示。圖 2 的四個時間序列圖顯示,在全部的四波變化趨勢上可以發現有依序遞增、 或是在第三波向下再往上、或是在第三波往上再往下的線圖趨勢,顯示存在個別差異的現象, 且變異數擴大的現象。為了配合本研究的目的簡化參數的估計,以及大部分的趨勢是遞增現 象,本研究在後續的追蹤資料成長模式分析皆採取線性成長模式來進行比較。 由於本研究在多樣本設定上採取兩種策略:男、女學生同質模式(成長軌跡的截距與斜 率相同)-虛擬變項交互項法與男、女學生異質(成長軌跡的截距與斜率不同)─虛擬變項

(14)

64 多群體多變項成長模式 溫福星 表 4 完整樣本男、女學生在一般能力與數學能力四波調查比較 女學生樣本(n=1,420) 男學生樣本(n=1,386) 樣本 變項波次 平均數 變異數 平均數 變異數 t 檢定 一般能力1 0.30 0.90 0.45 0.91 -4.06*** 一般能力2 1.09 2.00 1.29 2.27 -3.59*** 一般能力3 2.13 1.80 2.37 1.88 -4.68*** 一般能力4 2.10 1.61 2.39 1.91 -5.71*** 數學能力1 0.36 0.78 0.50 0.81 -4.22*** 數學能力2 1.13 1.33 1.29 1.43 -3.51*** 數學能力3 1.85 1.42 2.14 1.75 -6.19*** 數學能力4 1.71 2.47 1.95 2.93 -3.80*** ***p < .001. 多樣本法,在虛擬變項交互項法是不分男、女學生估計整體全部樣本誤差項的變異數共變數 矩陣(類似表 3 所示,假設男、女學生線性成長模式誤差項共變數矩陣相同);至於虛擬變項 多樣本法則是同時估計男學生與女學生樣本誤差項的變異數共變數矩陣(假設男、女學生線 性成長模式誤差項共變數矩陣不同),它是一個 16×16 的區集對角矩陣(block diagonal matrix),左上角的 8×8 子矩陣是女學生樣本誤差項的變異數共變數矩陣,右下角的 8×8 子 矩陣則是男學生樣本,而剩下的子矩陣則為 0 矩陣,表示男學生與女學生樣本的獨立性。因 此,在進行線性成長模式分析之前,根據所蒐集的完整資料進行男、女學生一般能力與數學 能力四波變異數共變數矩陣的同質性檢定,利用 Box’s M 共變數相等性檢定發現,在一般能 力四波、數學能力四波,以及一般能力與數學能力一起的 F 檢定值依序為 2.37、2.43 與 2.37, 皆達到 .01 顯著水準的差異,共變數矩陣檢定結果顯示男、女學生樣本在四波一般能力與數 學能力的變異共變數矩陣並不恆等,此結果提供後續線性成長誤差項變異數共變數矩陣的誤 差結構設定的參考依據。

二、完整樣本分析結果

本研究主要利用 HLM 軟體中的 HMLM 進行多樣本多追蹤資料的線性成長模式分析,該 模式可以考慮每個受試者資料並非平衡的設計(unbalanced design),也就是允許追蹤資料有遺 失值的情況,但本研究是採用完整四波的資料,因此該項優點並無法在本研究中呈現。除 HLM 軟體之外,同時並輔以 SPSS 與 SAS 軟體進行相同模式的估計,以確認本研究的分析模式沒 有問題,以下所有的分析結果在 HLM、SPSS 與 SAS 軟體的估計都獲得一樣的參數估計值(其 部分語法列於附錄一)。本研究共有三個分析模式,其中在第三個模式也就是方程式(19)至(23)

(15)

溫福星 多群體多變項成長模式 65 (a)女學生一般能力 (b)女學生數學能力 (c)男學生一般能力 (d)男學生數學能力 圖2. 完整樣本男、女各能力之四波時間趨勢。隨機抽取5%樣本。 的設定:第一層誤差項為獨立、第二層誤差項設為隨機效果在這三個軟體都得到無法收斂的 結果。因此,本研究的參照比較模式改採各樣本各追蹤資料的單獨估計,同樣第一層誤差項 設定為無限制結構以茲比較。至於三個軟體都無法收斂的估計結果,本研究於最後一併討論。 因此,根據本研究的統計模式設定介紹,本研究的單樣本單變量模式、虛擬變項交互項模式 與虛擬變項多樣本模式的 HLM 軟體所估計的截距與斜率結果以及標準誤如表 5 所示。 在數學能力的線性成長模式估計方面,誤差項結構異質性與同質性模式在男、女學生截 距項方面有稍微較大的差異,但在男、女學生斜率項的估計值上,兩種模式卻相當接近,其 男、女學生的兩個能力斜率估計值分別是 0.603 與 0.545、0.601 與 0.547。不過,和單樣本單 時間點 時間點 時間點 時間點 一般能力 數學能力 數學能力 2 3 4 2 3 4 1 2 3 4 5.96 3.84 1.72 -0.40 6.12 3.79 1.45 -0.88 -3.22 1 1 2 3 4 -2.53 -2.62 -0.43 6.14 3.95 1.76 5.96 3.85 1.73 -0.38 -2.49 一般能力 1

(16)

66 多群體多變項成長模式 溫福星 表 5 完整樣本三種模式線性成長模式 HMLM 估計結果 一般能力 數學能力 模式 (括弧內為標準誤) 樣本 截距 斜率 截距 斜率 男學生 .468 ( .026) .697 ( .010) .580 ( .024) .621 ( .011) 單樣本單變項模式a 女學生 .312 ( .025) .639 ( .009) .471 ( .023) .573 ( .010) 男學生 .156 d ( .036) .049e ( .014) .148f ( .032) .054g ( .014) 虛擬交互項模式 (誤差結構同質)b 女學生 .352 ( .025) .646 ( .010) .417 ( .023) .547 ( .010) 男學生 .505 h ( .026) .700i ( .010) .552j ( .023) .603k ( .011) 虛擬多樣本模式 (誤差結構異質)c 女學生 .352 ( .025) .642 ( .009) .428 ( .023) .545 ( .009) a男、女學生的一般能力與數學能力各自單獨估計;b男、女學生的一般能力與數學能力一次估計; c男、女學生的一般能力與數學能力一次估計;d相當於男學生截距為 0.508,p 值小於 .001;e相當 於男學生斜率為 0.695,p 值小於 .001;f相當於男學生截距為 0.565,p 值小於 .001;g相當於男學 生斜率為 0.601,p 值小於 .001;h男、女學生一般能力截距差異檢定,卡方值為 18.306 達 .001 顯 著;i男、女學生一般能力斜率差異檢定,卡方值為 17.288 達 .001 顯著;j男、女學生數學能力截 距差異檢定,卡方值為 14.782 達 .001 顯著;k男、女學生數學能力斜率差異檢定,卡方值為 16.525 達 .001 顯著。 變項模式相比較,這兩個模式的男、女學生截距與斜率估計值都要小很多。至於男、女學生 迴歸係數的差異,其估計結果和一般能力的結果一樣,不管是虛擬變項交互項模式或是虛擬 變項多樣本模式都是達到 .001 的顯著水準。換言之,在數學能力與一般能力的線性成長軌跡 上,男、女學生在截距項與斜率項係數都是不一樣。 表 6 與表 7 分別為誤差結構的變異數共變數同質性模式與異質性模式的估計結果,在同 質性模式的殘差變異數方面,一般能力是在第二波最大,然後依序降到第四波,而數學能力 則是從第一波逐漸上升到第四波最大。在異質性模式方面,男學生樣本的一般能力的殘差變 異數是和同質性模式的一般能力有相同的變化趨勢,但在女學生樣本則是在第三波到最大, 稍微比第二波的殘差變異數大 0.04。而在數學能力方面,男、女學生的殘差變異數都是依序 隨時間經過而上升,在第四波為最大,且男學生的數據又高於女學生。此結果顯示,單獨以 成長模式配適一般能力與數學能力的方程式,仍然有部分分數的變異無法由時間的線性趨勢 來解釋,可能必須將隨時間變動的(time-varying)解釋變項考慮到線性成長模式中。

(17)

溫福星 多群體多變項成長模式 67 表 6 完整樣本同質性模式所估計的誤差項變異數共變數矩陣 變異共變數 一般1 一般2 一般3 一般4 數學1 數學2 數學3 數學4 一般能力1 0.91 一般能力2 0.80 2.14 一般能力3 0.70 1.22 2.06 一般能力4 0.69 1.09 1.05 1.79 數學能力1 0.69 0.82 0.73 0.70 0.80 數學能力2 0.70 1.43 1.15 0.99 0.76 1.40 數學能力3 0.70 1.19 1.54 1.05 0.74 1.18 1.71 數學能力4 0.87 1.37 1.21 1.68 0.93 1.28 1.37 2.84 表 7 完整樣本異質性模式所估計的誤差項變異數共變數矩陣 (a)男學生樣本 變異共變數 一般1 一般2 一般3 一般4 數學1 數學2 數學3 數學4 一般能力1 0.91 一般能力2 0.83 2.27 一般能力3 0.69 1.27 2.09 一般能力4 0.70 1.19 1.10 1.95 數學能力1 0.69 0.87 0.75 0.72 0.82 數學能力2 0.70 1.51 1.17 1.06 0.77 1.45 數學能力3 0.71 1.30 1.65 1.15 0.77 1.26 1.90 數學能力4 0.88 1.46 1.26 1.86 0.94 1.36 1.48 3.10 (b)女學生樣本 變異共變數 一般1 一般2 一般3 一般4 數學1 數學2 數學3 數學4 一般能力1 0.91 一般能力2 0.77 2.00 一般能力3 0.70 1.18 2.04 一般能力4 0.67 1.00 1.01 1.64 數學能力1 0.68 0.78 0.70 0.68 0.79 數學能力2 0.71 1.36 1.13 0.93 0.74 1.36 數學能力3 0.69 1.09 1.44 0.96 0.71 1.10 1.53 數學能力4 0.85 1.29 1.16 1.50 0.92 1.21 1.27 2.59

(18)

68 多群體多變項成長模式 溫福星 在落後期自我相關方面,表 6 與表 7 的共變數轉換成相關係數後發現,在同質性的模式 中,一般能力的落後自我相關係數介於 0.51 與 0.58 之間,共變數都達 .01 的顯著水準;在數 學能力的落後自我相關係數則介於 0.62 與 0.76 之間,同樣共變數都達到顯著異於 0 的結果。 在一般能力與數學能力殘差項跨期交叉相關方面,以第二波同期的交叉相關最高為 0.83,最 小為第四波的數學能力與第三波的一般能力的跨期交叉相關為 0.50。至於在異質性模式中, 男學生樣本一般能力殘差項的落後自我相關係數介於 0.51 與 0.58 之間、在數學能力的落後自 我相關係數介於 0.64 與 0.76 之間,在一般能力與數學能力殘差項跨期交叉相關方面,以第二 波同期的交叉相關最高為 0.83,最小為第四波的數學能力與第三波的一般能力的跨期交叉相 關 0.51;女學生樣本一般能力殘差項的落後自我相關係數介於 0.50 與 0.58 之間、在數學能力 的落後自我相關係數介於 0.59 與 0.76 之間,在一般能力與數學能力殘差項跨期交叉相關方 面,以第二波同期的交叉相關最高為 0.83,最小為第四波的數學能力與第三波的一般能力的 跨期交叉相關 0.49。過去文獻上頂多處理同一變項的殘差自我落後相關,至於在不同變項殘 差的跨期交叉相關則被忽略。

三、後續分析

由於本研究有 2,806 位國中生擁有完整一般能力與數學能力各四波資料,本研究在上述多 群體多變項線性成長模式分析,只示範說明如何進行男、女學生兩個成長軌跡的估計,分別 採用虛擬變項交互作用法與虛擬變項多樣本法來估計,至於這兩種方法的優劣將於結果與討 論進行說明比較。同時,只針對隨機效果方面只設定第一層誤差結構為無限制模式,用以捕 捉各變項落後自我相關與變項間同期和跨期交叉相關,而忽略第二層截距項與斜率項隨機效 果的探討。除此之外,亦分別設定男、女學生樣本誤差結構是同質與異質性下的估計結果, 估計結果顯示,無法忽略變項誤差項自我落後相關與誤差項間的同期與跨期交叉相關。 由於無限制的誤差項結構在實務上很少被應用,因為其估計的參數最多,可能導致模式 的適配度最好,但卻不是最精簡模式。在權衡模式精簡與顯著性考驗的可解釋下,本研究在 本節額外進行其他競爭模式的估計與比較。值得注意的是,現今多層次分析軟體不管是 SPSS、 SAS 或 HLM 軟體,只對單變項追蹤資料的誤差項結構提供多種精簡模式的可能選項,如 AR(1)、ARMA(1, 1)或 TOEP 等,但這些可能選項都不適合在多變項追蹤資料上使用,因為軟 體會將兩條不同數列視為一條來估計,使得估計的結果是一個變項的自我落後相關結構。因 此,本研究所用以示範的競爭模式隨機效果設定是:(一)將第一層誤差項變異結構設為對角 線結構但為異質性,此結構不允許重複觀測變項的殘差項間有相關,即為殘差項為獨立的假 設;(二)第二層成長軌跡誤差項設為無限制模式,即男、女學生截距與斜率誤差項間皆可以 有相關;(三)第二層成長軌跡誤差項設為對角線模式,即男、女學生截距與斜率誤差項間是 獨立;(四)第二層成長軌跡誤差項只設隨機截距模式,只允許男、女學生的截距誤差項間可

(19)

溫福星 多群體多變項成長模式 69 以有相關。而在固定效果方面,也就男、女學生的成長軌跡可以視為同質與異質兩種可能, 也就是男、女學生的截距項與斜率項是相等與不等的意思。 將上述固定效果與隨機效果的設定,虛擬變項多樣本法進行估計,所使用的 SAS、SPSS 與 HLM 軟體估計的結果皆一致,其模式與參數個數,以及適配度指標如表 8 所示,其中適配 度指標有離異數(-2LL)、BIC 與 CAIC 三種,其值愈小代表模式與資料愈適配。這九個模式 中的 L1 男、女學生誤差項同質與異質模型是指,第一層誤差項各時點間變異數共變數矩陣是 否同質?無限制是指估計所有的誤差項變異數與共變數參數;而對角線是指只估計誤差項的 變異數不估計共變數,而男、女學生恆等否是指成長軌跡的迴歸係數是否相同。結果顯示, 在離異數方面是第一個模型男、女學生誤差項異質無限制模式要比第二個好,但考慮到巢套 模型的卡方差異檢定,發現其卡方值為 92 在自由度為 100 下顯著性為 .71,顯示第二個模型 沒有比第一個模型差,再加上資訊標準(information criterion)指標的 BIC 與 CAIC,都是第 二個模型優於第一個模型,換言之,同質性的誤差項變異數共變數矩陣較異質性模型佳,亦 即男、女學生誤差項的變異數共變數矩陣可以視為一樣。再考慮到男、女學生在兩個追蹤資 料成長軌跡的恆等性時,發現模型二的離異數差異的卡方檢定顯著優於模型三(卡方值為 41、 自由度為 4,達 .001 顯著水準),雖然 BIC 適配指標兩者相同、CAIC 指標模型二稍稍高於模 型三,但配合表 5 迴歸係數差異的顯著性比較,可以獲得男、女學生在一般能力與數學能力 的線性成長軌跡是顯著不同的結論。至於其他模式的估計結果,不管是離異數或是簡效指標 都沒有比模型二要好,亦即男、女學生在兩條數列一般能力與數學能力的成長軌跡是不同的, 在這兩個能力上都是男學生的初始值(截距項)與成長變化(斜率項)都高於女學生的表現。 除此之外,表 8 尚可觀察到模型五、七與九,在 L2 誤差項無限制(包含男、女學生截距 與斜率共四個誤差項)或是 L2 隨機截距誤差項(包含男、女學生截距共二個誤差項),即使 在第一層誤差項結構為非無限制模式且全部改為異質變異數的對角線矩陣模式,但都獲得無 法收斂的結果。雖然第一層誤差項結構為獨立的假設不符合實際狀況,但在無多餘參數下的 條件仍無法估計第二層隨機效果,這個問題可能來自資料本身的結構特性,將在最後一節加 以討論。

肆、結果與討論

一般在單一重複觀測追蹤資料的分析,大都採取個體層次誤差項為獨立同質(或異質) 的分配(即殘差變異數在各時點是相同或不同,但各時點間的共變數為 0),但在第二層迴歸 係數設為隨機效果,估計各成長軌跡誤差項之間的變異數與共變數,這是典型 HLM 成長模式 分析的作法。但這樣的分析策略忽略了個體層次誤差項在各時點之間的自我相關,這是重複 觀測追蹤資料最常出現的現象與問題,忽略了這個關係在估計成長軌跡的迴歸係數會獲得偏

(20)

70 多群體多變項成長模式 溫福星 表 8 完整樣本不同誤差項變異數模式設定估計比較 模式 參數個數 -2LL BIC CAIC (1)L1男、女學生誤差項異質無限制、男、女學生軌跡不 恆等 144 55,317 56,760 56,904 (2)L1男、女學生誤差項同質無限制、男、女學生軌跡不 恆等 44 55,409 55,850 55,894 (3)L1男、女學生誤差項同質無限制、男、女學生軌跡恆 等 40 55,450 55,850 55,890 (4)L1男、女學生誤差項同質對角線、男、女學生軌跡不 恆等 16 73,973 74,133 74,149 (5)L1男、女學生誤差項同質對角線、L2誤差項無限制、 男、女學生軌跡不恆等 52 不收斂 - - (6)L1男、女學生誤差項同質對角線、L2誤差項對角線、 男、女學生軌跡不恆等 24 64,045 64,285 64,309 (7)L1男、女學生誤差項同質對角線、L2誤差項無限制、 男、女學生軌跡恆等 22 不收斂 - - (8)L1男、女學生誤差項同質對角線、L2誤差項對角線、 男、女學生軌跡恆等 16 64,152 64,312 64,328 (9)L1男、女學生誤差項同質對角線、L2隨機截距誤差項、 男、女學生軌跡恆等 15 不收斂 - - 註:-2LL 為離異數(deviance)、BIC 為 Bayesian Information Criterion、CAIC 為 Consistent Akaike Information Criterion縮寫,分別為-2LL+log(樣本數)×參數個數、-2LL+〔1+log(樣本數)〕 ×參數個數。 誤的結果(Kwok et al., 2007)。本研究考慮到這個重要的問題,將第一層誤差項間的共變結構 關係考慮進來,並將單一追蹤資料擴展到兩條成長軌跡迴歸係數的估計,不僅是誤差項落後 自我相關連帶不同變項誤差項跨期交叉相關也一併估計。此外,當有足夠的理論或是實徵數 據顯示存在多群體的差異時,不只將這分類變項以虛擬變項當主效果處理外,必須更進一步 進行多群體的多追蹤資料成長模式分析,方能延展到更高一層組織變項的多層次分析。 本研究以 TEPS 資料庫的四波一般能力與數學能力作為兩條成長軌跡的重複觀測追蹤資 料,並依性別為多群體的分類,進行多群體多追蹤資料的線性成長模式估計。分析結果主要 發現: 一、考慮 2,806 位有完整四波的一般能力與數學能力受試者的資料分析發現,男、女學生 樣本在線性成長模式第一層次測量模式誤差項共變異數矩陣其同質性模式經卡方差異檢定沒 有比異質性模式差,且簡效性指標顯示同質性模式要比異質性模式好。但男、女學生樣本在

(21)

溫福星 多群體多變項成長模式 71 圖3. 男、女學生在一般能力與數學能力成長軌跡估計結果 一般能力與數學能力的線性成長軌跡上經卡方檢定發現是不具恆等性,換言之,男、女學生 在一般能力與數學能力的線性成長軌跡截距與斜率是顯著不同,呈現男學生在這兩個能力上 的第一波初始值與線性成長變化率都比女學生要高,茲將估計結果繪製如圖 3 所示。 二、由於 TEPS 資料庫設計上的特性,雖然本研究取得公開版 2001 年至 2007 年分別間隔 2年的四波資料,以 0、1、2 與 3 的時間編碼進行線性成長模式分析,但實際的資料蒐集流程 卻是 2005 年至 2007 年是相隔兩個學期,不若 2001、2003 至 2005 年皆分別相隔三個學期。 將此一不等的間距考慮到時間變項來,所得到的估計結果仍然相似差異不大,對整體結論未 產生任何影響。 三、本研究主要研究目的在於示範如何進行多群體多變項線性成長模式的估計,從統計 模式的介紹一直到完整樣本分析結果中,可以發現本研究的示範脈絡,為了更清楚表達所示 範的分析步驟,附錄二列示本研究的分析流程步驟供有興趣的讀者參考。 結合上述結果,本研究亦將分析過程的發現與方法論的觀點整理成下面幾項討論與建議: 一、雖然統計檢定發現,男、女學生在這兩個能力的截距與斜率顯著不同,達到統計上 的顯著差異,但細觀表 5 的估計值與圖 3 的截距斜率變化發現,兩個樣本的成長軌跡似乎沒 有多大差異,再配合適配度指標 BIC 與 CAIC 的結果可以懷疑其結果的實務顯著性似乎意義 不大。雖然目前缺乏有關成長模式的效果量可以作為實務顯著性的參考依據,不過從樣本的 大小 2,806 位學生可以發現,估計值差異的顯著性可能來自大樣本所造成的標準誤過小的結 果,因此,未來在進行類似本文的實徵研究估計與檢定時,除了理論層次的探討外,也必須 考慮到實務顯著性的意義。雖然如此,本研究除了提出另外一種成長模式估計方法的示範, 1 波次 3.00 2.50 2.00 1.50 1.00 0.50 0.00 分數 男學生一般能力 女學生一般能力 男學生數學能力 女學生數學能力 3 4 2

(22)

72 多群體多變項成長模式 溫福星 雖然在示範的資料結果發生了統計顯著性與實務顯著性之間的差異,但也提供了在實徵研究 上可能預見的問題,特別是來自大型資料庫的研究。 二、針對完整樣本資料部分模式不收斂的原因,除了在第一層誤差項結構設為無限制模 式及第二層誤差項為隨機效果模式時,因為參數多餘所導致無法估計外,在表 8 第一層誤差 項結構簡化為獨立模式有較少的參數,但仍然無法估計第二層誤差項的變異數共變數結構。 研究者估計的可能原因,是男、女學生樣本所估計的線性成長模式的隨機截距項與隨機斜率 項或許存在多元共線性的問題所造成,研究者亦用 SEM 估計同樣發現非正定結果,若將第二 層誤差項隨機效果簡化為獨立情況的誤差變異數卻可以估計的出來。雖然本研究認為如此, 但仍不能排除有其他的可能因素,例如,模式可能太過於複雜也是個原因,要估計許多隨機 效果而使得模式無法收斂。 三、本研究一開始進行男、女學生完整樣本的 Box’s M 同質性檢定,發現男、女學生樣本 的一般能力與數學能力四個時點的變異數共變數矩陣有顯著差異,雖然在後續的表 6、7 與表 8模式一與二的同質檢定結果有所差異,基本上這兩個檢定是不同的比較基礎。一開始的 Box’s M同質性檢定是針對原始數據的變異數共變數矩陣,而表 8 是針對殘差項變異數與共變數矩 陣的巢套差異做比較。雖然如此,在還沒進行任何模式估計之前,Box’s M 同質性檢定雖然被 認為過於敏感容易顯著,但多少可以提供正式分析時的參考資訊,幫助後續分析的有利進行。 四、本研究所使用的虛擬變項交互項法雖然可以用來進行多群體的估計,但是其主要的 優勢在於調節效果的檢定,一般二元調節變項以虛擬變項方式和與主研究變項相乘積項可以 當主效果放入迴歸模式中一起估計,其迴歸係數的顯著性考驗即可以用來檢定不同群體或調 節效果的存在,因為它是透過差異量的方式來表示。至於虛擬變項多樣本法則無法直接進行 多群體的差異比較,但是可以擴展到更高的層次引進脈絡變項對各群體各成長軌跡迴歸係數 的解釋與影響,其解釋要比差異量的迴歸模式更直接,更可以做跨變項的影響因素探討。換 言之,這兩種策略模式各有其優點與劣勢,研究者可以針對其優勢選擇適合的模式配合研究 目的進行分析。在多層次的脈絡下,若要將分析層次往更高的總體層次分析時,則本研究所 示範的虛擬變項多樣本法可以延伸到更高階,特別是當有兩個群體以上的成長軌跡要估計 時,虛擬變項交互項法就較難擴充,且迴歸係數的解釋更加複雜與不易。 五、Raudenbush(2002)認為,當只有一條追蹤數列,假設共有 T 個時點,則在第一層 誤差項假設為無限制結構時,其誤差項變異數共變數矩陣和第一層誤差項設為獨立但不同質 的變異數、再加上第二層冪次方為 T-2 的隨機係數模型有相同的總合誤差項變異數共變數矩 陣。但第二層冪次方 T-2 的隨機係數模型未必存在或是具有實質意義,而誤差項無限制結構因 要估計的參數過多,在實務分析上應用價值可能較小。此外,Verbeke 與 Molenberghs(2010) 也說明當第二層參數設定隨機效果時,此時會使得第一層誤差項不容易估計其共變數矩陣。 此外,在多條追蹤數列的成長模式分析,一般 HLM 軟體(包含 SAS 與 SPSS 的 mixed 模組)

(23)

溫福星 多群體多變項成長模式 73

分析追蹤資料所用的第一層誤差項共變結構如 TOEP、CS、log linear、AR(1)和 ARMA(1, 1) 等模式都無法使用,因為這些軟體的設計是預設在單一的重複觀測變項上。因此,牽涉到兩 條以上不同時間數列資料的同時估計時,現有的多層次軟體無法處理單變項時的精簡模式: 變項自我落後相關,以及多變項間同期或跨期交叉相關的估計。雖然第一層誤差項結構設為 獨立時可以順利估計,但其獨立性假設與實際實徵資料的現象明顯不符。或許第一層誤差項 結構設為無限制模式時估計參數過多,但權衡得失之下,本研究的模式亦不失為現有分析追 蹤資料一個好的方法,不僅可以同時估計不同群體的成長軌跡外,亦可以同時估計第一層誤 差項結構不同群體的異質性。

誌謝

研究者由衷感謝 4 位匿名審查委員的指正與建議,並感謝資助 TEPS 計畫單位中央研究 院、教育部、國家教育研究院與行政院國家科會委員會。

(24)

74 多群體多變項成長模式 溫福星

參考文獻

一、中文文獻

李敦義(2011)。綜合高中分流政策對學生學習成就的影響:以 TEPS 資料分析為例。教育科 學研究期刊,56(2),107-135。

【Lee, D.-Y. (2011). Effects of comprehensive high school policy on students’ achievement: Evidence from Taiwan Education Panel Survey. Journal of Research in Education Sciences, 56(2), 107-135.】

張苙雲(2008)。台灣教育長期追蹤資料庫研究:第一波(2001)、第二波(2003)、第三波 (2005)、第四波(2007)學生資料【公共使用版電子檔】。臺北市:中央研究院調查研 究專題中心。

【Chang, L.-Y. (2008). Taiwan Education Panel Survey: Base year (2001), the second wave (2003), the third wave (2005), the fourth wave (2007) student data [public release computer file]. Taipei, Taiwan: Center for Survey Research, Academia Sinica.】

溫福星(2010)。多條成長軌跡與非完整資料之研究:SEM 與 MLM 的比較。教育與心理研 究,33(4),1-21。

【Wen, F.-H. (2010). The study of multiple growth trajectories and unbalanced data: A comparison of SEM and MLM. Journal of Education and Psychology, 33(4), 1-21.】

趙珮晴、余民寧、張芳全(2011)。探討臺灣學生的自律學習:TEPS 資料的縱貫性分析。教 育科學研究期刊,56(3),151-179。

【Chao, P.-C., Yu, M.-N., & Chang, F.-C. (2011). Self-regulation learning among Taiwanese students: A longitudinal analysis of the TEPS database. Journal of Research in Education Sciences, 56(3), 151-179.】

鄭天德(2011)。成長模型第一層誤差共變異結構之鑑定準則(未出版博士論文)。國立交通 大學,臺北市。

【Jane, T.-D. (2011). Identifying error covariance structures of latent growth models by using the SEM approach (Unpublished doctoral dissertation). National Chiao Tung University, Taipei, Taiwan.】

二、外文文獻

Bollen, K. A., & Curran, P. J. (2006). Latent curve models: A structural equation perspective. Hoboken, NJ: John Wiley & Sons.

Duncan, T. E., Duncan, S. C., & Strycker, L. A. (2006). An introduction to latent variable growth curve modeling: Concepts, issues, and applications (2nd ed.). Mahwah, NJ: Lawrence Erlbaum Assoicates.

Hedeker, D., & Mermelstein, R. J. (2007). Mixed-effects regression models with heterogeneous variance: Analyzing ecological momentary assessment (EMA) data of smoking. In T. D. Little, J. A. Bovaird, & N. A. Card (Eds.), Modeling contextual effects in longitudinal studies (pp. 183-206). Mahwah, NJ: Lawrence Erlbaum Associates.

(25)

溫福星 多群體多變項成長模式 75

Kwok, O. M., West, S. C., & Green, S. B. (2007). The impact of misspecifying the within-subject covariance structure in multiwave longitudinal multilevel models: A Monte Carlo Study. Multivariate Behavioral Research, 42(4), 557-592.

MacCallum, R. C., Kim, C., Malarkey, W., & Kiecolt-Glaser, J. (1997). Studying multivariate change using multilevel models and latent curve models. Multivariate Behavioral Research, 32(3), 215-253.

Raudenbush, S. W. (2002). Alternative covariance structures for polynomial models of individual growth and change. In D. S. Moskowitz & S. L. Hershberger (Eds.), Modeling intraindividual variability with repeated measures data (pp. 25-58). Mahwah, NJ: Lawrence Erlbaum Associates. Verbeke, G., & Molenberghs, G. (2010). Linear mixed models for longitudinal data. New York, NY:

Springer-Verlag.

Wallace, D., & Green, S. B. (2002). Analysis of repeated measures designs with linear mixed models. In D. S. Moskowitz & S. L. Hershberger (Eds.), Modeling intraindividual variability with repeated measures data (pp. 103-134). Mahwah, NJ: Lawrence Erlbaum Associates.

(26)

76 多群體多變項成長模式 溫福星

附錄一 軟體語法

一、 HLM 軟體語法-男、女學生誤差項同質、軌跡不恆等虛擬變項交互項法:

#WHLM CMD FILE FOR multi-group multivariate linear growth model numit:100 stopval:0.0000010000 level1:Y=Y1+Y2+T1+T2+RANDOM level2:Y1=INTRCPT2+SEX_MEAN+random level2:Y2=INTRCPT2+SEX_MEAN+random level2:T1=INTRCPT2+SEX_MEAN+random level2:T2=INTRCPT2+SEX_MEAN+random fixtau:3 accel:5 hypoth:n graphgammas:D:\2010\MGtime\grapheq.geq r_e_model:hetl1var lvr:n title:no title output:D:\2010wen\MGtime\hmlm.txt fulloutput:n 二、 SPSS 語法-男、女學生誤差項同質、軌跡不恆等虛擬變項多樣本法:

MIXED Y WITH g0y1 g0y2 g0t1 g0t2 g1y1 g1y2 g1t1 g1t2

/FIXED=g0y1 g0y2 g0t1 g0t2 g1y1 g1y2 g1t1 g1t2 | NOINT SSTYPE(3) /METHOD=ML

/PRINT=SOLUTION TESTCOV

/REPEATED=index1 | SUBJECT(id) COVTYPE(un).

三、SAS 語法-男、女學生誤差項異質、軌跡恆等虛擬變項多樣本法:

proc mixed data = a method=ml covtest; class id index1;

model y = y1 y2 t1 t2 /noint s;

(27)

溫福星 多群體多變項成長模式 77

附錄二 多群體多變項線性成長模式估計步驟

本附錄二以 HLM 軟體的估計為例,說明男、女學生樣本兩條線性成長軌跡異質、L1 誤 差項變異數共變數無限制矩陣異質的估計步驟流程: 1. 先檢視完整樣本各研究變項各期的平均數與變異數變化趨勢,如表 2。 2. 再檢視各研究變項自我落後相關與不同變項同期與跨期相關係數變化,如表 3。 3. 然後檢視各群體各研究變項的平均數與變異數並進行平均數差異比較,如表 4。 4. 透過統計軟體繪製各群體各研究變項的成長軌跡,如圖 2。 5. 利用 SPSS 軟體設計 HLM 軟體的 HMLM 模組所需男、女各兩條成長軌跡四個四波資料, 共 16 點的虛擬變項指標編碼。(參考 HLM 使用手冊) 6. 設計男學生與女學生各研究變項各條成長軌跡的截距項與斜率項編碼,如方程式(15),分 別為男學生一般能力截距項與時間變項、男學生數學能力截距項與時間變項、女學生一般 能力截距項與時間變項、女學生數學能力截距項與時間變項共八個解釋變項編碼,類似方 程式(8)。 7. 讀入 HLM 軟體的 HMLM1 模組。 8. 程式設定參考 HLM 使用手冊,將八個解釋變項納入迴歸模式中,如方程式(15),將 L2 的 參數設為固定效果如方程式(16)與(17)。 9. 選擇結果變項(outcome)的選項,點選無限制(unrestricted)模式,如方程式(18)。 10. 點選 Other Setting 的 Hypothesis Testing 進行參數的對比檢定,如表 5 的虛擬多樣本模式檢

定。

11. 進行估計,獲得表 5 的虛擬多樣本模式的參數估計與附註 h 至 k 的檢定結果,以及表 6 與 表 7 的共變數或相關係數矩陣數據。

12. 估計結果可獲得表 8 模式(1)的-2LL 值,而 HLM 不提供 BIC 與 CAIC 值,此為 SAS 執行 結果。

(28)

78 多群體多變項成長模式 溫福星

Journal of Research in Education Sciences 2012, 57(1), 51-78

Data Analysis of Repeated Measures:

Estimating a Multi-Group Multivariate Linear

Growth Model

Fur-Hsing Wen

Department of International Business, Soochow University

Abstract

This paper demonstrates the data analysis of the repeated measures from the Taiwan Education Panel Survey (TEPS). Based on the four data waves on the TEPS, we consider two abilities (general and mathematic) and two population groups (male and female students) to construct a multi-group multivariate linear growth model. Because the two-group multivariate repeated measures belong to the different populations and the different research variables, the residual terms of linear growth models may imply heterogeneity of the error covariance structure. We treat the error covariance structure as an unrestricted structure to compare the various types of models. The results from the HLM on the complete data (2,806 students) reveal that the male and female students in this study have the same error covariance structure but have distinct linear growth trajectories. In addition, comparisons of the competitive models and related suggestions are discussed in the results and conclusion sections.

Keywords: multi-group analysis, longitudinal data, nested, hierarchical linear modeling, linear growth model

參考文獻

相關文件

Estimated resident population by age and sex in statistical local areas, New South Wales, June 1990 (No. Canberra, Australian Capital

First Taiwan Geometry Symposium, NCTS South () The Isoperimetric Problem in the Heisenberg group Hn November 20, 2010 13 / 44.. The Euclidean Isoperimetric Problem... The proof

了⼀一個方案,用以尋找滿足 Calabi 方程的空 間,這些空間現在通稱為 Calabi-Yau 空間。.

Reading Task 6: Genre Structure and Language Features. • Now let’s look at how language features (e.g. sentence patterns) are connected to the structure

第二語言學習架構 修訂説明 二階 LR2.1.

Define instead the imaginary.. potential, magnetic field, lattice…) Dirac-BdG Hamiltonian:. with small, and matrix

Basing on the observation and assessment results, this study analyzes and discusses the effects and problems of learning the polynomial derivatives on different level students

This study aims at evaluating the learning effects on the part of students from the teacher-designed concrete vector classroom-teaching approach in Plane Vector course on the basis