• 沒有找到結果。

第三章 研究設計與實施

第五節 資料處理

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

第五節 資料處理

本研究旨在探討家庭作業與學習成就的關係,根據研究架構與研究假設,

本研究分別從遺漏值的處理;班級層次預測變項的效度分析與信度分析;學生 層次效標變項的似真值分析;HLM 模式設定、變項中心化設定及權重的運用;

以及CLPM 分析與適配度指標的標準這五個部分的資料處理做介紹。

壹、遺漏值的處理

出現「遺漏值」(missing value)或是「不完整資料」(incomplete data)的 問題幾乎是所有調查資料(survey data)不可避免的難題。然而,即使研究者已 經發現這個問題,但長久以來,或許囿限於相關統計理論文獻晦澀艱深,或是 研究者缺乏實際處理遺漏值資料的經驗,導致面對遺漏值的議題,大部分研究 者往往採取「棄之不理」的策略,或是抱持「視而不見」的駝鳥式作法,不幸 的是這將引發諸多困境(陳信木、林佳瑩,1997)。

通 常 調 查 資 料 出 現 遺 漏 值 的 問 題 可 以 分 成 「 單 位 無 反 應 」(unit nonresponse);「項目無反應」(item nonresponse);以及「波次無反應」(wave nonresponse)這三種型態。其中,單位無反應係指樣本的所有變項皆為遺漏值

(例如受試者缺席或一開始就拒絕受訪);項目無反應係指樣本的部分變項出現 遺漏值(例如受試者雖然參與研究,但在一些變項上出現漏答或拒絕填答的情 形);波次無反應則係指長期追蹤(longitudinal)資料的追蹤樣本在部份追蹤波 次的所有變項皆為遺漏值(例如受試者在追蹤研究中的某些波次參與調查,但 在某些波次則未參與調查的情形)(Schafer & Graham, 2002)。一般而言,調查 資料產生遺漏值的機制(mechanisms)包含三種情況(王鴻龍、楊孟麗、陳俊 如、林定香,2012;林定香、藍信龍,2008;許玉雪、林建宏,2008;陳信木、

林佳瑩,1997;廖培珊、江振東、林定香、李隆安、翁宏明、左宗光,2011;

Little & Rubin, 1989, 2002;Peugh & Enders, 2004;Sinharay, Stern, & Russell, 2001)。若遺漏值為完全隨機產生,亦即遺漏值的產生與所研究之個體可觀察與 無法觀察的資料無關,則為「完全隨機遺漏」(missing completely at random, MCAR),是屬於可忽略(ignorable)的遺漏機制。例如 TIMSS 的數學和科學學 習成就測驗分別包含了許多題目,若要受測學生作答全部題目,則可能會因為

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

疲勞而無法測出真實能力,所以 TIMSS 將數學與科學所有的學習成就測驗題 目,利用矩陣抽樣(matrix sampling)的方式各分為 14 個區塊,每一個題本只 包含 2 個數學區塊和 2 個科學區塊。每位受測學生只需要作答一本題本,亦即 只回答一部份問題,由於這時學生在未作答題本的遺漏值型態(pattern)為已 知且為研究者所控制,同時作答題本是以隨機的方式分派給學生,所以學生在 未作答題本的遺漏值也為完全隨機產生,因此是一種「完全隨機遺漏」(劉長萱、

蔡政豐,1997)。若遺漏值的產生與所研究之個體可觀察的資料有關,但與遺漏 值的資料無關,則為「隨機遺漏」(missing at random, MAR),也屬於可忽略的 遺漏機制。例如調查如果發現,教育程度較低的受訪者傾向拒絕回答收入的問 題,則收入是否產生遺漏值與受訪者教育程度的高低有關,因此是一種「隨機 遺漏」(Sinharay et al., 2001)。若遺漏值的產生與所研究之個體該遺漏值的資料 有關,則為「非隨機遺漏」(missing not at random, MNAR)12,是屬於不可被忽 略(non-ignorable)的遺漏機制。例如社會調查經常發現,高所得的受訪者普遍 傾向拒絕回答收入的問題,因此收入是否產生遺漏值與收入本身的高低有關,

因此是一種「非隨機遺漏」(王鴻龍等人,2012;陳信木、林佳瑩,1997)。

在過去,由於 Trautwein(2007)同樣以 TIMSS 資料進行家庭作業研究,

同時Trautwein(2007)研究是過去少數有針對遺漏值進行考量與進行插補的研 究,所以本研究參考 Trautwein(2007)的研究後,同樣利用 NORM 2.03 軟體

(Schafer, 2000)針對遺漏值進行多重插補(multiple imputation),過去也有相 當多的研究(例如:鄒慧英、江培銘,2012;蔡明璋,2004;Campbell & Troyer, 2007;Farnia & Geva, 2011, 2013;Pollio, Thompson, Tobias, Reid, & Spitznagel, 2006;Wildhagen, 2009, 2011)採用 Schafer(2000)發展的 NORM 軟體針對遺 漏值進行多重插補。

本研究針對針對遺漏值進行多重插補是建立在「隨機遺漏」的假設,由於 家庭作業這幾個變項間存在一些潛在的關聯性,例如一些拒絕回答家庭作業時 間的學生,可能是學習成就較低,不喜歡完成家庭作業,因而也沒有完成家庭 作業經驗的學生,因此,本研究假設這些變項的遺漏,不是因為資料蒐集過程

12 不過,Little與Rubin(1989, 2002)將「非隨機遺漏」稱為(not missing at random, NMAR),

其名稱雖然與本研究與後來較多研究者所使用MNAR所不同,但概念是相同的。

漏值插補單一合理數值的「單一插補」(single imputation)所忽略的。

本研究的多重插補主要參考 Schafer(1999)NORM 使用手冊與 Graham

(2012)專書的建議,先利用 Schafer(2000)所發展的 NORM 2.03 軟體為 TIMSS 2007 年的臺灣 4 年級學生資料;TIMSS 2007 年的臺灣 8 年級學生資料;TIMSS 2011 年的臺灣 8 年級學生資料;以及 TEPS 2001 年陸續追蹤至 2005 年的學生 資料分別插補五組獨立完整資料以進行後續的統計分析13。TIMSS 2007 年的臺 灣4 年級學生資料用「最大期望法」(expectation maximization, 以下簡稱 EM 法)

進行初估後,經過18 次疊代(iteration)達到收斂(converge);TIMSS 2007 年 的臺灣8 年級學生資料經過 13 次疊代達到收斂;TIMSS 2011 年的臺灣 8 年級

13 由於Rubin(1987)認為,插補次數達到10次之後,再增加插補次數其相對效率並不會提升太 多,因此建議插補次數需要大於3,但不需要大於10;Sinharay等人(2001)的研究也認為,3 至5次的插補次數就可以得到相當好的結果。而過去許多實證研究大部分都將插補次數設定為5

(例如:鄒慧英、江培銘,2012;Farnia & Geva, 2013;Pollio et al., 2006;Trautwein, 2007;Wildhagen, 2009, 2011),所以本研究也將多重插補的次數設定為5。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

別分析所得的估計係數與標準誤,同樣也要同時利用公式(1)至公式(7)來 針對整體估計係數進行假設考驗。

貳、班級層次預測變項的效度分析與與信度分析

ㄧ、效度分析

在效度分析方面,本研究將數學(科學)家庭作業頻率視為班級層次變項,

它來自於聚集加總(aggregate)各班級學生在學生層次數學(科學)家庭作業 頻率之評量得分,在聚集加總前,本研究先利用「組內共識程度」(within group agreement)的三種指標,包含r 、WG r 及WG* AD 來檢視數學(科學)家庭作業頻M 率聚集加總為班級層次變項的適當性,所謂r 與WG r 係指同一組織內的所有成WG* 員對單一題項評量得分的共識程度,r 的計算方式如公式(8)所示,公式(8)WGs 稱為「觀察變異數」(observed variance),它是同一組織內的所有成員對單2 一題項評量得分的「組內變異數」。公式(8)的

EU2 稱為「基準變異數」(benchmark variance),它是假設同一組織內所有成員對單一題項評量得分最沒有共識下的 機率分配,亦即此單一題項的每個選項都有相同機率的人會去選擇,所以其假 定的分配型態為「均等分配」(uniform distribution),其中,

EU2 可以利用公式

(9)來計算,公式(9)的 A 為題項的選項數,舉例來說,如果某個題項有 5 個選項,則

EU2

521 /12 2

 。公式(8)的

s2 /

EU2

是觀察變異數與基準變 異數這兩個變異數的比率,1 減去這兩個變異數的比率代表沒有共識下變異數 的消減程度,也就是同一組織內的所有成員對單一題項評量得分的共識程度(溫 福星、邱皓政,2011;Lüdtke, Trautwein, Kunter, & Baumert, 2006)。

2 2

1 /

WG EU

r   s

(8)

 

2 2 1 /12

EU A

  (9)

不過,由於r 的基準變異數所假定的均等分配並不是最大的變異數,所以WG 當觀察變異數大於基準變異數時,r 就會出現小於 0 的情形,針對WG r 出現小WG

定為0。不過,Lindell 等學者(Lindell, 2001;Lindell & Brandt, 1997, 1998;Lindell, Brandt, & Whitney, 1999)建議修正r 的公式而提出WG r ,WG* r 與WG* r 的計算公式WG

MV則可以利用公式(11)來計算(Lindell, 2001),公式(11)的 A 為 Likert 式A 等尺度量表的最大選項,舉例來說,如果 Likert 式 5 等尺度量表的最小選 又有另外一些學者(例如:Burke & Dunlap, 2002;Burke, Finkelstein, & Dusig, 1999;Dunlap, Burke, & Smith-Crowe, 2003;Smith-Crowe & Burke, 2003)提出 利用「平均絕對差」(average deviation, AD )來檢視同一組織內的所有成員對M 單一題項評量得分的共識程度,AD 的計算如公式(12)所示,公式(12)的M x 是組織成員i在k這個題項的判斷値,ik xk 是相同組織內的所有組織成員在k這個 題項的平均判斷値,加總相同組織內所有組織成員x 減去ik xk 的絕對値再除以組

的所有成員對單一題項評量得分的共識程度愈高,Burke 與 Dunlap(2002);

Dunlap 等人(2003);以及Smith-Crowe 與 Burke(2003)以AD 小於或等於(M A/ 6) 分析結果,LeBreton 與 Senter(2008)也建議應該在研究中同時呈現這些不同 的指標的分析結果。不過,將r 大於 0.70 做為組內共識程度判斷標準的適切WG 性尚有爭議,所以本研究雖然同時呈現r 、WG r 及WG* AD 等三種指標的分析結M 果,但主要以AD 小於或等於(M A/ 6)做為組內共識程度的判斷標準。

二、信度分析

在信度分析方面,本研究利用「組內相關係數(2)」﹝intraclass correlation coefficient(2), ICC(2)﹞來檢視數學(科學)家庭作業頻率聚集加總為班級

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

層次變項的代表性。ICC(2)關注的是組間變異數,當各組樣本數愈大且組間 變異數也愈大時,代表各組聚集加總的組平均數愈具有代表性,也愈不受測量 誤差的影響,因此可以檢視班級層次預測變項的「信度」。不過,由於ICC(2)

的計算來自 ICC(1)的延伸,所以本研究先介紹 ICC(1)的計算方式,再進 一步說明如何計算ICC(2)。ICC(1)的計算可以利用 HLM 的零模式(null model 或empty model),零模式是HLM 的起始模式,它沒有包含任何學生層次或班級 層次的預測變項,方程式(10)與方程式(11)為本研究數學(科學)家庭作 業頻率的零模式,方程式(10)的數學 科學 家庭作業頻率

 

ijj 班級i 學生數學

(科學)家庭作業頻率評量得分,0 jj 班級數學(科學)家庭作業頻率評量 得分的班級平均數;

ij為以 j 班級數學(科學)家庭作業頻率評量得分的班級 平均數來預測 j 班級 i 學生數學(科學)家庭作業頻率評量得分時,仍可能出現 的班級內學生誤差(組內變異數)。方程式(11)的00為所有學生數學(科學)

家庭作業頻率評量得分的總平均數;u0 j為以所有學生數學(科學)家庭作業頻

家庭作業頻率評量得分的總平均數;u0 j為以所有學生數學(科學)家庭作業頻