• 沒有找到結果。

第三章 理念架構與研究方法

3.3 研究方法

3.3.1 試題反應理論(IRT)與Rasch模式

3.3.1.2 Rasch模式

由於本研究試圖量測之受測者「潛在特質」(運輸行為改變傾向、小客車依賴度)所 設計的問卷問項,預期受測者之回答並非「對」或「錯」之反應,而是自我認定程度大 小之反應;因此,試題反應理論之試題參數(item parameters)中,最低之答對機率 、最 高之答對機率d與鑑別度 等參數並不適合應用於本研究,更無討論解釋之必要。所以 Rasch[40]於1960年提出之Rasch模式。

=1

Rasch模式可應用於二元或多元計分模式。首先,我們先利用二元資料(Dichotomous Data)舉例,介紹Rasch模式之使用。以量測因應油價之運輸行為「改變傾向」為例,若

(

n i

) (

n i

)

n bi

Rasch模式經過修改後,可以應用在多元資料(Polytomous Data)之分析上,例如一般 常用的李克特五尺度[42]。若題目之選項採用李克特五尺度之設計,則Rasch模型之基本

二題較高。將所有的受訪者在每個題目上的表現進行綜合性之校估,則可得到每個題目 與選項4之對應機率如(9)、(10)兩式。而式(11)為上述算式中共同之分母。

D1 為語文能力不足、看不懂問項而影響作答結果。由於單向度之假設不易滿足,Hambleton

21

與Swaminathan[38]認為當測驗具有一個影響結果之主要因素(dominant factor)時,則符合 單向度之假設。(2)局部獨立性(local independence):當受測者能力被固定時,受測者在 任何問項上的反應,在統計學上而言是獨立的,這意味著受測者能力才是唯一影響受測 者在問項上表現之因素。Hulin等學者[43]指出通常單向度假設成立時,局部獨立性假設 也會成立,因此當檢定單向度成立時,則可推定局部獨立性也成立。

所以使用Rasch 模式進行參數估計前,須先檢驗資料是否符合 Rasch 模式之單向度 及局部獨立性假設。檢驗單向度可藉由因素分析或主成份分析來檢驗該測驗是否只萃取 出單一因素或單一主成份,或是第一因素的特徵值與第二因素特徵值的比值大於2[44],

Reckase[45]認為第一主成份至少解釋全體變異量 20%,Smith 及 Miao[46]指出扣除第一 成份之因素值,剩餘之因素值和小於 1.5,則表示測驗符合單向度假設。如果不符合,

則必須刪除不符合之問項,才能使用Rasch 模式進行分析。Hattie[47]曾將評估測驗是否 符合單向度假設的方法大致分為五類:

1. 受試者反應型態的合理性。

2. 測驗信度,當內部一致性愈高,表示這些問項很可能都測到了相同的特質,因 此比較有可能符合單向度假定。

3. 主成份分析,如果只萃取出一個主成份;或是第一主成份與第二主成份的特徵 值的比值非常高,表示測驗符合單向度。

4. 殘差值分析,比較資料實際值與理論值間的差異,通常以χ2值及自由度來檢定 是否達統計上的顯著水準。

5. 線性及非線性因素分析結果。當第一因素的特徵值與第二因素特徵值的比值愈 高,就表示測驗愈有可能符合單向度假定。其中非線性因素分析主要用於二元 計分的問項上,因此類問項之答題反應非常態分配,不適合用傳統的因素分析 方法。

當單向度及局部獨立性假設成立時,可利用Rasch模式進行參數較估。許擇基等人[48]

提出試題參數之建立通常是先經傳統施測過程,搜集受測者答題反應後,再進行試題參 數之校估。Rasch模式參數常見校估方法為聯合最大概似法(joint maximum likelihood, JML) 、 邊 際 最 大 概 似 法 (marginal maximum likelihood, MML) 及 條 件 最 大 概 似 法 (conditional maximum likelihood, CML)。當受測者運輸行為改變傾向已知時,可使用最 大概似估計法來校估參數;當受測者運輸行為改變傾向及問項參數皆未知之情況下,則 可使用聯合最大概似估計法及邊際最大概似估計法,對問項參數及受測者運輸行為改變

傾向參數進行同時之校估[38]。目前已有許多不同校估方式之Rasch分析軟體,在使用上 應依研究之需要選擇適當之軟體。

Rasch 模式假設模式需符合單向度假設,也就是受測者之答題情況只受其運輸行為 改變傾向影響,因此運輸行為改變傾向高之受測者在試題中能夠獲得相對應較高分數 (非常同意與同意較多);而運輸行為改變傾向之改變困難度較高之問項,該題答非常同 意之受測者相對會較少,亦即樣本需符合 Guttman Scale[49]特性。簡單來說,Guttman Scale 為運輸行為改變傾向高(能力高)的受測者對於改變困難度較低(簡單試題)及較高 (困難試題)的問項皆得到較高分數(非常同意與同意較多);運輸行為改變傾向低的受測 者只能對於改變困難度較低的問項得較高的分數,若將答題情況依照得分高低排序由上 往下排序,受測者填答的結果會造成上下兩個相等的三角形。配適度統計值(fit)就是用 來檢測資料本身是否符合Guttman Scale。