• 沒有找到結果。

第三章、 資料補值之正確性模擬

第二節、 資料模擬

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

38

第二節、資料模擬

模擬所使用的 1010 筆資料為對於生活環境滿意度的評分,五個變數分別為 性別(gender)、滿意度(satisfaction)、學歷(schooling)、滿意度評分(score)和年齡(age),

將資料中有遺漏值的筆數刪除剩下 768 筆資料。第二章 Schafer (1997)提到的 DA(data augmented)的方式做補值,用於檢查補值的正確性,接著隨機將此 768 筆資料隨機刪除 1%、5%和 10%的資料當成遺漏值,使用 DA 的補值方法對資料 做 2000 次補值,資料補完值後,再取當中的滿意度和滿意度評分兩個變數計算 合意度,最後與原始 768 筆資料所做出的合意度判別之間的差異狀況。

每次做完補值後,將連續型變數滿意度評分經由等級和常態分數兩種轉換,

再對滿意度和滿意度評分兩變數來算出其 Kappa、MA 和 Kendall’s W 等統計量估 算補完值後資料的合意度。2000 次補完值的 Kappa、MA 和 Kendall’s W 值會再 取中位數或平均數,接著重複以上步驟 500 次,可以得到 500 個,經由等級轉換 和常態分數轉換後所算出的平均數或中位數所畫出的箱型圖如圖 9 到圖 12 和摘 要表 25,其中各個圖中的橫線條表示 768 筆原始資料的 Kappa、MA 和 Kendall’s W 值,同表 25 中之實際值。圖 9 為遺漏值比例 1%並使用等級轉換方法,從中 發現取中位數或是平均數其實差異不大,因此圖 10 到圖 12 都取中位數做為分析。

由圖 10 到圖 12 發現使用常態分數轉換相較於等級轉換後的 Kappa 和 Kendall’s W 會相對於實際值會變得較低、而 MA 會變得較高,經由常態分數轉換和等級轉換 的模擬值 500 次分別與 768 筆原始資料的實際值做比較,發現使用等級轉換後的 值要來的比較小,也就是使用常態分數轉換後的結果會與實際狀況較接近。經過 等級轉換後,可降低系統差異,而經過常態分數轉換可降低隨機差異,兩種轉換 方法各有好壞,因此第四章實證分析使用此兩種轉換方法分別做分析。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

40

圖 9、1%遺漏值模擬 500 次使用等級轉換後各統計量箱型圖

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

41

圖 10、1%遺漏值模擬 500 次各統計量箱型圖

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

42

圖 11、5%遺漏值模擬 500 次各統計量箱型圖

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

43

圖 12、10%遺漏值模擬 500 次各統計量箱型圖

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

44

由圖 10 到圖 12 資料 500 次的 Kappa、MA 或是 Kendall’s W 值,圖中的中位 數大部分都小於實際值,且經過常態分數轉換比起使用等級轉換與實際值的差異 要來的小,在接下來以實際值差異較大的等級轉換方法做圖當代表。模擬 500 次當中每一次都包含 2000 個模擬的值,將 2000 個模擬的值以箱型圖做分析如圖 13,其中第一次 2000 個模擬值的中位數與實際值的差異略大,緊接著再做第二 次卻發現差異與實際值差異變小,經過多次驗證都經由滿意度和滿意度評分兩變 數來看,是否因為遺漏值剛好大部分都抽到此兩變數所導致,其中一次模擬的滿 意度評分所包含的遺漏值有 50 個,但是差異卻沒有特別大。

如圖 13,雖然補完值後的結果 2000 筆 Kappa、MA 或是 Kendall’s W 值多數 會高於實際值,但有時會小於實際值,資料都有左偏的趨勢,且在大多情況下 2000 次模擬值的中位數都略小於實際值,造成 500 次資料的平均值和中位數值 都小於實際值。因此,會得到 500 次平均值和中位數值的結果畫箱型圖低於實際 的 Kappa、MA 或是 Kendall’s W 值,造成此影響是所研究的樣本之合意度都有一 定的水準,使用各個統計量分析資料的合意度一定很高,所以會造成有左偏的現 象,且 MA 和 Kendall’s W 值特別明顯,因為此兩統計量值皆非常趨近於 1,反 觀 Kappa 值的變化較容易受影響且波動較大,因此左偏的情況沒有像 MA 和 Kendall’s W 值來的明顯。儘管 500 次模擬出來值的平均數和中位數值還是都略小 於實際值,但可以從圖形中看出偏離的情況較不嚴重,仔細觀察當中的差異不會 超過 0.05,經過模擬後,驗證出補值後與實際狀況差異不大。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

45

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

46

圖 13、1%遺漏值模擬 2000 筆各統計量的箱型圖(其中三次)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

47

相關文件