資料模擬 - 資料補值之正確性模擬 - 以連續及順序尺度測量滿意程度的合意度分析

第三章、資料補值之正確性模擬

第二節、資料模擬

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

第二節、資料模擬

模擬所使用的 1010 筆資料為對於生活環境滿意度的評分，五個變數分別為性別(gender)、滿意度(satisfaction)、學歷(schooling)、滿意度評分(score)和年齡(age)，

將資料中有遺漏值的筆數刪除剩下 768 筆資料。第二章 Schafer (1997)提到的 DA(data augmented)的方式做補值，用於檢查補值的正確性，接著隨機將此 768 筆資料隨機刪除 1%、5%和 10%的資料當成遺漏值，使用 DA 的補值方法對資料做 2000 次補值，資料補完值後，再取當中的滿意度和滿意度評分兩個變數計算合意度，最後與原始 768 筆資料所做出的合意度判別之間的差異狀況。

每次做完補值後，將連續型變數滿意度評分經由等級和常態分數兩種轉換，

再對滿意度和滿意度評分兩變數來算出其 Kappa、MA 和 Kendall’s W 等統計量估 算補完值後資料的合意度。2000 次補完值的 Kappa、MA 和 Kendall’s W 值會再 取中位數或平均數，接著重複以上步驟 500 次，可以得到 500 個，經由等級轉換和常態分數轉換後所算出的平均數或中位數所畫出的箱型圖如圖 9 到圖 12 和摘 要表 25，其中各個圖中的橫線條表示 768 筆原始資料的 Kappa、MA 和 Kendall’s W 值，同表 25 中之實際值。圖 9 為遺漏值比例 1%並使用等級轉換方法，從中 發現取中位數或是平均數其實差異不大，因此圖 10 到圖 12 都取中位數做為分析。

由圖 10 到圖 12 發現使用常態分數轉換相較於等級轉換後的 Kappa 和 Kendall’s W 會相對於實際值會變得較低、而 MA 會變得較高，經由常態分數轉換和等級轉換 的模擬值 500 次分別與 768 筆原始資料的實際值做比較，發現使用等級轉換後的值要來的比較小，也就是使用常態分數轉換後的結果會與實際狀況較接近。經過等級轉換後，可降低系統差異，而經過常態分數轉換可降低隨機差異，兩種轉換方法各有好壞，因此第四章實證分析使用此兩種轉換方法分別做分析。

‧

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖 9、1%遺漏值模擬 500 次使用等級轉換後各統計量箱型圖

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖 10、1%遺漏值模擬 500 次各統計量箱型圖

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖 11、5%遺漏值模擬 500 次各統計量箱型圖

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖 12、10%遺漏值模擬 500 次各統計量箱型圖

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

由圖 10 到圖 12 資料 500 次的 Kappa、MA 或是 Kendall’s W 值，圖中的中位 數大部分都小於實際值，且經過常態分數轉換比起使用等級轉換與實際值的差異要來的小，在接下來以實際值差異較大的等級轉換方法做圖當代表。模擬 500 次當中每一次都包含 2000 個模擬的值，將 2000 個模擬的值以箱型圖做分析如圖 13，其中第一次 2000 個模擬值的中位數與實際值的差異略大，緊接著再做第二次卻發現差異與實際值差異變小，經過多次驗證都經由滿意度和滿意度評分兩變數來看，是否因為遺漏值剛好大部分都抽到此兩變數所導致，其中一次模擬的滿意度評分所包含的遺漏值有 50 個，但是差異卻沒有特別大。

如圖 13，雖然補完值後的結果 2000 筆 Kappa、MA 或是 Kendall’s W 值多數 會高於實際值，但有時會小於實際值，資料都有左偏的趨勢，且在大多情況下 2000 次模擬值的中位數都略小於實際值，造成 500 次資料的平均值和中位數值都小於實際值。因此，會得到 500 次平均值和中位數值的結果畫箱型圖低於實際 的 Kappa、MA 或是 Kendall’s W 值，造成此影響是所研究的樣本之合意度都有一 定的水準，使用各個統計量分析資料的合意度一定很高，所以會造成有左偏的現 象，且 MA 和 Kendall’s W 值特別明顯，因為此兩統計量值皆非常趨近於 1，反 觀 Kappa 值的變化較容易受影響且波動較大，因此左偏的情況沒有像 MA 和 Kendall’s W 值來的明顯。儘管 500 次模擬出來值的平均數和中位數值還是都略小 於實際值，但可以從圖形中看出偏離的情況較不嚴重，仔細觀察當中的差異不會超過 0.05，經過模擬後，驗證出補值後與實際狀況差異不大。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖 13、1%遺漏值模擬 2000 筆各統計量的箱型圖(其中三次)

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

在文檔中以連續及順序尺度測量滿意程度的合意度分析 - 政大學術集成 (頁 46-55)

資料模擬

第三章、 資料補值之正確性模擬

第二節、 資料模擬

國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

第二節、資料模擬

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

第三章、資料補值之正確性模擬

第二節、資料模擬

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學