• 沒有找到結果。

單一總體尺度及多項評估的合意度分析 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "單一總體尺度及多項評估的合意度分析 - 政大學術集成"

Copied!
59
0
0

加載中.... (立即查看全文)

全文

(1)國立政治大學統計學系 碩士學位論文. 政 治 大. 立 單一總體尺度及多項評估的合意度分析. ‧ 國. 學. Agreement analysis between a single global scale. ‧. and multi‐item assessments. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 指導教授:鄭宗記博士 研究生:顏柏魁 中華民國一百零三年七月 1.

(2) 摘要 實務上,不完整資料為常見的問題,對於遺漏值的處理方式,分成刪除法或 填補法這兩種方法,而面對問卷類型的資料,通常採用順序尺度變數當作問卷的 評分標準,本篇使用 EM 方法填補遺漏值,由於順序尺度變數時常發生樣本數可 能沒有遠大於問卷之題目組成的列聯表格子數,導致 EM 無法執行,因此逐次對 資料執行 EM 填補遺漏值。藉由 EM 填補後的完整資料使用加總尺度、因素分析 和非線性主成分分析整合為單一總體尺度,應用等級轉換法將單一總體尺度轉換 為順序尺度,接著評估兩順序尺度變數之間合意度。. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 2. i n U. v.

(3) 目錄 第一章 研究動機 ............................................................................................................................. 7 第二章 文獻回顧 ............................................................................................................................. 9 第一節 不完整類別變數資料處理 .................................................................................. 9 第二節 單一總體尺度 ........................................................................................................13 第三節 評估順序尺度的變數合意度 ...........................................................................18 第三章 實證分析 ...........................................................................................................................29 第一節 不完整資料的敘述統計 .....................................................................................29. 政 治 大 第三節 單一總體尺度與合意度評估 ...........................................................................36 立 第二節 EM 填補遺漏值 .....................................................................................................32. ‧ 國. 學. 第四章 模擬研究 ...........................................................................................................................49 第一節 5%遺漏比例 ...........................................................................................................50. ‧. 第二節 10%遺漏比例 ........................................................................................................52. sit. y. Nat. 第三節 15%遺漏比例 ........................................................................................................54. n. al. er. io. 第五章 結論.....................................................................................................................................57. Ch. engchi. 3. i n U. v.

(4) 表目錄 表一 括號內為排序等級(rank ( X ), rank (Y ))----------------------------------------- 19 表二 括號內為平均增廣等級化的值 ( Rij( X ) , Rij(Y ) ) ------------------------------------- 20 表三 表一列聯表轉換為 RTPA 列聯表 ------------------------------------------------- 21 表四 研究員 A 與 B 評估腦水腫病患的嚴重程度的分數 -------------------------- 22 表五 表三列聯表轉換為 RTPA 列聯表 ------------------------------------------------- 22 表六 研究員 A 與 B 評估腦水腫病患的嚴重程度評估的分數 RTPA 輔助表 --- 22 表七 括號內為平均增廣等級化的值 ( Rij(A) , Rij(B) ) ------------------------------------- 24. 政 治 大 表八 研究員 A 與 B 評估腦水腫病患的嚴重程度的分數 -------------------------- 26 立. 表九 各個項目的遺漏比例 --------------------------------------------------------------- 29. ‧ 國. 學. 表十 刪除遺漏值資料各變數尺度的比例 --------------------------------------------- 30. ‧. 表十一 有觀測到資料各變數尺度的比例 --------------------------------------------- 31. y. Nat. 表十二 總體評分和教育的 EM 機率值(狄利克雷先驗分配的參數=1) --------- 32. er. io. sit. 表十三 總體評分和環境的 EM 機率值(狄利克雷先驗分配的參數=1) --------- 33 表十四 總體評分和治安的 EM 機率值(狄利克雷先驗分配的參數=1) --------- 33. al. n. v i n 總體評分和交通的 EM --------- 33 C h機率值(狄利克雷先驗分配的參數=1) engchi U. 表十五. 表十六 總體評分和安全的 EM 機率值(狄利克雷先驗分配的參數=1) --------- 34 表十七 總體評分和醫療的 EM 機率值(狄利克雷先驗分配的參數=1) --------- 34 表十八 總體評分和旅遊的 EM 機率值(狄利克雷先驗分配的參數=1) --------- 34 表十九 總體評分和經濟的 EM 機率值(狄利克雷先驗分配的參數=1.1) ------ 35 表二十 2000 次補值各變數尺度的比例 ----------------------------------------------- 36 表二十一 因素分數與總體評分的列聯表 --------------------------------------------- 37 表二十二 2000 次補值加總尺度與總體評分之 MA、RV、RP 和 RC 的彙整 - 38 表二十三 因素負荷 --------------------------------------------------------------- 39. 4.

(5) 表二十四 2000 次補值平均多序類相關係數矩陣 ----------------------------------- 40 表二十五 2000 次補值因素分數與總體評分之 MA、RV、RP 和 RC 的彙整 - 40 表二十六 2000 次補值目標分數與總體評分之 MA、RV、RP 和 RC 的彙整 - 42 表二十七 刪除遺漏值的資料加總尺度與總體評分的 MA、RV、RC 和 RP --- 44 表二十八 刪除遺漏值資料的多序類相關係數矩陣 --------------------------------- 44 表二十九 刪除遺漏值資料的因素負荷和 2000 次補值平均因素負荷 ---------- 45 表三十 刪除遺漏值資料的因素分數與總體評分之 MA、RV、RC 和 RP ------- 45 表三十一 刪除遺漏值資料的目標分數與總體評分之 MA、RV、RC 和 RP ---- 45 表三十二 5%、10%和 15%遺漏比例加總尺度、因素分數和目標分數各自 MA. 政 治 大 平均 ------------------------------------------------------------------------------------------- 55 立. 表三十三 5%、10%和 15%遺漏比例加總尺度、因素分數和目標分數各自 MA. ‧ 國. 學. 中位數 ---------------------------------------------------------------------------------------- 56. ‧. 表三十四 5%、10%和 15%遺漏比例加總尺度、因素分數和目標分數各自 RV. y. Nat. 平均 ------------------------------------------------------------------------------------------- 56. er. io. sit. 表三十五 5%、10%和 15%遺漏比例加總尺度、因素分數和目標分數各自 RV 中位數 ---------------------------------------------------------------------------------------- 56. n. al. Ch. engchi. 5. i n U. v.

(6) 圖目錄 圖 1 判斷順序尺度變數的合意度的檢查步驟 ---------------------------------------- 27 圖 2 刪除遺漏值資料各變數尺度的長條圖 ------------------------------------------- 30 圖 3 有觀測到資料各變數尺度的長條圖 ---------------------------------------------- 31 圖 4 2000 次補值各變數尺度的長條圖 ------------------------------------------------ 35 圖 5 2000 次補值加總尺度與總體評分之 MA、RV、RP 和 RC 的直方圖 ------ 37 圖 6 2000 次補值因素分數與總體評分之 MA、RV、RP 和 RC 的直方圖 ------ 41 圖 7 2000 次補值目標分數與總體評分之 MA、RV、RP 和 RC 的直方圖 ------ 43. 政 治 大 遺漏值資料的 MA -------------------------------------------------------------------------46 立 圖 8 2000 次補值加總尺度、因素分數和目標分數的 MA 盒鬚圖,直線為刪除. ‧ 國. 學. 圖 9 2000 次補值加總尺度、因素分數和目標分數的 RV 盒鬚圖,直線為刪除 遺漏值資料的 RV --------------------------------------------------------------------------- 47. ‧. 圖 10 2000 次補值加總尺度、因素分數和目標分數的 RP 盒鬚圖,直線為刪除. sit. y. Nat. 遺漏值資料的 RP --------------------------------------------------------------------------- 47. al. er. io. 圖 11 2000 次補值加總尺度、因素分數和目標分數的 RC 盒鬚圖,直線為刪除. v. n. 遺漏值資料的 RC --------------------------------------------------------------------------- 48. Ch. engchi. i n U. 圖 12 5%遺漏比例下補值 MA 盒鬚圖,直線為刪除遺漏值的資料之 MA ----- 50 圖 13 5%遺漏比例下補值 RV 盒鬚圖,直線為刪除遺漏值的資料之 RV ------- 51 圖 14 10%遺漏比例下補值的 MA 盒鬚圖,直線為刪除遺漏值的資料之 MA 52 圖 15 10%遺漏比例下補值的 RV 盒鬚圖,直線為刪除遺漏值的資料之 RV -- 53 圖 16 15%遺漏比例下補值的 MA 盒鬚圖,直線為刪除遺漏值的資料之 MA 54 圖 17 15%遺漏比例下補值的 RV 盒鬚圖,直線為刪除遺漏值的資料之 RV -- 55. 6.

(7) 第一章 研究動機 實務上,進行統計分析時,時常會遇到有遺漏值的狀況,而 Schafer(1997) 提出處理遺漏值的方法大致上分成兩種;第一種為刪除任意一個或多個變數發生 遺漏值的整筆資料(case deletion),對於遺漏值比例 5%以下的資料,此做法對分 析較不會產生嚴重影響,但遺漏值比例偏高時,此做法將會刪除大部分的資料, 對於分析可能有嚴重的偏頗。第二種為填補法(Imputation),現今遺漏值的填補 方式有兩種常見的方法,其一為藉由變數的平均數填補此變數發生遺漏值的部分, 補平均數的方法雖然簡單,但會導致變數的變異數變小,對於後續的檢定容易造. 政 治 大 的變異數。本文將應用期望最大演算法(expectation maximization algorithm)填 立. 成拒絕的困境。其二為應用迴歸分析的預測值填補遺漏值,但此方法會膨脹變數. ‧. ‧ 國. 參數估計值。. 學. 補遺漏值,EM 可以找出最大概似估計值在不完整的資料且能夠估計出更適當的. sit. y. Nat. 對於問卷資料時,常使用順序尺度的變數做為問卷題目的評分標準,本篇使. al. er. io. 用的資料為某座城市的各項評比的滿意度調查,此資料變數有總體評分、教育、. v. n. 環境、治安、交通、安全、醫療、旅遊和經濟,而我們想要了解總體評分和其他. Ch. engchi. i n U. 變數之間滿意度的合意度,所以需把總體評分以外的變數轉換為單一總體尺度, 而本文應用加總尺度(summated scale)、因素分析(factors analysis)和 Gifi(1990) 提出非線性主成分分析(nonlinear principal components analysis)的方法將這些 變數轉換為單一總體尺度。而因素分析藉由相關係數矩陣的資訊萃取因素,但常 見的皮爾生相關係數(Pearson correlation)應用在順序尺度變數上並不合適,所 以 我 們 藉由 Pearson(1901) 提出 的多 序類 相關係 數取 代皮爾 生 相關係 數。 Gifi(1990)提出非線性主成分分析應用同質性分析(homogeneity analysis)的概念 加入等級一(rank-one)的限制條件,使用交替最小平方演算法(alternating least squares algorithm)對損失函數的參數估計。藉由上述的三種方法將這些變數整 7.

(8) 合成單一總體尺度,再使用等級轉換法(rank transformation)轉換為順序尺度的 變數,藉由此單一總體尺度與總體評分評估滿意度的合意度。Svensson(2012) 提出衡量兩個順序尺度的變數之間的合意度,導致變數之間的不合意度有兩種原 因,其一為隨機差異,隨機差異(random difference)可以用相對等級變異(relative rank variance)來衡量,其二為系統差異,系統差異分為兩部分,其一為位置分 布系統差異,意思為兩變數的邊際分配的差異,位置分布系統差異(systematic difference in position)可以用相對位置(relative position)來衡量,其二為位置集 中系統差異(systematic difference in concentrate),意思為兩變數是否過度集中 填答中間的順序尺度,位置集中系統差異可以用相對集中(relative concentration). 政 治 大 來衡量,而整體合意度可由單調合意度係數(coefficient of monotonic agreement) 立. 來衡量。. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 8. i n U. v.

(9) 第二章 文獻回顧 本章分成三個章節,包含不完整類別變數資料處理、單一總體尺度和順序尺 度變數的合意度評估。針對其三個部分的理論架構做為文獻回顧。第一節說明如 何使用期望最大演算法(expectation maximization algorithm)填補遺漏值。第二 節說明如何將多維度類別變數整合為單一總體尺度的方法。第三章說明如何評估 順序尺度的變數合意度的方法。. 第一節 不完整類別變數資料處理. 政 治 大 常採取刪除任一個變數發生遺漏值的整筆資料或填補遺漏值。當遺漏值佔整體資 立 遺漏值為統計實務分析常見的問題。Schafer(1997)提出面對遺漏值時,通. ‧ 國. 學. 料比例的 5%以下時,刪除的方式可能為合理的處理方法,但對於多個變數都有 遺漏值發生且遺漏值比例偏高時,刪除的方式可能會喪失大量的資訊且使分析產. ‧. 生偏頗。本篇對於處理類別資料遺漏值的部分,引用 Schafer(1997)提到 EM 在. sit. y. Nat. 飽和多項分配模型下的填補遺漏值的方法。並針對執行 EM 常遇到的問題,如:. n. al. er. io. 列聯表(contingency table)的任一格觀測次數為零,提出解決方法。. Ch. engchi. i n U. v. 在貝氏模型下,多項分配對應的先驗分配為狄利克雷(Dirichlet)分配,上述 的組合下,其後驗分配將化簡為狄利克雷分配的形式,下面介紹狄利克雷先驗分 配應用在多項分配的情況。假設有 筆資料且變數個數為 個,Y =( , 定義 為( ,. =12. ,. ),. )= 的所有可能發生值的集合。若每個變數 有 個尺度,. , ,所有變數尺度個數的組合為. 為 項分配參數,. ,. 。列聯表 =. 的發生次數總和, ,. =1,2, .. ,D,且. 對應列聯表格子的多. =1。因此. 配 使用狄利克雷分配,. 9. ,. 為多項分配,先驗分.

(10) , , 後驗分配為 P(. ∝. ,. 的後驗分配簡化為. ~ D(. =( =α+ 。 政 治 大. 後驗分配平均數和眾數為. 立. Mode(. (. ),. ‧. ‧ 國. =. 學. E(. 的值皆要大於 0。如果滿足. 使用狄利克雷分配為先驗分配時,需注意. y. Nat. n. al. er. io. sit. 上述條件,狄利克雷分配適合使用於多項分配下的先驗分配。. i n U. v. 接下來定義符號用來描述不完整資料、有觀察到的概似函數和 EM 執行步驟。. Ch. engchi. 每筆資料可以藉由遺漏樣式分類成一些群體,因此定義遺漏樣式 , =1 2. S,. 並且應用二元指標函數描述,公式如下 1. 定義. 當. 為屬於遺漏樣式 下有觀察到的變數. 為在遺漏樣式 下對應( ,. ,. )= 的發生次數,. 。. 。. 對於任意的遺漏樣式 下的任何一個變數以上為遺漏值時,無法計算. 的值,所. 以提供更進階的分類每筆資料的方法,此方法藉由有觀測到的變數部分和遺漏變 數的部分將資料分類。 有觀測到的變數的集合;. 為屬於某個遺漏樣式 下( ,. ,. 則為遺漏的變數的集合,定義如下 10. ). 所對應的.

(11) 1,. = 在某個遺漏樣式 s 下,. 。. 代表觀測到的變數所有可能發生值的集合,. 漏的變數所有可能發生值的集合。以下提供一個藉由. 和. 則為遺. 分類的範例。. 假設資料變數為 4 個( =4),遺漏樣式為 和 為觀測到的變數但是 和 為遺 =(. 漏的變數,因此. = {(. 12. 12. },. (. 12. 12. 。. 政 治 大. 為屬於某遺漏樣式 s 情況,計算有觀測到的變數的可能發生值的發生. 立. 次數,公式如下. ‧ 國. , 對全部. 學. 屬於遺漏樣式 s 情況,計算有觀測到的變數的可能發生值的機率,公. ‧. 式如下. Nat. y. 定義. ,. ,. sit. 定義. (. ,. n. al. er. io. 由於上面的定義,可以寫出有觀測到的概似函數,公式如下. L( θ |. Ch. )) =. engchi. i n U. v. 211 ,. 儘管上面式子看似簡單但對於參數 θ 相當複雜,且不容易計算(2.1.1) θ 的最大 概似估計值。但 EM 相對簡單操作。. 首先提出 EM 使用在飽和的二維多項分配的論文為 Chen 與 Fienberg(1974)。 Fuchs(1982)將其擴展到二維以上的多項分配。使用 EM 之前,需先將每筆資料 分類為 為計算 各個. 和. 的形式。EM 分成二個步驟,分別為 E-step 和 M-steps。E-steps. 期望發生次數在遺漏樣式 s 下,再由 M-step 為加總所有 E-steps 的 期望發生次數,由各個. 期望發生次數轉換成機率值。此方法需藉由電 11.

(12) 腦運算 E- step 和 M-step 直到各個. 屬於某個遺漏樣式 s,藉由有觀測的變數的可能發生值分類並計算. 定義 ( ,. 收斂為止。. ,. ). 的發生次數為. = 定義. 。. 屬於某個遺漏樣式 s,藉由有觀測的變數可能發生值分類並計算 的對應遺漏值部分的機率值為. 。 給定在. 立. 期望發生次數值,公式如下. Nat. =. er. sit. 。. al. v i n 期望發生次數值轉換為θ C h 的估計值,公式如下 engchi U n. 藉由各個. io. M-steps. 期望發生次數,並加總所有遺. ‧. ‧ 國. 計算在遺漏樣本 s 下,依照分配(2.1.2)計算各個 漏樣式下各個. (2.1.2)。. 學. E-steps. 政 治 大. 下分配為多項分配,分配如下. y. 因此. ,. 。. EM 為計算完整資料最大概似的估計值,藉由先驗狄利克雷分配進行小部分修改, 轉換為後驗分配眾數的形式。E-step 計算方式保持不變,但 M-step 藉由完整資 料的後驗分配的眾數取代。若 為狄利克雷先驗分配,參數 M-step 改為 對全部. 12. ,. ,.

(13) =. 和 D 為 參數總和個數,若對所有 <1 且對應的發生次數值. 假如任何一個. 1為最大概似估計值。. ,. 為零時,將產生的. 為負的估計值,. 執行 EM 方法常遇到的問題就是列聯表任一格的發生次數. 為零。對於上面. 所以不推薦設定. <1。. 的問題會使參數 不能估計。因此適當的調整狄利克雷先驗分配的參數,使參數. , c 為大於 1 的常數,此調整可解決上述狀況且意義等價於加入 -1 個發生值到每個 期望發生次數。當 EM 收斂產生的 值,可藉由 在. 給定. 政 治 大. 和 分配(2.1.3) 隨機抽樣,藉由隨機抽樣的值填補遺漏值的部分。. 立. (2.1.3)。. ‧ 國. 學. 第二節 單一總體尺度. ‧. 當資料變數過多時,對於分析資料很繁瑣且緩慢。如果能有效的將變數的維. y. Nat. 度降為單一總體尺度但又能保留大部分資料特性對於分析相當有幫助。本章節提. er. io. sit. 供三種處理多維度順序尺度變數整合為單一總體尺度的方法,分別為加總尺度、 因素分析和非線性主成分分析。. n. al. Ch. (一)加總尺度(summated scales). engchi. i n U. v. Fayers 和 Machin(2007)書中提到加總尺度為使用上最廣泛且簡單的方法, 其限制為每一個變數皆為順序尺度且尺度個數需一樣,而理想的尺度個數為 5-9 個,並且需假設為每一個尺度相鄰之間的距離要相同,意思為若一個順序變數有 3 個尺度,尺度數值為 1、2 和 3,順序尺度 1 與 2 的距離需要和 2 與 3 的距離 相同。假如一筆資料變數有 個,每一個變數有 個順序尺度,尺度數值為 1 到 的 整數值,加總分數(sum-score)為加總全部變數的回應值,公式為(2.2.1),所以 加總分數範圍落在. 1到. 。加總分數藉由(2.2.1)可把分數範圍落在 0 到. 13.

(14) 100。 (2.2.1),. SS= 為第 個變數的回應值且 為變數個數, 為每個變數的尺度個數。. (二)因素分析(factor analysis) 因素分析起源於心理學,心理學研究領域常遇到一些項目,如:智商、品德、 操守等不能直接測量的項目,且事實上研究者對這些項目也不太了解如何測量, 希望經由可測量的變數訂定出這些項目。因素分析將原本資料的變數萃取成少數. 政 治 大 個變數,每個變數可分解成少數 立. 幾個因素,這些因素可用來解釋一群相互之間有關聯的變數,且也保有原始資料 的大部分資訊。設有. ( < )的線性組合。. ‧. ‧ 國. 學. Factor). ,. n. al. er. io. sit. y. Nat 矩陣表示為. 、 和 為. 個共同因素(Common. 1向量、L 為. Ch. ,. i n U. v. e n g c h i1向量。因素分析基本假設為. 矩陣和 為. E( )=0,cov( )=Φ=I,,E( ) = 0,cov( ) = Ψ,cov(. , ) = 0。L 為因素負. 荷矩陣, 為第 個變數在第 個共同因素的權重或因素負荷。對於因素分析的基 本假設推得共變異數矩陣為. ( +Ψ=. =. +E(. +Ψ。. 我們採用最大概似估計法來估計因素,假設變數 概似函數取對數為. log(L( | 14. ,. Ψ。.

(15) =. ,. 藉由計算 log(L( | )極大值,即可求的 和. 。. 因素分析需藉由相關係數矩陣來計算,所以選擇適當的相關係數為相當重要。 常見衡量兩連續變數的相關係數的方式為皮爾生相關係數(Pearson correlation), 但對於順序尺度的變數,皮爾生相關係數為不適合的方法。Pearson(1901)提出 多序類相關係數(polychoric correlation)為有效估計二元順序變數的相關係數。 假設變數服從二元常態的情況,ρ 為多序類相關係數用來估計2 係數,藉由(2.2.2)解 ρ。 2. 1. 立. (2.2.2),. 學. ‧ 國. ρ. 政 治 大. 2列聯表之相關. 、 分別為變數分界點(thresholds)。將(2.2.2)右式展開稱為 ρ 之下的多項方程 式(polynomial equation),對於估計 ρ、 和 的方式,Tallis(1962)先用列聯表. ‧. 邊際機率估計分界點,再引用條件分配的概念,以二階段的方式估計 ρ,但此估. y. Nat. sit. 計方法有些許偏誤。後續 Ollson(1979)提出聯合最大概似估計法與二階段最大概. n. al. er. io. 似估計法估計參數,聯合最大概似估計法能同時估計分界點與多序類相關係數;. i n U. v. 二階段最大概似估計法為先估計分界點,再估計多序類相關係數,對於電腦的計. Ch. engchi. 算上,二階段最大概似估計法比聯合最大概似估計法省時間,但聯合最大概似估 計法可得到較精確的估計值。Fayers 和 Machin(2007)書中提到當資料為順序尺 度變數時,使用多序類相關係數應用在因素分析上較為合適,但需注意樣本數是 否大於 1000 筆。. 當研究者想藉由數值來代表某個因素,此數值稱為因素分數。因素分數的計 算透過因素負荷和相關係數形成的迴歸式計算,此計算因素分數稱為迴歸分數 (regression scores)。由 DiStefano、Zhu 和 Mindrila(2009)提出迴歸分數優點為 最大化與因素的相關性,但缺點是會與其他因素和其他因素所計算的因素分數有 15.

(16) 相關性存在。. 假設資料為常態分配下, 給定在 Y 之下服從常態分配,分配如下 | Y~ N (. ,. ),. 所以因素分數表示為. 。. (三)非線性主成分分析(nonlinear principal components analysis) 主成分分析為將多維度變數減少為少數個成分向量(vector components),且. 政 治 大 這些成分向量為相互獨立,但必需為區間和比例尺度的變數,對於順序或名義變 立. 數 無 法 使 用 。 Gifi(1990) 提 出 非 線 性 主 成 分 分 析 , 此 方 法 由 同 質 性 分 析. ‧ 國. 學. (homogeneity analysis)衍生出來。非線性主成分分析使用交替最小平方演算法. er. io. sit. y. Nat. 法簡稱 ALS。. ‧. (alternating least squares algorithm)對損失函數裡的參數做估計,最小平方演算. 由 De Leeuw 和 Mair(2009)提出非線性主成分分析為同質性分析的架構所衍. al. n. v i n 生的方法,首先介紹同質性分析。假設資料有 筆,變數有 個,變數尺度有 Ch engchi U =1 2. ,. 為. 矩陣且定義 的( ,q)為二元指標 1. ,當第 筆資料的變數 填答的尺度 ,. 因此. 個,. ,. 的每列總和為 1。定義損失函數為. , X為. 矩陣且定義為未知的目標分數(object scores), 為. 類別量值(category quantifications)。限制條件為 為. 1和. 1向量,1 向量元素都為 1,. 16. 1. 矩陣且定義為. 和. 向量元素都為 0, 為. ,1 和 的單位.

(17) 矩陣。使用 ALS 方法最小化損失函數對於 X 和 。 ALS 步驟:. ,. 先設初始值. 需滿足兩限制式為. 1. 第一步:更新類別量值:. 。. 。. =. 第二步:更新目標分數:. =orth(. 第三步:正規化. 和. 。 ,orth()為單泛正交。. Gifi(1990)定義非線性主成分分析藉由同質性分析加入等級一(rank-one)限制為. =. ,. 政 治 大 負荷(component loadings)。在等級一的限制下,損失函數為 立. 1的類別量(category quantifications)的向量, 為長度. 學. ‧ 國. 為長度. 1的成分. ,. 最小化損失函數對於 X 和 A,藉由使用 ALS 方法,ALS 步驟由 Kuroda , Mori ,. ‧. Masaya 和 Sakakihara 提出。. y. al. 1. 和. n. 的連續整數且滿足單泛正交的限制。 第一步:. C h。 engchi. i n U. 第二步:. v. 。 。. 第三步: 第四步:更新. ,對於順序尺度。. 第五步: 第六步: 正規化. sit. 需滿足兩限制式為. er. ,. io. 先設初始值. Nat. ALS 步驟:. 。 orth(. 。. 17. ,. 為1到.

(18) 第三節 評估順序尺度的變數合意度 本章節為評估順序尺度變數的合意度,合意度的評估可應用在許多地方,如: 欲調查在兩個專家對於某件事情評估的分數,如果合意度高代表兩研究者意見很 一致,反之,兩研究者意見很不一致。本章節介紹 Svensson(2012)提出新的合 意度評估方法。. (一)增廣等級化(augmented ranking) Svensson (2012)提到依照邊際次數做排序等級。引用 Svensson (2012)中的範. 治 政 大 體狀況在治療後, X , Y 皆有 5 個尺度,資料如下表一,分別讓 X 跟 Y 排序等級, 立. 例:資料 X 表示病患評估自己的身體狀況在治療後,而 Y 表示醫生評估病患的身. 可發現依照 X 邊際次數排序等級時,同一行列聯表格子有相同等級,反之,依照. ‧ 國. 學. Y 邊際次數排序等級時,同一列列聯表格子有相同等級。. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. 18. i n U. v.

(19) 表一 括號內為排序等級(rank ( X ), rank (Y )). X 病患評估自己的身體狀況在治療後 1. 2. 3. 4. 5. 1. 1. (41,57.5). (53.5,57.5). 7. 8. 5. 列總和. 2. 2. 20 (15,46.5). (27.5, 46.5). (41, 46.5). (53.5, 46.5). 6. 6. 9. 7. 1. (4.5,22). (15,22). (27.5,22). (41,22). (53.5,22). 3. 立. 1. 2. 政 治 大. 4. 1. (15,4.5). (27.5, 4.5). 29. ‧ 國. 6 (4.5, 4.5). 學. 1. (4.5,1). 13. io. n. al. 12. 15. 58. 10. er. 8. 1. sit. Nat. 行總和. ‧. 1. y. Y 醫生評估病患的身體狀況在治療後. 3. 4. i n U. v. 排序等級為一個常見的無母數的分析方法。我們想要藉由兩變數排序等級的. Ch. engchi. 差異來觀測兩個順序尺度變數之間的不合意度,於是 Svensson (2012)提出另一 個的等級排列方式為平均增廣等級化(mean augmented-rank)。定義平均增廣等 級化公式為 j 1 i 1 d 1 Rij( X )   xkl   xil  (1  xij ) , 1  i, j  d , 2 k 1 l 1 l. 其中 xij 為第 i 列 j 行的格子之次數, 為尺度個數,而 Rij(Y ) 亦然,因此滿足 ) (Y ) (X ) (X) R((iY 1) j  Rij 和 Ri ( j 1)  Rij 。表二為表一的資料依照平均增廣等級化的排序等級,. 括號內為增廣等級化排序等級 ( Rij( X ) , Rij(Y ) ) 。由表二發現,依照 X 做平均增廣等級 化的情況下,同一行的格子有不相同的排序等級,對於 Y 做平均增廣等級化的情 19.

(20) 況下,同一列的格子會有不相同的排序等級。因此我們可以應用格子的平均增廣 等級化的排序等級之差異來評估不合意度。. 表二 括號內為平均增廣等級化的值 ( Rij( X ) , Rij(Y ) ). X 病患評估自己的身體狀況在治療後 1. 2. 3. 5. 4. (58,58). 政 2治 大7. (53.5,52.5). ‧ 國. 8. (44,45). 6. 6. 9. 7. 1. (5.5,10.5). (15.5,16.5). (27,24). (37,32). 1. 4. 1. (2,2). (10.5,4.5). (22,7). 2. 20. 29. y. 6. sit. al. n. 8. 列總和. (49,36). 1. er. 1. (1,1). 行總和. (48,57). (32.5,40.5). io. 1. 1. ‧. 2. 1. 學. 3. 立. 5. (20,38). Nat. Y 醫生評估病患的身體狀況在治療後. 3. 4. Ch. 13. n U e n g12c h i 15. iv. 10. 58. 在做運算時會將列聯表執行合意度的等級轉換樣式(the rank-transformable pattern of agreement),簡稱 RTPA 的轉換,也就是將列聯表中格子整個重新排 列,但是不改變邊際次數,使得每格非零的格子都滿足 Rij( X )  Rij(Y ) ,也就是將原 本表二的列聯表轉換成表三的形式。. 20.

(21) 表三 表一列聯表轉換為 RTPA 列聯表. X 病患評估自己的身體狀況在治療後 1. 2. 3. 4. 5. 3. 1. 2. 6. 1. ‧ 國. 12. 立. 12. 2. 2. 8. 20. 29. 3. 政 治 大. 6. 1. 1. 15. 10. 58. er. io. sit. 12. y. 13. ‧. 8. Nat. 行總和. 13. 列總和. 學. Y 醫生評估病患的身體狀況在治療後. 4. 5. 兩個順序尺度變數之間可能存在隨機差異和系統差異,表四為引用 Svensson. al. n. v i n (2012)的範例,研究員 A 與 C B 評估腦水腫病患的嚴重程度的分數,表五為表四 hengchi U. 經由 RTPA 轉換,轉換方式僅由邊際次數做排序,藉由表六輔助觀察,前 22 個. 觀察值都為 H1,所以(H1,H1)格子就填 22,而第 23 到 34 中有 12 個人研究員 A 填 H2 研究員 B 填 H1,所以(H2,H1)格子就填 12,其餘的以此類推。經過 RTPA 轉換後不合意度的原因只剩下系統差異,系統差異為邊際次數差異所導致,如表 四尚未經過 RTPA 轉換,導致不合意度的原因有系統差異和隨機差異。. 21.

(22) 表四 研究員 A 與 B 評估腦水腫病患的嚴重程度的分數 研究員 A H1. 研 究 員. H2. H3. H4. 列總和. H4. 1. 3. 4. H3. 5. 1. 6. 9. 6. 3. 15. B. H2 H1. 22. 11. 1. 行總和. 22. 20. 13. 34 4. 59. 22. al. 22. 12. Ch. 4. 4. y. 7. n 行總和. 列總和. sit. 8. H4. er. io. H1. H3. 6. Nat. B. H2. H2. ‧. H3. 研 究 員. H1. 學. H4. ‧ 國. 治 政 大 表五 表三列聯表轉換為 RTPA 列聯表 立 研究員 A. 20. i n U. 13. engchi. v. 4. 6 15 34 59. 表六 研究員 A 與 B 評估腦水腫病患的嚴重程度評估的分數 RTPA 輔助表 1 到 22. 23 到 34. 35 到 42. 43 到 49. 50 到 55. 56 到 59. 研究員 A. H1 H1. H2 H2. H2 H2. H3 H3. H3 H3. H4 H4. 研究員 B. H1 H1. H1 H1. H2 H2. H2 H2. H3 H3. H4 H4. 22.

(23) (二)隨機差異(random difference) 對於兩順序尺度變數的合意度比較,分成系統差異和隨機差異兩個部分。研 究者可藉由平均增廣等級化的格子排序等級之差異的平方評估兩變數的隨機差 異程度,若差異越大,代表兩變數隨機差異也越大。假設 X 和 Y 為順序尺度的 變數,定義相對等級變異(relative rank variance),簡稱 RV,RV 適合評估兩變數 隨機差異的統計量,公式為. RV . 6 d d x [ Rij( X )  Rij(Y ) ]2 , 3  ij n i 1 j 1. 其中 xij 為第 i 列 j 行的格子之次數, i, j  1,. , d , d 為尺度個數,表七為引用. 政 治 大. Svensson (2012)的範例,研究員 A 與 B 評估腦水腫病患的嚴重程度的分數,計. 立. RV . 學. ‧ 國. 算表七的 RV 值為. 6 (9 12  1 92  112  112 )  0.00269 , 592. ‧. RV 值不僅考量到導致不合意度的觀測值個數,也考慮到任一個格子的平均增廣. sit. y. Nat. 等級化之排序等級的差異。由表七可以看出各個格子中對於研究員 A 和研究員 B. io. al. er. 所做出平均增廣等級化的排序等級,其中括號中的數字表示為 ( Rij(A) , Rij(B) ) ,看出. v. n. RV 值明顯有 88%由格子(3,1)所貢獻,其研究員 A 與 B 的平均增廣等級化值分. Ch. engchi. i n U. 別為 43 和 34,此格子為所有格子之中差異最大。. 23.

(24) 表七 括號內為平均增廣等級化的值 ( Rij(A) , Rij(B) ) 研究員 A H1. 研 究 員. H2. H3. H4. 列總和. H4. (55,56). (58,58). 4. H3. (52,52). (56,55). 6. B. H2. (38,39). (46.5,46.5). 15 34. H1. (11.5,11.5). (28,28). (43,34). 行總和. 22. 20. 13. 立. ij. n.  pˆ ij 表示( i , j )格子的相對頻率,此外. ‧ 國. 學. 就可表示( i , j )格子的相對排序等級之間的差異。此式子轉換為. n. . ‧. Rij( X )  Rij(Y ). y. Nat. j 1 d 1 i 1 d 1 (  xkl    xkl )  ( xijul  xijlr ) , n k 1 l  j 1 n k i 1 l 1. sit. n. 59. 政 治 大 x. RV 公式可改寫成另一種形式,令 Rij( X )  Rij(Y ). 4. er. io. 其中 xijul 為在( i , j )格子左上方區域個數總和,而 xijlr 為在( i , j )格子右下方區域個 xijul. n. al v i 即可表示為在( qˆ i , j )格子左上方區域的比率,同理, n Ch n U i e h n c g 可表示為在( i , j )格子右下方區域的比率。因此 RV 公式修改為 數總和, 令 qˆijul =. lr ij. d. . xijlr n. d. RV  6 (qˆijul  qˆijlr )2 pˆ ij 。 i 1 j 1. (三) 位置分布系統差異(systematic difference in position) 假 設 X 和 Y 為 順 序 尺 度 的 變 數 , 其 分 配 分 別 寫 為 pv( X )  p( X  v) 和 pv(Y )  p(Y  v) , v  1,. d. , d ,且 p( X  Y ) 就可寫為  pv(Y ) Pv(X1 ) ,其中大寫的 Pv( X ) v 1. 和 Pv(Y ) 分別表示為 X 和 Y 累積到 v 的比例,定義相對位置(relative position),簡稱 24.

(25) RP 為評估位置的分布程度差異的統計量,公式為 d. RP   ( pˆ v(Y ) Pˆv(X1 )  pˆ v( X ) Pˆv(Y1) ) , v 1. 計算表七的 RP 值為 RP . 1 [15  22  6  42  4  55  20  34  13  49  4  55]  0.2111 , 592. 由此 RP 值可判別研究員 B 較研究員 A 給予較低的分數,則 RP 值會小於零,反 之,當 RP 值大於 0 時,研究員 A 較研究員 B 給予較高的分數。. (四) 位置集中系統差異(systematic difference in concentrate). 政 治 大. 如果某個研究員給予較集中的分數時,導致 RP 值會很小,因此系統差異不. 立. 是只藉由位置分布系統差異所導致,定義相對集中(relative concentration),簡. ‧ 國. 學. 稱 RC 為評斷位置集中造成不合意度的統計量,公式如下. d. d. v 1. v 1. ‧. d 1 d (Y ) ˆ ( X ) (X) ˆ ˆ RC  [ pv Pv 1 (1  Pv )   pˆ v(X) Pˆv(Y1) (1  Pˆv(Y ) )] , M v 1 v 1. y. sit er. al. v. 1 [15  22 17  6  42  4  20  34 10  13  49  4]  0.075 , 0.177  593. n. RC . io. RC 值為. Nat. 其中 M  min[ pˆ 0  pˆ 02 , pˆ1  pˆ12 ] , pˆ 0   pˆ v(Y ) Pˆv(X1 ) , pˆ1   pˆ v( X ) Pˆv(Y1) ,計算表七的. Ch. engchi. i n U. 此值很小代表兩研究員 A 與 B 給予的分數差異不大,但是值為負的表示研究員 B 稍微較研究員 A 所給的分數不集中。. 表八為研究員 A 與 B 評估腦水腫病患的嚴重程度的分數,表八情況下所計 算出之 RP 值僅僅只有 0.077,這時計算 RC 值為 0.142,發現研究員 B 相對於研 究員 A 給予較集中在中間部分的分數,可由研究員 B 評分在 H2 和 H3 的個數比 研究員 A 評分在 H2 和 H3 的個數還多來看。所以系統差異不僅由計算 RP 就可 下結論,還需要計算 RC ,方才能對不合意度的情況做出較合適的結論。. 25.

(26) 表八 研究員 A 與 B 評估腦水腫病患的嚴重程度的分數 研究員 A H1 研 究 員 B. H2. H3. H4. 列總和. H4. 1. 1. 25. 27. H3. 2. 11. 8. 21. 1. 8. H2. 1. H1. 3. 行總和. 4. 6. 3 9. 12. 34. 59. 政 治 大 圖 1 為判斷順序尺度變數的合意度的檢查步驟,首先可先判斷變數的邊際次數, 立. ‧ 國. 學. 當邊際次數相等且 Rij( X )  Rij(Y ),則 RV=RC=RP=0,當邊際次數相等但 Rij( X )  Rij(Y ) 則用 RV 值評斷隨機差異。另一方面,當邊際次數不相等且 Rij( X )  Rij(Y ),則 RV=0,. ‧. y. Nat. 則使用評估系統差異的 RP 和 RC 來評斷,當邊際次數不相等但 Rij( X )  Rij(Y ) 則使用. n. er. io. al. sit. 評斷系統差異 RP 和 RC 和評斷隨機差異 RV 來判別。. Ch. engchi. 26. i n U. v.

(27) 政 治 大. 立. ‧. ‧ 國. 學. al. er. io. sit. y. Nat. 圖 1 判斷順序尺度變數的合意度的檢查步驟. v. n. (五) 單調合意度係數(coefficient of monotonic agreement). Ch. engchi. 定義一個判別不合意度的統計量為  D ,公式如下 d. D . d.  p (q i 1 j 1. ij. d. ul ij.  qijlr ). d. 1   p i 1 j 1. i n U ,. 2 ij. 其中 d 為尺度個數, pij 表示( i , j )格子的相對機率, qijul 表示在( i , j )格子左上方 d. d. 的機率, qijlr 表示在( i , j )格子右下方的機率,而分母的  pij2 是對於多數觀察 i 1 j 1. 值在相同的格子裡之情況所做的調整,滿足 0  D  1 。且  D 經過轉換成 D,公 式如下 27.

(28) d. D. d.  x ( x i 1 j 1.  xijlr ). ul ij. ij. d. d. n(n  1)   xij ( xij  1). ,或轉換為. i 1 j 1. d. D. d. 2 xij xijul i 1 j 1 d d. n(n  1)   xij ( xij  1). ,. i 1 j 1. xij 為第 i 列 j 行的格子的個數, x ulij 為在( i , j )格子左上方區域總和個數,而 x lrij 表. 示在( i , j )格子右下方區域總和個數。  D 為評估為不合意度的統計量,因此定義. 政 治 大 代表沒有不一致的觀測值。所以定義 MA(coefficient of monotonic agreement)為 立  A  1  D,滿足 0   A  1 和 0  D  1,當經過 RTPA 的轉換情況下, A  1 ,. ‧ 國. 學. 簡單評估合意度的統計量,公式如下.    A  D ,或轉換為. ‧.   1  2D ,. y. Nat. er. io. sit. 滿足 1    1 ,MA 為評估順序尺度變數的合意度指標,當經過 RTPA 轉換後,. n. MA 有最大值,其值為 1,而 a D =0。. iv l C n hengchi U. 28.

(29) 第三章 實證分析 本篇研究某座城市的各項滿意度調查,但由於資料擁有人希望保持隱密,故 沒有詳細說明此資料背景,樣本個數為 1010 份,其中選取的變數有 9 個項目, 分別為總體評分(satisifaction)、教育(education)、環境(environment)、治安 (security)、交通(traffic)、安全(safety)、醫療(medcare)、旅遊(travel)和經濟 (economic),每個變數尺度都為 4 個,分別為非常滿意、滿意,不滿意和非常不 滿意。對於各個項目的遺漏值的比例整理在表九。. 政 治 大 遺漏比例. 表九 各個項目的遺漏比例. 立. 20.7%. 教育. 19.0%. 環境. 11.2%. 治安. 13.1%. 交通. 10.9%. y. sit. n. er. io. a安全 l C h. ‧. Nat. 總體評分. 學. ‧ 國. 變數. 醫療. i n U. v. 18.0%. engchi. 15.0%. 旅遊. 14.7%. 經濟. 19.1%. 第一節 不完整資料的敘述統計 (一)刪除遺漏值資料 刪除遺漏值資料為只要有任何一個變數遺漏就刪除整筆資料,但由表九發現 每題遺漏的比例都偏高,所以藉由刪除遺漏值的方式導致樣本剩下 507 筆,等 於砍掉一半左右的樣本數。圖 2 為刪除遺漏資料各變數尺度的長條圖和表十為刪 29.

(30) 除遺漏資料各變數尺度的比例。. 政 治 大. 圖 2 刪除遺漏值資料各變數尺度的長條圖. 立. ‧ 國. 0.363. 0.258. 0.152. 0.385. 0.183. 0.197. 0.469. 0.183. 0.426. 0.247. 0.189. 0.241. 0.266. 0.219 0.150. n. er. 0.270. y. 0.108. al. 非常不滿意. sit. 不滿意. io. 環境. 滿意. Nat. 教育. 非常滿意. ‧. 總體評分. 學. 表十 刪除遺漏值資料各變數尺度的比例. v. 治安. 0.138. 交通. 0.154. 安全. 0.132. 0.523. 0.199. 0.146. 醫療. 0.187. 0.499. 0.181. 0.132. 旅遊. 0.225. 0.448. 0.187. 0.140. 經濟. 0.059. 0.306. 0.294. 0.341. Ch. e0.339 ngchi. 30. i n U.

(31) (二)有觀測到資料 有觀測到資料為忽視遺漏值的部分,只針對每筆資料有回應值的部分作分析。 圖 3 為有觀測到資料各變數尺度的長條圖和表十一為有觀測到資料各變數尺度 的比例。. 立. 政 治 大. ‧ 國. 學. 圖 3 有觀測到資料各變數尺度的長條圖. ‧. al. 0.087. 教育. 0.118. 環境. 0.168. 治安. y. v. 非常不滿意 0.290. 0.252. 0.221. 0.489. 0.207. 0.136. 0.110. 0.453. 0.248. 0.189. 交通. 0.130. 0.360. 0.252. 0.259. 安全. 0.124. 0.525. 0.220. 0.131. 醫療. 0.165. 0.528. 0.186. 0.121. 旅遊. 0.182. 0.493. 0.195. 0.130. 經濟. 0.047. 0.279. 0.337. 0.336. Ch. 0.365. 不滿意 0.258. n. 總體評分. 滿意. sit. io. 非常滿意. er. Nat. 表十一 有觀測到資料各變數尺度的比例. e 0.409 ngchi. 31. i n U.

(32) 由於此資料為不完整資料,有 503 份為一個或一個以上的變數發生遺漏值之資 料,如果採取刪除遺漏資料的方法,會導致樣本數只有 507 份,且將有可能使 分析偏向刪除遺漏值資料,但目前由表十和表十一的各變數尺度的比例看不出有 太大差異。. 第二節 EM 填補遺漏值 使用 EM 填補遺漏值的部分,因為樣本個數只有 1010 筆,假如把此不完整的 資料直接取 9 個變數同時執行 EM 時,會發生列聯表. 發生次數很多個為零,導. 政 治 大 發生次數為零。但總體評分與經濟執行 EM 時,還是發生有 立. 致 EM 無法執行。所以使用總體評分依序對其他各 1 個變數執行 EM,避免產生列 聯表. 發生次數為. 零,所以調整狄利克雷先驗分配參數(prior=1.1)解決此困境。對於上述的 EM 填. ‧ 國. 學. 補此不完整資料遺漏值的方法,會產生一個問題,當任一筆總體評分為遺漏值時,. ‧. 將會導致填補出 8 個總體評分的滿意度,因此對這 8 個滿意度取眾數填補此遺漏. y. Nat. 值,如果眾數有一個以上時,就隨機抽取眾數裡的一個值填補。表十二到表十九. er. io. sit. 為使用 EM 計算列聯表的機率值。. 表十二 總體評分和教育的 EM 機率值(狄利克雷先驗分配的參數=1). n. al. Ch. 非常滿意. 教育. engchi. i n U. v. 滿意. 不滿意. 非常不滿意. 總體評分. 非常滿意. 0.044. 0.047. 0.009. 0.004. 滿意. 0.076. 0.209. 0.039. 0.022. 不滿意. 0.010. 0.083. 0.101. 0.054. 非常不滿意. 0.004. 0.044. 0.099. 0.154. 32.

(33) 表十三 總體評分和環境的 EM 機率值(狄利克雷先驗分配的參數=1) 環境. 總體評分. 非常滿意. 滿意. 不滿意. 非常不滿意. 非常滿意. 0.064. 0.033. 0.003. 0.003. 滿意. 0.099. 0.230. 0.024. 0.005. 不滿意. 0.015. 0.127. 0.080. 0.028. 非常不滿意. 0.004. 0.075. 0.091. 0.119. 政 治 大 治安. 表十四 總體評分和治安的 EM 機率值(狄利克雷先驗分配的參數=1). 立. 非常不滿意. 非常滿意. 0.036. 0.051. 0.008. 0.007. 滿意. 0.062. 0.227. 0.045. 0.012. 不滿意. 0.014. 0.095. 0.103. 0.048. 0.010. 0.059. 0.089. y. sit. io. al. v i n C hEM 機率值(狄利克雷先驗分配的參數=1) 總體評分和交通的 engchi U 交通 n. 表十五. 0.133. er. 非常不滿意. ‧. ‧ 國. 不滿意. 學. 滿意. Nat. 總體評分. 非常滿意. 總體評分. 非常滿意. 滿意. 不滿意. 非常不滿意. 非常滿意. 0.048. 0.039. 0.008. 0.003. 滿意. 0.071. 0.193. 0.064. 0.016. 不滿意. 0.012. 0.068. 0.101. 0.082. 非常不滿意. 0.003. 0.036. 0.076. 0.180. 33.

(34) 表十六 總體評分和安全的 EM 機率值(狄利克雷先驗分配的參數=1) 安全. 總體評分. 非常滿意. 滿意. 不滿意. 非常不滿意. 非常滿意. 0.047. 0.049. 0.006. 0.001. 滿意. 0.063. 0.240. 0.030. 0.012. 不滿意. 0.012. 0.127. 0.088. 0.040. 非常不滿意. 0.010. 0.102. 0.085. 0.088. 表十七 總體評分和醫療的 EM 機率值(狄利克雷先驗分配的參數=1). 治 政 醫療 大. 非常滿意. 0.06. 0.040. 0.003. 0.003. 滿意. 0.101. 0.221. 0.029. 0.007. 不滿意. 0.017. 0.144. 0.073. 0.019. 0.009. 0.093. 0.086. ‧ 國. 非常不滿意. io. n. al. 0.096. er. 非常不滿意. sit. y. ‧. 不滿意. Nat. 總體評分. 滿意. 學. 立. 非常滿意. Ch. i n U. v. 表十八 總體評分和旅遊的 EM 機率值(狄利克雷先驗分配的參數=1). engchi 旅遊. 總體評分. 非常滿意. 滿意. 不滿意. 非常不滿意. 非常滿意. 0.051. 0.042. 0.003. 0.001. 滿意. 0.110. 0.214. 0.032. 0.004. 不滿意. 0.024. 0.136. 0.061. 0.031. 非常不滿意. 0.010. 0.075. 0.096. 0.110. 34.

(35) 表十九 總體評分和經濟的 EM 機率值(狄利克雷先驗分配的參數=1.1) 經濟. 總體評分. 非常滿意. 滿意. 不滿意. 非常不滿意. 非常滿意. 0.032. 0.038. 0.018. 0.006. 滿意. 0.016. 0.181. 0.088. 0.038. 不滿意. 0.002. 0.035. 0.130. 0.010. 非常不滿意. 0.0001. 0.015. 0.075. 0.227. 政 治 大 圖 4 為 2000 次補值各變數尺度的長條圖和表二十為 2000 次補值各變數尺度的 立. 藉由上述的方法,對此不完整的資料執行 2000 次的 EM 填補遺漏值的方法。. ‧. ‧ 國. 學. 比例。由表十、表十一和表二十發現變數尺度的比例大致上差異不大。. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 4 2000 次補值各變數尺度的長條圖. 35.

(36) 表二十 2000 次補值各變數尺度的比例 非常滿意. 滿意. 不滿意. 非常不滿意. 總體評分. 0.102. 0.338. 0.260. 0.300. 教育. 0.120. 0.411. 0.249. 0.220. 環境. 0.172. 0.494. 0.203. 0.132. 治安. 0.110. 0.457. 0.247. 0.186. 交通. 0.129. 0.36. 0.252. 0.257. 安全. 0.126. 0.528. 0.219. 0.128. 醫療. 0.170. 0.116. 旅遊. 0.184. 政0.532治 大0.182 0.497 0.193. 經濟. 0.044. 0.271. 0.126. 0.340. 學. 0.346. ‧. ‧ 國. 立. 第三節 單一總體尺度與合意度評估. sit. y. Nat. 本篇研究總體評分對剩餘 8 個變數組成的單一總體尺度評估合意度的問題,. io. er. 使用加總尺度、因素分析和非線性主成分分析把 8 個變數整合成單一總體尺度的. al. 方法。單一總體尺度依照總體評分的滿意度比例藉由等級轉換法轉換為順序尺度,. n. v i n Ch 轉換成順序尺度的單一總體尺度與總體評分整理為列聯表, 應用此列聯表評估單 engchi U 一總體尺度與總體評分的滿意度之合意度,評估合意度的統計量分別為 RV、RC、. RP 和 MA。等級轉換法(rank transformation)為針對連續變數轉換為順序尺度變數 的方法,使用順序尺度的變數,依照順序尺度變數的比例分割排序後的連續變數。 表二十一以刪除遺漏值的資料為例子,先計算總體評分非常滿意、滿意、不滿意 和非常不滿意所對應的比例,藉由此比例之順序對排序後的因素分數做等比例分 割。. 36.

(37) 表二十一 因素分數與總體評分的列聯表 因素分數 滿意. 不滿意. 非常不滿意. 非常滿意. 26. 23. 4. 2. 滿意. 27. 127. 24. 6. 不滿意. 2. 32. 61. 36. 非常不滿意. 0. 2. 42. 93. 立. 政 治 大. 學 ‧. ‧ 國 io. sit. y. Nat. n. al. er. 總體評分. 非常滿意. Ch. engchi. i n U. v. 圖 5 2000 次補值加總尺度與總體評分之 MA、RV、RP 和 RC 的直方圖. 37.

(38) 表二十二 2000 次補值加總尺度與總體評分之 MA、RV、RP 和 RC 的彙整 最小值. 第一四分位數. 中位數. 平均數. 第三四分位數. 最大值. MA. 0.8717. 0.8896. 0.8929. 0.8927. 0.8960. 0.9084. RV. 0.0305. 0.0371. 0.0389. 0.0390. 0.0407. 0.0504. RP. 0.00647. 0.05559. 0.06085. 0.06016. 0.06572. 0.08572. RC. -0.04028. -0.01373. -0.00812. -0.00625. -0.00170. 0.06022. 表二十二為 2000 次補值加總尺度與總體評分之 MA、RV、RP 和 RC 的彙整,. 政 治 大 此組資料 MA 數值集中在 0.89 到 0.90,代表此組資料加總尺度與總體評分合意 立. 圖 5 為 2000 次補值加總尺度與總體評分之 MA、RV、RP 和 RC 的直方圖。發現. ‧ 國. 學. 度很高,意思為總體評分與加總尺度的滿意度很相似。RV 數值為評估隨機差異,. 此組資料 RV 值集中在 0.04 附近,所以由 RV 值評估幾乎無隨機差異。RP 數值. ‧. 為評估位置分布系統差異,此組資料 RP 集中在 0.06 附近,所以由 RP 值評估幾. y. Nat. 乎無位置分布系統差異,但 RP 值稍微偏向大於 0,代表總體評分滿意度稍微大. er. io. sit. 於加總尺度的滿意度。RC 數值為評估位置集中系統差異,此組資料 RC 集中在 0, 所以由 RC 值評估幾乎無位置分布系統差異,但 RC 值稍微偏向小於 0,代表總. n. al. Ch. 體評分滿意度稍微比加總尺度的滿意度不集中。. engchi. i n U. v. 因素分析由多序類相關係數取代皮爾生相關係數,本篇研究只需取 1 個因素, 藉由此因素的因素負荷可以評估重要的變數,因素負荷越高代表所對應的變數對 於此因素影響越大。為了評估此因素與總體評分的合意度,需要計算因素分數當 作單一總體尺度,此因素分數依照總體評分的滿意度比例藉由等級轉換法轉換為 順序尺度,因素分數與總體評分整理成列聯表的形式,用此列聯表評估因素分數 與總體評分的滿意度之合意度。. 38.

(39) 表二十三 因素負荷 第一次補值因素負荷. 第二次補值因素負荷. 第三次補值因素負荷. 2000 次補值平均因素負荷. 教育. 0.721. 0.697. 0.698. 0.704. 環境. 0.794. 0.793. 0.792. 0.793. 治安. 0.698. 0.695. 0.690. 0.696. 交通. 0.724. 0.731. 0.716. 0.724. 安全. 0.697. 0.647. 0.681. 0.692. 醫療. 0.698. 0.705. 0.697. 0.699. 旅遊. 0.708. 0.731. 經濟. 0.714. 立. 政 治 0.721 大 0.735 0.724. 0.708 0.731. ‧ 國. 學. 因素負荷可以用來評估對應之變數對於因素的貢獻能力,由表二十三的最後. ‧. 一行為 2000 次補值因素負荷平均值皆很接近 0.7,代表 8 個變數皆很重要,且. sit. y. Nat. 又以環境的變數的因素負荷高達 0.79,代表環境變數對於此因素較其它 7 個變. io. n. al. er. 數更為重要。表二十四為 2000 次補值平均多序類相關係數矩陣。. Ch. engchi. 39. i n U. v.

(40) 表二十四 2000 次補值平均多序類相關係數矩陣 教育. 環境. 治安. 交通. 安全. 教育. 1. 環境. 0.545. 1. 治安. 0.490. 0.548. 1. 交通. 0.481. 0.584. 0.520. 1. 安全. 0.445. 0.578. 0.501. 0.527. 1. 醫療. 0.494. 0.549. 0.499. 0.481. 0.489. 旅遊. 0.538. 0.575. 0.451. 經濟. 0.560. 0.552. 立0.508. 醫療. 經濟. 1. 政0.513治0.447大0.509 0.526. 旅遊. 0.498. 0.512. 1 0.523. 1. ‧ 國. 學. 表二十五 2000 次補值因素分數與總體評分之 MA、RV、RP 和 RC 的彙整. RC. -0.0021530. 0.8928. 0.8927. 0.8961. 0.9069. 0.0365. 0.0383. 0.0384. 0. 0.0003471. 0. al. 0. Ch. y. -0.0008921. 0.8894. sit. RP. 最大值. 0.0403. er. 0.0307. 第三四分位數. n. RV. 平均數. io. 0.8691. 中位數. Nat. MA. 第一四分位數. ‧. 最小值. v ni. i U e0n g c h0.0004795. 40. 0.0537. 0.0006097. 0.0023880. 0.0010710. 0.0037490.

(41) 立. 政 治 大. ‧. ‧ 國. 學 er. io. sit. y. Nat. al. v. n. 圖 6 2000 次補值因素分數與總體評分之 MA、RV、RP 和 RC 的直方圖. Ch. engchi. i n U. 表二十五為 2000 次補值因素分數與總體評分之 MA、RV、RP 和 RC 的彙整, 圖 6 為 2000 次補值因素分數與總體評分之 MA、RV、RP 和 RC 的直方圖。發現 此組資料 MA 數值集中在 0.89 到 0.90,代表此組資料因素分數與總體評分的合 意度很高,意思為總體評分與因素分數的滿意度很相似。RV 數值為評估隨機差 異,此組資料 RV 值集中在 0.04,所以由 RV 值評估幾乎無隨機差異。RP 數值為 評估位置分布系統差異,此組資料 RP 集中在 0 附近,所以由 RP 值評估幾乎無 位置分布系統差異,但 RP 值稍微偏向小於 0,代表總體評分的滿意度稍微小於 因素分數的滿意度。RC 數值為評估位置集中系統差異,此組資料 RC 集中在 0, 41.

(42) 所以由 RC 值評估幾乎無位置分布系統差異,但 RC 值稍微偏向小於 0,代表總 體評分的滿意度稍微比因素分數之滿意度不集中。. 非線性主成分分析為同質性分析的衍生方法,藉由非線性主成分分析把總體 評分以外的 8 個變數整合成單一總體尺度,使用目標分數當作單一總體尺度。目 標分數依照總體評分的滿意度比例藉由等級轉換法轉換為順序尺度,藉由目標分 數與總體評分之滿意度的列聯表評估合意度。. 表二十六 2000 次補值目標分數與總體評分之 MA、RV、RP 和 RC 的彙整 中位數. 平均數. 第三四分位數. 最大值. MA. 0.8710. 0.8891. 0.8926. 0.8924. 0.8958. 0.9056. RV. 0.0313. 0.0363. 0.0381. 0.0383. RP. -0.001243. 0. 0. RC. -0.002149. 0. 0. 0.0522. 0.000240. 0.000450. 0.002735. 0.000362. 0.001068. 0.003850. io. y. sit. Nat. 0.0401. n. al. er. ‧ 國. 立. ‧. 第一四分位數. 學. 最小值. 政 治 大. Ch. engchi. 42. i n U. v.

(43) 立. 政 治 大. ‧. ‧ 國. 學 sit. y. Nat. n. al. er. io. 圖 7 2000 次補值目標分數與總體評分之 MA、RV、RP 和 RC 的直方圖. Ch. engchi. i n U. v. 表二十六為 2000 次補值目標分數與總體評分之 MA、RV、RP 和 RC 的彙整, 圖 7 為 2000 次補值目標分數與總體評分之 MA、RV、RP 和 RC 的直方圖。發現 此組資料 MA 數值集中在 0.89 到 0.90,代表此組資料目標分數與總體評分合意 度很高,意思為目標分數與總體評分的滿意度很相似。RV 數值為評估隨機差異, 此組資料 RV 值集中在 0.03 到 0.04,所以由 RV 值評估幾乎無隨機差異。RP 數 值為評估位置分布系統差異,此組資料 RP 集中在 0 附近,所以由 RP 值評估幾 乎無位置分布系統差異,但 RP 值稍微偏向小於 0,代表總體評分的滿意度稍微 小於目標分數的滿意度。RC 數值為評估位置集中系統差異,此組資料 RC 集中在 0,所以由 RC 值評估幾乎無位置分布系統差異,但 RC 值稍微偏向小於 0,代表 43.

(44) 總體評分的滿意度稍微比目標分數的滿意度不集中。. 接下來為刪除遺漏值的資料,使用加總尺度、因素分數和目標分數為單一總 體尺度並與總體評分整理為列聯表,用此列聯表評估 MA、RV、RP 和 RC。. 表二十七 刪除遺漏值的資料加總尺度與總體評分的 MA、RV、RC 和 RP. MA. RV. RC. RP. 0.8962. 0.0399. 0.040714. 0.053289. 政 治 大 表二十八 刪除遺漏值資料的多序類相關係數矩陣 立 環境. 治安. 交通. 安全. 醫療. 旅遊. 經濟. 學. 1. 環境. 0.609. 1. 治安. 0.573. 0.629. 1. 交通. 0.537. 0.679. 0.567. 安全. 0.501. 0.644. 醫療. 0.589. 旅遊. 0.637. 0.651. 0.490. 0.534. 0.516. 0.583. 1. 經濟. 0.672. 0.669. 0.610. 0.619. 0.625. 0.6211. 0.595. sit. y. ‧. 教育. Nat. ‧ 國. 教育. 1. er. io. n. a l0.601 0.656 1 v i n C h 0.561 0.584U 1 0.642 0.602 engchi. 1. 表二十七為刪除遺漏值資料的多序類相關係數矩陣,發現補值 2000 次平均多序 類相關係數矩陣(表二十四)有些落差。且刪除遺漏值資料的相關係數大於 2000 次補值的平均相關係數,所以刪除遺漏值資料會比 2000 次補值資料相關性更高, 導致因素負荷值會有差異。. 44.

(45) 表二十九 刪除遺漏值資料的因素負荷和 2000 次補值平均因素負荷 2000 次補值平均因素負荷. 刪除遺漏值資料的因素負荷. 教育. 0.704. 0.719. 環境. 0.793. 0.795. 治安. 0.696. 0.717. 交通. 0.724. 0.725. 安全. 0.692. 0.6930. 醫療. 0.699. 0.709. 旅遊. 立. 經濟. 政0.708治 大 0.731. 0.719 0.736. ‧ 國. 學. 由表二十九發現刪除遺漏值的因素負荷值普遍稍高於 2000 次補值平均因素負荷,. ‧. 因此藉由相關係數矩陣和因素負荷計算因素分數,導致 2000 次補值補值資料與. er. io. sit. y. Nat. 刪除遺漏值資料計算出的因素分數會有些差異。. 表三十 刪除遺漏值資料的因素分數與總體評分之 MA、RV、RC 和 RP. n. al. MA 0.8969. Ch RV e. ngchi. 0.0383. i n RCU 0. v. RP 0. 表三十一 刪除遺漏值資料的目標分數與總體評分之 MA、RV、RC 和 RP. MA. RV. RC. RP. 0.8994. 0.0370. 0. 0. 45.

(46) 圖 8、圖 9、圖 10 和圖 11 分別為 2000 次補值加總尺度、因素分數和目標 分數之 MA、RV、RP 和 RC 的盒鬚圖,直線為刪除遺漏值資料的加總尺度、因素 分數和目標分數之 MA、RV、RP 和 RC。. 立. 政 治 大. ‧. ‧ 國. 學 y. Nat. n. al. er. io. 漏值資料的 MA. sit. 圖 8 2000 次補值加總尺度、因素分數和目標分數的 MA 盒鬚圖,直線為刪除遺. Ch. engchi. 46. i n U. v.

(47) 立. 政 治 大. 圖 9 2000 次補值加總尺度、因素分數和目標分數的 RV 盒鬚圖,直線為刪除遺. ‧ 國. 學. 漏值資料的 RV. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 10 2000 次補值加總尺度、因素分數和目標分數的 RP 盒鬚圖,直線為刪除遺 漏值資料的 RP. 47.

(48) 立. 政 治 大. 圖 11 2000 次補值加總尺度、因素分數和目標分數的 RC 盒鬚圖,直線為刪除遺. ‧. ‧ 國. 學. 漏值資料的 RC. y. Nat. 圖 8 發現 2000 次補值的 MA 普遍低於刪除遺漏值資料的 MA,但整體來說 2000. er. io. sit. 次補值的 MA 與刪除遺漏值資料的 MA 相差 0.03 左右。圖 9 發現 2000 次補值加總 尺度 RV 會降低隨機差異,而目標分數會上升隨機差異。由圖 10 和圖 11 發現 2000. al. n. v i n 次補值加總尺度 RP 和 RC 普遍低於刪除遺漏值的資料之 RP 和 RC,但因素分數 Ch engchi U. 與目標分數相反。對於加總尺度、因素分數和目標分數的 RP 和 RC 差異其實不 大,尤其因素分數和目標分數的差異幾乎為零。因為我們使用等級轉換法,所以 兩順序尺度邊際分配個數差異不大,導致 RP 和 RC 皆很小。且因素分數藉由因 素負荷和相關係數矩陣計算,增加了因素分數發生值個數,而目標分數藉由最小 化損失函數逼近求得,增加目標分數發生值個數,因數分數與目標分數皆有 769 個發生值個數,但加總尺度藉由加總變數回應值在轉換成 0-100 分,因此只有 25 個發生值個數,所以使用等級轉換法時,導致加總尺度轉換不太好,意思為 加總尺度與總體評分邊際分配不太相同。. 48.

(49) 第四章 模擬研究 本篇使用 EM 填補遺漏值,我們欲觀察 EM 對於填補遺漏資料隨著遺漏比例 增加時,其補值對於真實資料的差異大小。Schafer(1997)提出當遺漏值比例為 5%以下時,刪除遺漏值發生的整筆資料為適當的方法,因此我們將模擬遺漏比 例為 5%、10%和 15%。. 我們使用第三章所使用的刪除遺漏值資料當作模擬使用的真實資料,並且使 此資料依照 5%、10%和 15%的遺漏比例隨機遺漏值發生的位置,藉由此方法分. 政 治 大 的位置的資料使用 EM 方法填補遺漏值各 10 次,藉由加總尺度、因素分析和非 立. 別產生 100 個遺漏值發生在不同位置的資料。分別對 100 個遺漏值發生在不同. ‧ 國. 學. 線性主成分分析將總體評分之外 8 個變數整合為單一總體尺度,接下來使用等級 轉換法將加總尺度、因素分數和目標分數轉換為順序尺度,引用 Svensson(2012). ‧. 提出 MA 和 RV 評估兩順序尺度變數的合意度,因此每一個遺漏值發生在不同的. sit. y. Nat. 位置的資料皆產生 10 個 MA 和 RV,將此各 10 次 MA 和 RV 取平均數與刪除遺. n. al. er. io. 漏值資料的真實 MA 和 RV 相比較。. Ch. engchi. 49. i n U. v.

(50) 第一節 5%遺漏比例. 立. 政 治 大. ‧ 國. 學. 圖 12 5%遺漏比例下補值 MA 盒鬚圖,直線為刪除遺漏值的資料之 MA. ‧. y. Nat. 由圖 12 發現當遺漏值比例為 5%時,EM 補值 MA 普遍高於刪除遺漏值的資料之. n. er. io. al. sit. MA,但整體來講 MA 差異不大。. Ch. engchi. 50. i n U. v.

(51) 立. 政 治 大. 圖 13 5%遺漏比例下補值 RV 盒鬚圖,直線為刪除遺漏值的資料之 RV. ‧ 國. 學. 由圖 13 發現當遺漏值比例為 5%時,EM 補值 RV 普遍低於刪除遺漏值的資料之. ‧. RV,意思為 EM 補值會降低隨機差異,但整體來講 RV 差異不大。. n. er. io. sit. y. Nat. al. Ch. engchi. 51. i n U. v.

(52) 第二節 10%遺漏比例. 立. 政 治 大. ‧ 國. 學. 圖 14 10%遺漏比例下補值的 MA 盒鬚圖,直線為刪除遺漏值的資料之 MA. ‧. 由圖 14 發現當遺漏值比例為 10%時,EM 補值的 MA 普遍高於刪除遺漏值的資. sit. y. Nat. 料之 MA,但整體來講 MA 差異比 5%遺漏比例稍微變大,且目標分數的 MA 會. n. al. er. io. 出現幾個偏低的離群值。. Ch. engchi. 52. i n U. v.

(53) 立. 政 治 大. 圖 15 10%遺漏比例下補值的 RV 盒鬚圖,直線為刪除遺漏值的資料之 RV. ‧ 國. 學. 由圖 15 發現當遺漏值比例為 10%時,EM 補值的 RV 普遍低於刪除遺漏值的資. ‧. 料之 RV,但整體來講 RV 差異比 5%遺漏比例稍微變大,且目標分數的 RV 會出. n. al. er. io. sit. y. Nat. 現幾個偏高的離群值。. Ch. engchi. 53. i n U. v.

(54) 第三節 15%遺漏比例. 立. 政 治 大. ‧ 國. 學 ‧. 圖 16 15%遺漏比例下補值的 MA 盒鬚圖,直線為刪除遺漏值的資料之 MA. y. Nat. sit. 由圖 16 發現當遺漏值比例為 15%時,EM 補值的幾乎高於刪除遺漏值的資料之. n. al. er. io. MA,但整體來講 MA 差異比 10%遺漏比例稍微變大,且目標分數的 MA 會出現 更多偏低的離群值。. Ch. engchi. 54. i n U. v.

(55) 政 治 大. 立. 圖 17 15%遺漏比例下補值的 RV 盒鬚圖,直線為刪除遺漏值的資料之 RV. ‧ 國. 學. 由圖 17 發現當遺漏值比例為 15%時,EM 補值的幾乎低於刪除遺漏值的資料之. ‧. RV,但整體來講 RV 差異比 10%遺漏比例稍微變大,且目標分數的 RV 會出現更. y. Nat. n. al. er. io. sit. 多偏高的離群值。. i n U. v. 表三十二 5%、10%和 15%遺漏比例加總尺度、因素分數和目標分數各自 MA 平均. Ch. MA e n g因素分數平均 chi. 加總尺度平均 MA. 目標分數平均 MA. 5%遺漏比例. 0.9018. 0.9023. 0.9023. 10%遺漏比例. 0.9067. 0.9077. 0.9047. 15%遺漏比例. 0.9088. 0.9099. 0.8947. 55.

(56) 表三十三 5%、10%和 15%遺漏比例加總尺度、因素分數和目標分數各自 MA 中 位數 加總尺度 MA 中位數. 因素分數 MA 中位數. 目標分數 MA 中位數. 5%遺漏比例. 0.9019. 0.9019. 0.9021. 10%遺漏比例. 0.9069. 0.9083. 0.9069. 15%遺漏比例. 0.9089. 0.9096. 0.9074. 表三十四 5%、10%和 15%遺漏比例加總尺度、因素分數和目標分數各自 RV 平均 加總尺度平均 RV 5%遺漏比例. 因素分數平均 RV. 目標分數平均 RV. 政 治0.03447 大 0.03249 0.03131 立. 0.03490. 0.03083. 0.04669. 0.03582. 10%遺漏比例. ‧ 國. 0.02982. 學. 15%遺漏比例. 0.03437. y. 0.03484. 目標分數 RV 中位數. er. sit. 0.03612. 0.03117 v a0.03228 i l C n 0.03053h e i U n g c h0.02985. n. 15%遺漏比例. 因素分數 RV 中位數. io. 10%遺漏比例. 加總尺度 RV 中位數. Nat. 5%遺漏比例. ‧. 表三十五 5%、10%和 15%遺漏比例加總尺度、因素分數和目標分數各自 RV 中 位數. 0.03506 0.03179 0.03080. 由表三十二和表三十三發現隨著遺漏比例增加,加總尺度與因素分數 MA 值也越 大,但由表三十四和三十五發現 RV 卻下降。而目標分數也大致上隨著遺漏比例 增加,MA 值也會越大但偏低的 MA 離群值個數也增加,RV 也會隨著遺漏比例增 加而下降,但偏高 RV 離群值個數也增加。. 56.

(57) 第五章 結論 對於遺漏比例偏高的資料,藉由填補遺漏值的方法會比刪除遺漏值的方法更 佳適合,而 EM 是最大化完整資料的概似函數的方法,不會像填補平均數導致變 異數變小的問題或迴歸預測值填補遺漏值導致變異數膨脹,藉由 EM 填補遺漏值 時,樣本數盡量遠大於變數所組成的列聯表格子數,避免造成列聯表的發生次數 為零,導致 EM 無法執行。. 藉由加總尺度、因素分析和非線性主成分分析將多個變數整合為單一總體尺. 政 治 大 例變高時(15%以內),導致 立MA 值越高,意思為 EM 填補遺漏值時,會增強變數 度,並使用等級轉換法轉成順序尺度變數,其 MA 值皆差異不大,但隨著遺漏比. ‧ 國. 學. 之間的合意度,但對於非線性主成分分析會發生更多偏低的 MA 離群值。而隨著 遺漏比例變高時(15%以內),加總尺度與因素分析的 RV 稍微變小,但非線性主. ‧. 成分分析會發生更多偏高的 RV。對於 RP 與 RC 因為藉由等級轉換法導致邊際次. n. al. er. io. sit. y. Nat. 數大致相同,所以其值皆不大。. Ch. engchi. 57. i n U. v.

(58) 參考文獻 Carroll, J. B. (1961). The nature of the data, or how to choose a correlation coefficient. Psychometrika, 26(4), 347-372. Chen, T., & Fienberg, S. E. (1974). Two-dimensional contingency tables with both completely and partially cross-classified data. Biometrics, 629-642. 3104-3117. De Leeuw, J., & Mair, P. (2009). Gifi methods for optimal scaling in R: The package homals. Journal of Statistical Software, forthcoming, 1-30.. 政 治 大 scores: Considerations for立 the applied researcher. Practical Assessment, Research DiStefano, C., Zhu, M., & Mindrila, D. (2009). Understanding and using factor. ‧ 國. 學. & Evaluation, 14(20), 1-11.. Everitt, B., & Hothorn, T. (2011). An introduction to applied multivariate analysis. ‧. with R. Springer.. sit. y. Nat. Fuchs, C. (1982). Maximum likelihood estimation and model selection in. er. io. contingency tables with missing data. Journal of the American Statistical. Association, 77(378), 270-278. a. n. iv l C n hQuality Fayers, P., & Machin, D. (2007). the assessment, analysis and e n g ofc hlife:i U interpretation of patient-reported outcomes. John Wiley & Sons. Gifi, A. (1990). Homogeneity analysis. Nonlinear multivariate analysis. Chichester:. John Wiley & Sons. Hochberg, Y. (1977). On the use of double sampling schemes in analyzing categorical data with misclassification errors. Journal of the American Statistical. Association, 72(360a), 914-921. Kuroda, M., Mori, Y., Masaya, I., & Sakakihara, M. Alternating least squares in nonlinear prin-cipal components. 58.

(59) Little, R. J., & Rubin, D. B. (1989). The analysis of social science data with missing values. Sociological Methods & Research, 18(2-3), 292-326. Olsson, U. (1979). Maximum likelihood estimation of the polychoric correlation coefficient. Psychometrika, 44(4), 443-460. Svensson, E. (2000). Comparison of the quality of assessments using continuous and discrete ordinal rating scales. Biometrical Journal, 42(4), 417-434. Svensson, E., & Holm, S. (1994). Separation of systematic and random differences in ordinal rating scales. Statistics in medicine, 13(23‐24), 2437-2453. Schafer, J. L. (2010). Analysis of incomplete multivariate data. CRC press.. 政 治 大 Svensson, E. (2012). Different ranking approaches defining association and 立. agreement measures of paired ordinal data. Statistics in medicine, 31(26),. ‧ 國. 學. 3104-3117.. ‧. Tallis, G. M. (1962). The maximum likelihood estimation of correlation from. S.. y. (2006).. The. tetrachoric. and. polychoric. io. sit. J.. er. Uebersax,. Nat. contingency tables. Biometrics, 18(3), 342-353.. coefficients.Statistical methods for rater agreement web site, 2006.. n. al. Ch. engchi. 59. i n U. v. correlation.

(60)

參考文獻

相關文件

評分項目 2分 1分 0分 小組討論 1.認真參與討論.

是所有正向指標中最低者;其次是「製造業與營造業合計之固定資 本形成之變動率」與「製造業與營造業合計之 GDP 成長率」,二者 的平均值分別為 5.10 分與 5.13

(2)依評選項目表所列之評選項目、權重、配分標準評分。評選委員之評分以 100 分為滿分,平均 70 分(含)以上者為合格分數,惟如出席評選委員之過

機器常數machine epsilon,以ϵmach表示,其值為1和比 1大的最小浮點數之間的距離。以下表格為IEEE 754浮點 數標準中各部份所佔的位元數: 精準度類型 符號部分 指數部分

3.8.2 學校自評多以教師和學生的觀感作為成效 指標,流於主觀,學校及科組仍未能完全掌握運

行為評估:收集護理病歷、身 體檢查、糞便性、實驗室檢查 (大便標本收集)、診斷性檢查 等資料.

注意事項 十一、 營養的需要..

學校概況 評鑑項目一 評鑑項目二 評鑑項目三 評鑑項目四 總結 36