• 沒有找到結果。

以連續及順序尺度測量滿意程度的合意度分析 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "以連續及順序尺度測量滿意程度的合意度分析 - 政大學術集成"

Copied!
65
0
0

加載中.... (立即查看全文)

全文

(1)國立政治大學統計學系 碩士學位論文. 以連續及順序尺度測量滿意程度的合意度分析 Agreement analysis政of satisfaction rating data 治. 大. 立 using continuous and ordinal scales ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 指導教授:鄭宗記 博士 研究生:賴柏華 撰. 中華民國一百零三年七月.

(2) 謝辭 口試完後這也到代表研究生生活也告了一個段落,回想起碩一剛進入政大統 研所,感謝宜蓉學姊在研究生生活中對我幫助良多,引薦我能在開學前就認識到 鄭宗記老師,讓我能提早起步準備論文,感謝老師這兩年來的教導與鼓勵,由於 資質駑鈍有時會受到老師的指責,但是我知道老師的本意是希望我能做的更好, 不僅僅只教導我學術上的知識,也教導了我許多做人的道理,提醒我未來進入職 場時要注意的問題。在此想跟老師說聲謝謝您,您辛苦了。 還要感謝全體碩士班同學,在這兩年的陪伴經過讓我的到許多的歡樂與幫助,. 政 治 大. 謝謝嘉煒、尚文、怡萱和裕景學長在做論文的過程中經常被我打擾還不厭其煩地. 立. 幫助我,謝謝施俞安教導我許多論文製作的技巧,謝謝維屏、憲哥、柏錞、范范. ‧ 國. 學. 學妹和瓢蟲學弟經常陪伴我打電動使我能忘卻做論文時的煩惱,謝謝建佑、朝逸、. ‧. 東穎和軒哥平時的熱心幫助,謝謝神魔之塔使我們班上更有凝聚力,讓大家經常 來研究室談天說地,一起努力做論文。謝謝佩嘉、欣慧、雅婷、郁芳等人經常在. y. Nat. io. sit. 研究室製造歡樂,還有謝謝一起做論文的好夥伴柏魁,和謝謝處處幫忙的楊文敏. n. al. er. 助教,希望大家畢業以後還能經常聯絡。. Ch. i Un. v. 最後謝謝從小照顧我的家人,由其是爸爸、媽媽和弟弟平時的鼓勵與支持,. engchi. 沒有你們細心的照顧、培養與陪伴就沒有今天的我,謝謝 Cindy 在論文的幫助和 平常談心,幫我調適壓力與情緒,和處處體諒我,謝謝你們。 祝福各位身體健康,心想事成。. 賴柏華 101/07/23 書於政大.

(3) 摘要 此篇文章中探討成對資料的合意度分析,影響合意度的好壞分為系統差異 (System Difference)和隨機差異(Random Difference)兩種,使用 Svensson and Holm (1994)提出的 RP、RC 等統計量,與 Cohen(1960)的 Kappa、Kendall(1938)的 Kendall’s W 等廣泛被使用的合意度指標,並配合 ROC 曲線進行資料分析。 本文分析具遺漏值的資料(incomplete-data),並且著重在變數同時包含連續型 和類別型的混合型情況,使用 Schafer(1997)中 EM 和衍生出的資料增廣(Data. 政 治 大 料的合意度進行分析。從幾次的模擬結果,可得知填補遺漏值後與實際狀況的差 立. augmentation)等方法求取參數的估計值,並且對遺漏值進行資料插補,進而對資. ‧ 國. 學. 異相當小;如經過給予限制條件的模型得到變異較不穩定的情況,可在未來的研 究當中先對所有的資料更加了解,再使用資料增廣與貝氏結合的方法(Data. ‧. augmentation Bayesian IPF)做分析。. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v.

(4) Abtract This paper focuses on exploring the agreement analysis between the paired ordinal and continuous data. According to Svensson and Holm (1994), the two systematic differences that define the paired data disagreement are System Difference and Random Difference. In addition, RP and RC statistics (Svensson and Holm, 1994) have been applied with Kappa (Cohen, 1960) and Kendall’s W (Kendall, 1938), which have been widely used in past research, to analyze the paired data with the support of the ROC curve.. 政 治 大 The focus of the analysis of the paired ordinal and continuous data is on the 立. ‧ 國. 學. missing values, which is defined as the incomplete data. Thus, the imputation method used on the above mentioned incomplete data is EM and Data Augmentation by. ‧. Schafer (1997). The simulation showed acceptable results; however, still leaving room. sit. y. Nat. for more improvement. For future research, it is advised to use restricted models.. n. al. er. io. Therefore, it is best to first have a better understanding of the data to be analyzed and. v. then to analyze the data with Data Augmentation Bayesian IPF (Schafer, 1997).. Ch. engchi. i Un.

(5) 目錄 第一章、緒論................................................................................................................ 1 第二章、文獻探討........................................................................................................ 2 第一節 傳統統計方法.......................................................................................... 2 第二節 常用合意度判斷統計量.......................................................................... 5 第三節 增廣等級化(Augmented ranking) ........................................................... 6 第四節 隨機差異和系統差異.............................................................................. 8. 政 治 大 第三章、資料補值之正確性模擬.............................................................................. 24 立 第五節 不完整資料處理(Incomplete data processing) ..................................... 18. ‧ 國. 學. 第一節、基本資料分析...................................................................................... 24 第二節、資料模擬.............................................................................................. 38. ‧. 第四章、實證分析...................................................................................................... 47. sit. y. Nat. 第一節、資料介紹.............................................................................................. 47. er. io. 第二節、補值與合意度分析.............................................................................. 50. al. iv n C hengchi U 參考文獻...................................................................................................................... 55 n. 五、結論...................................................................................................................... 54. 附錄.............................................................................................................................. 57. I.

(6) 表目錄 表 1、兩評分者給予申請獎學金同學是否通過 ........................................................ 5 表 2、病患自我評估(X)和醫生評估(Y)的 58 筆樣本 ................................................ 6 表 3、病患自我評估(X)和醫生評估(Y), X、Y 分別使用增廣等級化如括號 ....... 7 表 4、經過 RTPA 後的病患自我評估(X)和醫生評估(Y)的 58 筆樣本 .................... 8 表 5、神經放射研究員 A 和 B 在調查腦水腫病患的嚴重程度所打的分數 .......... 9 表 6、研究員 A 和 B 在調查腦水腫病患的嚴重程度所打的分數(經過 RTPA) ..... 9 表 7、研究員 A 和 B 調查腦水腫病患的嚴重程度所打的分數 RTPA 輔助表 ..... 10. 政 治 大. (A) (B) 表 8、研究員 A 和 B 調查腦水腫病患的嚴重程度,括號代表增廣等級值 ( Rij , Rij ). 立. ............................................................................................................................. 11. ‧ 國. 學. 表 9、神經放射研究員 A 和 B 在調查腦水腫病患的嚴重程度評分 .................... 15 表 10、四組不同資料但邊際數目皆相同 ................................................................ 17. ‧. 表 11、性別變數資料 ................................................................................................ 24. y. Nat. io. sit. 表 12、滿意度變數資料 ............................................................................................ 25. n. al. er. 表 13、學歷變數資料 ................................................................................................ 25. Ch. i Un. v. 表 14、年齡變數資料 ................................................................................................ 26. engchi. 表 15、無遺漏值資料經過等級轉換後的矩陣 ........................................................ 27 表 16、無遺漏值資料經過常態分數轉換後的矩陣 ................................................ 28 表 17、無遺漏值資料分別使用兩種轉換方式後所做出各類統計量 .................... 29 表 18、不同年齡所給滿意度評分的 F 檢定 ............................................................ 32 表 19、使用年齡來分類再經由等級轉換後所做出各類統計量 ............................ 33 表 20、使用年齡來分類再經由常態分數轉換後所做出各類統計量 .................... 33 表 21、不同學歷所給滿意度評分的 F 檢定 ............................................................ 35 表 22、先使用學歷來分類再經由等級轉換後所做出各類統計量 ........................ 35 表 23、先使用學歷來分類再經由常態分數轉換後所做出各類統計量 ................ 36 II.

(7) 表 24、年齡和學歷變異數分析表 ............................................................................ 37 表 25、填補遺漏值後模擬 500 次之統計量摘要表 ................................................ 39 表 26、給定滿意度評分為遺漏值各別變數各選項的個數及比例 ........................ 48 表 27、給定滿意度為遺漏值各別變數各選項的個數及比例 ................................ 49. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. III. i Un. v.

(8) 圖目錄 圖 1、兩觀測者給予評分的 ROC 曲線 .................................................................... 14 圖 2、兩觀測者給予評分的 ROC 曲線 .................................................................... 16 圖 3、系統差異和隨機差異判斷流程圖 .................................................................. 18 圖 4、滿意度評分變數資料 ...................................................................................... 26 圖 5、給定滿意度下性別與滿意度評分圖 .............................................................. 30 圖 6、年齡與滿意度評分圖 ...................................................................................... 32 圖 7、學歷與滿意度評分圖 ...................................................................................... 35. 政 治 大 圖 9、1%遺漏值模擬 500 次使用等級轉換後各統計量箱型圖............................. 40 立 圖 8、給定不同年齡下學歷與滿意度評分箱型圖 .................................................. 37. ‧ 國. 學. 圖 10、1%遺漏值模擬 500 次各統計量箱型圖....................................................... 41 圖 11、5%遺漏值模擬 500 次各統計量箱型圖 ....................................................... 42. ‧. 圖 12、10%遺漏值模擬 500 次各統計量箱型圖..................................................... 43. sit. y. Nat. 圖 13、1%遺漏值模擬 2000 筆各統計量的箱型圖(其中三次) .............................. 46. n. al. er. io. 圖 14、模擬 5000 次經等級轉換後各統計量箱型圖 .............................................. 51. i Un. v. 圖 15、模擬 5000 次經常態分數轉換後各統計量箱型圖 ...................................... 53. Ch. engchi. IV.

(9) 第一章、緒論 這個世紀是個科技數位的時代,資訊的發達電腦發明、網際網路到雲端,電 腦科技和人們的關係愈來愈緊密,數據分析正成為近年來備受矚目的新概念,也 將是未來發展的趨勢,數據分析是通過建立模型對數據進行核對、檢查、判斷等 操作,將被審計單位數據的現實狀態與理想狀態進行比較,目的是把隱藏在一堆 看來雜亂無章的數據中的訊息集中和萃取出來,以找出所研究對象的規律以幫助 人們作出判斷,以便採取適當行動。. 治 政 大 合意度理論在數據的分析經常使用到,像是在消費者對產品評價與產品代言 立. 人給予的評價,如果消費者與產品介紹人的態度的合意度高,就表示廣告宣傳是. ‧ 國. 學. 有利,這理論在心理學、醫學等其他許多領域也是經常會使用到。第二章文獻探. ‧. 討中會提到 Svensson and Holm (1994)所提出多種合意度判別方法和 Cohen(1960). sit. y. Nat. 的 Kappa 和 Kendall et al. (1939)的 Kendall’s W 等合意度判別統計量來比較,並且. io. al. er. 將資料的合意度影響因素分為系統差異和隨機差異,當中也運用到受試者操作特. n. 徵曲線(ROC curve)的趨勢判別當中合意度不佳的原因。. Ch. engchi. i Un. v. 在做資料分析時常常會遇到資料遺失的狀況,如果擁有大量的樣本資料時, 刪去資料中包含遺漏值的筆數,只採用無遺漏值的部分,此時分析結果比較不會 受遺漏值影響,但如果資料筆數不多,刪去有遺漏值的資料或刪去包含遺漏值眾 多的變數都有可能會造成許多資訊的遺失,因此對於資料做出適當的填補就能將 所遺失的資訊收回,在第二章的第五節中將會提到所使用到的最大期望演算法 (Expectation-maximization algorithm)和資料增廣法(data augmented)等不完整資料 的處理方法。而補值得結果是個值得探討的問題,會在第三章進行填補遺漏值得 模擬,進而驗證所使用的補值方法是否會與實際資料有所差異,經過第三章的模 擬後,在第四章將會對實際資料做分析。 1.

(10) 第二章、文獻探討 第一節 傳統統計方法 本文探討方向為處理成對順序資料(ordinal data)並討論其合意度,可用在判 別同一位評分者在給予兩個不同問題評分時的合意度狀況,或用來調查同一個問 題經由評分者來評分和專家所給的評分的合意度狀況,諸如此類等狀況都是可以 用到接下來所述多種方法來做判別,Svensson (2012)中提到的方法包含有和無事 先經過等級化(rank)後再做分析,首先在此節先討論的方法為先將資料做等級轉. 政 治 大. 換後再作分析,在二、三節會再討論不經由等級化的方法和 Svensson (2012)提出. 立. 之方法。. ‧ 國. 學. (一)斯皮爾曼等級相關(Spearman rank-order correlation coefficient). ‧. 對於分析順序資料一種常見的方法就是使用等級順序統計量(rank-order statistic),此即是將一筆有順序資料依照大小排序也就是等級化,定義為. y. Nat.  rn ,而 Fieller et al. (1957) 提到斯皮爾曼等級相關. io. sit. , n ,其中 r1  r2 . er. rk , k  1,. al. v. n. 為傳統使用等級化判別兩個變數之間的相關性方法,也就是將原始資料中的兩個. Ch. engchi. i Un. 有順序變數 X 和 Y 分別等級轉換成 rk( X ) 和 rk(Y ) 其中 k  1,. , n,再應用皮爾森相關. 係數(Pearson correlation)得到公式 n. rsp .  (r. (X ) k. k 1. n.  (r k 1. (X ) k.  r ( X ) )(rk(Y )  r (Y ) ). r. (2.1.1). n. (X ) 2. ).  (r k 1. (Y ) k. r. (Y ) 2. ). n. i 1. 6 d k2. v 1. n n. 其中 ri   xv  ( xi  1) / 2 ,此公式亦可表示為 rs  1 . k 1 3. ,其中 dk  rk( X )  rk(Y ) ,. 但此公式僅適用於連續型資料,也就是同一個評分者沒有給予相同評分(untied) 的一組資料,其中評分者給予相同評分(tied)表示我們有一位評分者對於 10 筆資 2.

(11) 料的評分為 1,2,3,4,5,5,5,6,7,7 則此評分者給有給予三個 5 分和兩個 7 分,在此有 給予同樣分數的資料我們稱為評分者有給予相同評分的資料。要是有一個或一對 資料有大量比例評分者給予相同評分的話,都會導致相關係數擴大,於是對於有 發生評分者給予相同評分的資料做了改進,稱為評分者給予相同分數下之斯皮爾 曼等級相關(Spearman rank-order correlation coefficient adjusted for tied rank)的公 式 rsp ' 為. rsp ' . m m 1 n3  n  6 ( xij dij2 )  (t ( X )  t (Y ) ) 2 i 1 j 1. (2.1.2). (n3  n) 2  (t ( X )  t (Y ) )(n3  n)  t ( X )t (Y ). 政 治 大 其中 t   ( x  x ) 、 m 為尺度個數、 d  (r  r ) 。 立 m. 2 ij. v. (X ). (Y ) 2 ij. 學. ‧ 國. v 1. 3 v. (二)肯德爾和諧係數(Kendall's coefficient of concordance). ‧. Kendall et al. (1939)、Fieller et al. (1957)和 Rhodes et al. (2000)提到肯德爾和 諧係數又稱 Kendall’s W,是計算多個尺度變數相關程度的合意度。相較於前述的. y. Nat. io. sit. 斯皮爾曼等級相關是討論兩個等級變數的相關程度,用於評定合意度時只適用於. n. al. er. 兩個評分者評價 n 個樣本,或同一個人先後兩次評價 n 個樣本,而肯德爾和諧係. Ch. i Un. v. 數則可以適用於數據資料屬於多列相關的順序資料,即可以是 k 個評分者評定 n. engchi. 個樣本,也可以是同一個人先後 k 次評此 n 個樣本。通過計算肯德爾和諧係數, 可以較為客觀地選擇好的樣本或好的評分者。 使用 W 表示肯德爾和諧係數,如(2.1.1)斯皮爾曼等級相關,此時肯德爾 和諧係數一樣也分為兩種情況,由是否發生同一位評分者給予相同評分的情況可 分為兩種公式: (1)同一評價者無給予相同等級評定時,W 的公式為. W. 12S k ( n 3  n) 2. 3. (2.1.3).

(12) n. 其中 n 表示被評定的樣本個數,k 表示評分者個數, S   ( Ri  R )2 表示等級轉 i 1. k. 換後的 n 個樣本的等級化後分數總合差的平方和,其中 Ri   ri , j 表示第 i 個樣 j 1. 本經由 k 個評分者所給分數再經過等級化後的分數總合,ri , j 表示地 j 位評分者對 第 i 個樣本所給分數經過等級化後的分數,而 R . 1 k (n  1) 表示 n 個樣本等級化 2. 後分數總合的平均。 (2)同一評價者有給予相同等級評定時,W 的公式為 12S. W. (2.1.4). k. k ( n  n)  k  T j 2. 3. 政 治 大 j 1. 立. gj. 其中 T j   (tl3  tl ) 用來修正有評分者給予相同評分的問題, g j 為第 j 個評分者. ‧ 國. 學. l 1. 所給分數中有給予相同評分情況的組數, tl 為第 l 組中評分者給予相同評分的個. ‧. 數,若對於評定結果無相同等級的評價則 T j  0 ,因此只須對評定結果有相同等. sit. y. Nat. io. n. al. er. 級的評價者計算 T j 。. Ch. i Un. v. 當評分者人數 k 介於 3 到 20 之間,樣本數 n 介於 3 到 7 之間時,可查肯德. engchi. 爾和諧係數 W 顯著性臨界值表如附錄,檢驗 W 是否有達到顯著的水準。若實際 計算的 S 值大於表內臨界值,則 W 達到顯著水準,表示評定者意見合意度高。 當樣本數 n>7 時,則可用下方的 x 2 統計量對 W 是否達到顯著水平作檢驗。 令 H 0 :評價者意見合意度差. x2  k (n  1)W H0 若 x2  x12 (n  1) 則拒絕 H 0 ,認為評分者的意見合意度高,若 x2  x12 (n  1) 則無 足夠證據拒絕 H 0 ,認為評分者的評判合意度不佳。. 4.

(13) 第二節 常用合意度判斷統計量 以上方法都是先經由 rank 轉換後再來進行運算,現在提到 Kappa 這個係數 乃是較為廣泛被接受用來判斷合意度的統計量,由 Cohen(1960)所提出的公式為. K m. 其中 Pr(a)   i 1. xii ,i  1, n. Pr(a)  Pr(e) 1  Pr(e). (2.2.1). , m ,表示成對樣本當中合意度高的樣本所占之比例,. 就是對角線個數總和占所有個數中的比例,而 Pr(e) . i, j, k  1,. m. m. m. k 1. i 1. j 1.  ( xik   xkj ) n. ,其中. , m 為理論上達成完全合意度的可能性。如有一筆關於申請獎學金的資. 治 政 大 料,每位申請者需要經過兩位評審 A 和 B 來判斷申請表是否通過,資料如表 1 立 ‧ 國. 學. 表 1、兩評分者給予申請獎學金同學是否通過 A. 是. 否. 是. 45. 15. 否. 25. 15. Nat. n. Ch. engchi. Pr(a) 也就是把對角線上個數除以總個數得. i Un. v. 15  45  0.6 , Pr(e) 為隨機達成合意 100. 度的可能性,其中評審 A 選擇「是」的機率為 的機率為. er. io. al. sit. y. ‧. B. 45  15  0.6 ,評審 B 選擇「是」 100. 45  25 「是」的機率為 0.6  0.7  0.42 ,  0.7,得評審 A 和評審 B 同時選擇 100. 而評審 A 和評審 B 同時選擇「否」 ,可用相同算法得到 0.12 。於是可得到隨機達 成合意度的可能性的機率 Pr(e)  0.42  0.12  0.54 ,最後就帶入(2.2.1)公式得 到K . 0.60  0.54  0.1304 。 1  0.54. 5.

(14) 第三節 增廣等級化(Augmented ranking) 本文探討方向為處理成對順序資料並討論其合意度,第一、二節探討的方法 分別為有使用等級化和沒有使用等級化,且都較廣泛被使用的方法,Svensson and Holm (1994)提到有些轉換是依據邊際次數來做等級轉換,使用 Svensson (2012) 的資料,其中 X 表示看完病後病患覺得自己的身體狀況,而 Y 表示看完病後醫 生對於病患的身體狀況做評估, X , Y 都為有順序的 5 個尺度資料如表 2,使用邊 際次數來進行等級轉換,表中同一列都為同樣的等級轉換值,如表格中的下括號 (rank ( X ), rank (Y )),行的等級轉換同理。. 政 治 大. 表 2、病患自我評估(X)和醫生評估(Y)的 58 筆樣本 好轉很多. (1). (2). (3). (4). (5). 1 (4.5,1). 6 (4.5,22). 6 (15,22). 9 (27.5,22). n. al3 (15,46.5) Ch. 8. 7 (41,22). 13. 12. 6 1 (53.5,22). 29. 8 (53.5, 46.5). 20. (41,57.5). 1 (53.5,57.5). 2. 15. 10. 58. v i46.5) n (41, engchi U 1 2 (27.5, 46.5). (5) 總和. y. 1 (27.5, 4.5). sit. 4 (15,4.5). er. 1 (4.5, 4.5). (4) 好轉很多. 總和 1. io. (3) 稍微好轉. 稍微好轉. Nat. (2) 沒變. 沒變. ‧. (1) 稍微惡化. 稍微惡化. 學. Y 嚴重惡化. 立. 嚴重惡化. ‧ 國. X. 7. 於 Svensson (2012)提出的增廣等級化(augmented ranking)即是用來探討成對 順序資料的變數 X 和 Y 之合意度,由於合意度會同時受到此兩個變數的影響,所 以分開運算兩個變數的等級化值如表 3,這時不像表 2 所用到同行和同列都共享 相同的等級化值,而是在同一個列聯表格共享相同之平均增廣等級化(mean augmented-rank)。. 6.

(15) 公式為 j 1. i 1 m. (X ) ij. R. 1   xkl   xil  (1  xij ) , 1  i, j  m 2 k 1 l 1 l. (2.3.1). (Y ) (Y ) (Y ) 其中 xij 為第 i 列 j 行的格子之次數,m 為尺度個數,Rij 也同理,滿足 R(i 1) j  Rij (X ) (X ) 和 Ri ( j 1)  Rij 。. 增廣等級化的方法適用於調查資料中兩個變數之間的合意度觀察如表 3,其 中看到第 3 列第 3 行的 x33  9,這表示有 9 位病患覺得看完診後症狀沒有變好也 沒變壞,而醫生同時也抱持相同看法,緊接著就拿其中兩格帶入公式運算為 1 政 R 治 8 13大 1  2 (9  1)  27. 1 R32( X )  8  13  (1  1)  22 2. 立. (X ) 33. 由此可滿足 R32( X )  R33( X )  R34( X ) ,同理 R33(Y )  1  6  6  6  (9  1) / 2  24 等級化轉換. ‧ 國. 學. 後的值如表 3 中之括號 ( Rij( X ) , Rij(Y ) ) 。. ‧. (1) 稍微惡化 (2) 沒變 (3). 沒變. 稍微好轉. 好轉很多. (1). (2). (3). (4). (5). al. Ch. e n g1c h i. i Un. v. 1. 1 (2,2). 4 (10.5,4.5). 6 (5.5,10.5). 6 (15.5,16.5). 9 (27,24). 7 (37,32). 1 (49,36). 29. 3 (20,38). 2 (32.5,40.5). 7 (44,45). 8 (53.5,52.5). 20. 1 (48,57). 1 (58,58). 2. 15. 10. 58. 稍微好轉 (4) (5) 8. 6. (22,7). 好轉很多. 總和. 總和. er. 1 (1,1). sit. 稍微惡化. n. 嚴重惡化. 嚴重惡化. io. Y. Nat. X. y. 表 3、病患自我評估(X)和醫生評估(Y), X、Y 分別使用增廣等級化如括號. 13. 12. 7.

(16) 在做運算時會將列聯表做等級化合意度格式轉換(Rank-transformable pattern of agreement)或稱為 RTPA 的轉換,這個轉換就是將表中格子整個重新排列,在 (X ). 不影響到兩變數邊際數目的情況下,使得每個非零的格子都滿足 Rij.  Rij(Y ) ,也. 就是將原本表 3 的列聯表轉換成如表 4 形式。 表 4、經過 RTPA 後的病患自我評估(X)和醫生評估(Y)的 58 筆樣本. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 第四節 隨機差異和系統差異 Svensson(1994)提到比較兩觀察者之間的差異會同時存在隨機差異(Random difference)和系統差異(System difference),如表 5 為 Svensson(1994)的資料,為兩 組神經放射研究員 A 和 B 在調查 59 位腦水腫病患的嚴重程度所打的分數,腦水 腫程度由輕微到嚴重分別為 H1、H2、H3 和 H4。 當表 5 經過 RTPA 轉換後如表 6,轉換方式僅由邊際個數來做排序,可藉由 表 7 輔助觀察,前 22 個觀察資料都為 H1,所以(H1,H1)格子就填 22,而第 23 8.

(17) 到 34 中 12 人,研究員 A 填 H2 研究員 B 填 H1,所以(H2,H1)格子就填 12,其 餘的以此類推。經過 RTPA 後再觀測兩研究者間的合意度差異,此類型的差異只 經由邊際個數分布來判斷,稱之為系統差異,除此之外若如表 5 尚未經過 RTPA, 這時會導致合意度不佳的原因除了系統差異外所影響的就是隨機差異。 表 5、神經放射研究員 A 和 B 在調查腦水腫病患的嚴重程度所打的分數 無. 輕微. 嚴重. 極嚴重. (H1). (H2). (H3). (H4). 22. 11. 1. A B 無 (H1) 輕微. ‧ 國. 22. 20. 15 1. 6. 1. 3. 4. 13. 4. 59. Nat. sit. y. ‧. 總和. 6 治 政 大 5. 學. 立. (H3) 極嚴重 (H4). 34. 9. (H2) 嚴重. 總和. io. n. al. er. 表 6、研究員 A 和 B 在調查腦水腫病患的嚴重程度所打的分數(經過 RTPA). Ch. engchi. 9. i Un. v.

(18) 表 7、研究員 A 和 B 調查腦水腫病患的嚴重程度所打的分數 RTPA 輔助表 1 到 22. 23 到 34. 35 到 42. 43 到 49. 50 到 55. 56 到 59. 觀測者 A H1…H1. H2…H2. H2…H2. H3…H3. H3…H3. H4…H4. 觀測者 B. H1…H1. H2…H2. H2…H2. H3…H3. H4…H4. H1…H1. (一)隨機差異(Random difference) 在做兩觀測者之間的合意度比較時會同時存在系統差異和隨機差異,這時等 級轉換後的值差異越大就會造成合意度越差,所以均方差即是一個適合用來對隨 機差異做觀測的統計量,稱為相對等級變異(relative rank variance)或稱為 RV ,定 義公式為. 立. 6 m m x [ Rij( X )  Rij(Y ) ]2 3  ij n i 1 j 1. 其中 xij 為第 i 列 j 行的格子之次數, i, j  1,. , m , m 為尺度個數,表 8 的 RV 計. ‧. 6 (9 12  1 92  112  112 )  0.00269 , RV 值 592. sit. y. Nat. 算可經由公式(2.4.1)得 RV . (2.4.1). 學. ‧ 國. RV . 政 治 大. er. io. 不僅用來解釋合意度較差的原因,也能用來考慮到同一個人的兩個分類之間的距. al. iv n C hengchi U 子中對於觀測者 A 和觀測者 B 所做出之增廣等級化值,其中括號的數字表示為 n. 離。 RV 為一個測量成對資料相對 RTPA 分散程度的值,由表 8 可以看出各個格. ( Rij( X ) , Rij(Y ) ) ,從表 8 明顯看出 RV 值大多由格子(3,1)所貢獻,其觀測者 A,B 的增 廣等級值分別為 43 和 34 差異最大。. 根據定義 RV 的公式,可以令 Rij( X )  Rij(Y ) n. Rij( X )  Rij(Y ) n. xij n.  pˆ ij 表示 (i, j ) 格子的相對頻率,此外. 就可表示 (i, j ) 格子的相對排序位置之間的差異。此式子可經由轉換,. . m j 1 1 i 1 m 1 ll (  xkl    xkl )  ( xijll  xijur ) ,其中 x ij 為在 (i, j ) 格子左下方 n k 1 l  j 1 n k i 1 l 1. 10.

(19) ur. 樣本之個數,而 x ij 表示在 (i, j ) 格子右上方樣本之個數, 而 (i, j ) 格子左下方樣本所占比例,將其令為 qˆij ,同理 qˆijur  ll. x ur ij n. x llij n. 即可表示成在第. 可表示成在第 (i, j ) 格. 子右上方樣本所占比例。因此 RV 公式也就可以定義為 m. m. RV  6 (qˆijll  qˆijur ) 2 pˆ ij. (2.4.2). i 1 j 1. 為一個測量資料相對於 RTPA 轉換過後的分散程度所造成合意度不佳的統計量,. RV 值越大代表與 RTPA 的分散程度差異越大。 (A) (B) 表 8、研究員 A 和 B 調查腦水腫病患的嚴重程度,括號代表增廣等級值 ( Rij , Rij ). 1 (43,34). 9. 6. (38,39). (46.5,46.5). io. 總和. 22. al. n. (H1). 總和 34 15. 5 (52,52). 1 (56,55). 1 (55,56). 3 (58,58). 4. 4. 59. 6. y. sit. Nat. (H2) 無. 11 (28,28). (H4). ‧. (H3) 輕微. 立. 22 (11.5,11.5). 極嚴重. 學. (H4) 嚴重. (H1). ‧ 國. B 極嚴重. 政 治嚴重 大 (H2) (H3). 輕微. er. 無. A. 13 ni C h20 U engchi. v. 另一個類似於參數 RV 一樣適用於觀測相對於 RTPA 情況下來觀測合意度不 佳的統計量定義為 m. D . m.  p (q i 1 j 1. ij. m. ll ij.  qijur ) (2.4.3). m. 1   p i 1 j 1. 2 ij. ll. 其中 m 為尺度個數, pij 表示 (i, j ) 格子的相對頻率, qij 表示在 (i, j ) 格子左下方的 m. m. 比率, qij 表示在 (i, j ) 格子右上方的比率,而分母的  pij2 是對於多數資料有 ur. i 1 j 1. 11.

(20) 評分者給予同樣分數的情況所做的校正,滿足 0  D  1 。. 在經驗上估計  D 會經過轉換由統計量 D 來表示,推導過程為 m. D . m.  pij (qijll  qijur ) i 1 j 1. m. m. 1   p i 1 j 1. m. m. xij ( xijll  xijur ). m.  n. n. i 1 j 1. . m. m. 1 2 (n   xij2 ) 2 n i 1 j 1. 2 ij. m. . m.  x ( x. ll ij. ij. i 1 j 1. m.  xijur ). m. n  n    ( x  xij ) 2. i 1 j 1. D. 2 ij. m. 其中  xij  n ,因此可表示為 i 1 j 1. m. D.  x ( x.  xijur ). 政 治 大 m. m. n(n  1)   xij ( xij  1) i 1 j 1. m. D. 學. m. 2 xij xijll i 1 j 1 m m. n(n  1)   xij ( xij  1). ‧. ‧ 國. ll ij. ij. i 1 j 1. 立. 或是. m. i 1 j 1. Nat. y. ll. ur. io. sit. xij 為第 i 列 j 行的格子之次數, xij 為在 (i, j ) 格子左下方樣本之個數,而 xij 表示. n. al. er. 在 (i, j ) 格子右上方樣本之個數。. Ch. engchi. i Un. v. 由於  D 表示合意度不佳的統計量,因此定義  A  1  D 表示觀測相對於 RTPA 情況下來觀測合意度的統計量,滿足 0   A  1 和 0  D  1,當經過 RTPA 轉換過後的矩陣所算出的  A  1 ,表示樣本合意度很高。 一個參數用來觀測有序資料順序的合意度稱為單調合意度係數(coefficient of monotonic agreement) ,簡稱為 MA。其定義為合意度和合意度不佳比率之差對 於成對樣本的結果,表示為.    A  D 或   1  2D. (2.4.4). 滿足 1    1 ,參數  不僅是用來表示合意度比率和合意度不佳比率之間的相 12.

(21) 關性,其也是用來判別成對樣本的合意度指標。 (二)位置分布系統差異(Systematic difference in position) 給定變數 X 和 Y 為成對且有順序的資料,其分配可寫為 pv( X )  p( X  v) 和 m. , m ,此時 p( X  Y ) 就可寫成  pv(Y ) Pv(X1 ) ,其中大寫的. pv(Y )  p(Y  v) , v  1,. v 1. Pv( X )  p( X  v) 和 Pv(Y )  p(Y  v) 分別表示兩累積的相對比例,於是用合適的參數. 來表示位置的分布程度,稱為相對位置(Relative position)或稱 RP , m. RP   ( pˆ v(Y ) Pˆv(X1 )  pˆ v( X ) Pˆv(Y1) ). (2.4.5). 政 治 大 v 1. RP 值可用來判別觀測者 Y 相對於 X 是否有習慣給予較高或較低的分數,如果. 立. 由表 8 和公式(2.4.5)可計算 RP 為. 1 [15  22  6  42  4  55  20  34  13  49  4  55]  0.2111 592. ‧. RP . 學. ‧ 國. RP 值為正表示觀測者 Y 相對於 X 的習慣給予較高的評分,反之同理。. Nat. er. io. sit. y. 因此由 RP 值可判別觀測者 Y 對於 X 的習慣給予較低的評分。. 受試者操作特徵曲線(receiver operating characteristic curve)或稱 ROC 曲線,. al. n. iv n C 由雷達工程師發明用於戰爭當中,座標圖式的分析工具可用來偵測戰場上的敵軍 hengchi U 飛機、船艦。後來 ROC 曲線被用於醫學、無線電、生物學、犯罪心理學領域中, 且近年來也經常使用在數據挖掘的領域。 Svensson and Holm (1994)提到的 ROC 曲線也可用來判斷兩觀測者之間是否 誰給予較高的評分,若觀測者 Y 對於 X 的習慣給予較低的評分,則 ROC 曲線會 偏向 Y 的方向如圖 1。. 13.

(22) 立. 政 治 大. ‧. ‧ 國. 學. 圖 1、兩觀測者給予評分的 ROC 曲線. (三)位置集中系統差異(Systematic difference in concentration). Nat. sit. y. 其中一位觀測員習慣給予較集中的評分,此時 ROC 曲線會呈現 S 型如圖 2,. n. al. er. io. 此資料為 Svensson(1994)中另外一筆由兩組神經放射研究員 A 和 B 在調查 59 位. i Un. v. 腦水腫病患的嚴重程度所打的分數,腦水腫程度由輕微到嚴重分別為 F1、F2、. Ch. engchi. F3 和 F4,結果如表 9。經由此筆資料所算出之 RP 值會很小,但是其中一位觀測 員給予過度集中的評分依然會造成合意度不佳,使用統計量稱為相對集中 (relative concentration)或稱 RC ,定義為 RC . m 1 m (Y ) ˆ ( X ) [ pˆ v Pv 1 (1  Pˆv( X ) )   pˆ v( X ) Pˆv(Y1) (1  Pˆv(Y ) )] M v 1 v 1 m. m. v 1. v 1. (2.4.6). 其中 M  min[ pˆ 0  pˆ 02 , pˆ1  pˆ12 ] , pˆ 0   pˆ v(Y ) Pˆv(X1 ) , pˆ1   pˆ v( X ) Pˆv(Y1) 。 RC 值可用來判別觀測者 Y 相對於 X 是否有習慣給予較集中在中間(F2、F3). 選項的評分,如果 RC 值為正表示觀測者 Y 對於 X 的習慣給予較集中在中間選項 的評分,反之同理。 14.

(23) 由表 5 和公式(2.4.6)可計算 RC 為 RC . 1 [15  22 17  6  42  4  20  34 10  13  49  4]  0.075 0.177  593. 此值很小代表兩觀測者 A,B 所給予之觀測分數差異不大,但是值為負的表示觀 測者 A 稍微較觀測者 B 所給的分數較為集中。 如表 9,在這情況下所計算出之 RP 值僅只有 0.077,但經由 ROC 曲線如圖 2 可明確看出曲線呈現 S 型的狀況,這時再計算 RC 值得到 0.142,發現觀測者 B 相對於觀測者 A 給予 F2 和 F3 這兩個選項的個數要來的多,可以看觀測者 B 相 對於觀測者 A 給予出較集中於中間選項的評分。系統差異不能只觀測 RP 就做解. 政 治 大. 釋,還需要計算 RC 值和看 ROC 曲線才能對合意度不佳的情況做出較完善的結. 立. 學. ‧ 國. 論。. 表 9、神經放射研究員 A 和 B 在調查腦水腫病患的嚴重程度評分. (F1). (F2). (F3). (F4). 1. (F3) 極嚴重 (F4) 總和. 4. 總和. y. sit. 3. al. n. (F2) 嚴重. 極嚴重. io. (F1) 輕微. 嚴重. Nat. 無. 輕微. er. B. 無. ‧. A. 6. Ch. U i e h n c g 2 11. 3. v1 i n. 8. 8. 21. 1. 1. 25. 27. 9. 12. 34. 59. 15.

(24) 政 治 大 圖 2、兩觀測者給予評分的 ROC 曲線 立. ‧ 國. 學. 表 10 有四個例子,樣本中的邊際數目都相同,此時 RP, RC 值都為相同,但 是從四個表中樣本分布的趨勢可以很明顯地看出有所不同,也可以很明確地看出. ‧. 合意度差異很大,此時無法經由系統差異的 RP, RC 來對樣本合意度不佳做合理. Nat. sit. n. al. er. io. 生。. y. 的解釋,因此要看到隨機差異的部分,經由 RV 值得變化來解釋合意度不佳的產. i Un. v. 表 10 中四筆資料的系統差異合意度不佳統計量值,經過計算得 RP  0.0562,. Ch. engchi. 此值為正且很小,這表示觀測者 B 相對於觀測者 A 習慣給予較高的評分,但是 差異不大。當中的 RC  0.00785 ,此值為負且很小,這表示觀測者 A 相對於觀 測者 B 習慣給予較集中在中間等級的評分。緊接著看到隨機差異 RV 值,表 10 中四個表的 RV 值從小到大分別為一、二、三和四,表一的合意度最高而表四的 合意度最低,結果與四個表中所查到的樣本分布狀況來判斷結果也相同。. 16.

(25) 表 10、四組不同資料但邊際數目皆相同. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 表 10 所計算出的各個統計量值可把順序資料的合意度檢查流程整理如圖 3。 (X ). 首先,經判斷資料分布的邊際次數,當邊際次數相等,此時又 Rij.  Rij(Y ) ,則. RV  RP  RC  0,若 Rij( X )  Rij(Y ) 則就可經由 RV 值對合意度不佳的原因做解釋。 (X ). 另一部份是當邊際次數不相等,若 Rij.  Rij(Y ) 則 RV  0 ,此時要用系統差異的 (X ). RP, RC 值和 ROC 曲線來判斷,而若是 Rij. 等多種統計量及 ROC 曲線來做分析。 17.  Rij(Y ) 則還需要經過系統及隨機差異.

(26) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. i Un. v. 圖 3、系統差異和隨機差異判斷流程圖. engchi. 第五節 不完整資料處理(Incomplete data processing) 遺漏值(missing value)是在實務上處理資料的過程經常會遇到的問題,將當 中的遺漏值都刪去,可能會失去許多的資訊,因此必須填補遺漏值,填補遺漏值 的方法由 Schafer(1997)書中有詳細的介紹。 (一)EM 演算法 最大期望演算法(Expectation-maximization algorithm),又稱期望最大化演算 法在統計中被用於尋找相依於不可觀察的遺漏變數的機率模型中的參數  的最 大概似估計。在統計計算中,最大期望演算法在機率模型中可尋找參數最大概似 18.

(27) 估計或者最大後驗估計的演算法。 最大期望演算法經過兩個步驟不斷的交替進行計算,第一步是計算期望值 (Expectation-step),利用可觀測的 Yobs 來估計參數  ,然後再對遺漏值 Ymis 做最大 概似估計值;第二步是最大化(Maximization-step),也就是使用原有可觀測資料. Yobs 和在 E 步驟所求得的遺漏資料的最大概似值 Ymis 來計算參數  。而 M 步驟中 所找到的參數估計值  會被用於下一個 E 步驟計算中,這個過程不斷交替進行直 到參數  收斂為止。此統計方法由 Dempster, Laird 和 Rubin(1977)正式提出,但是. 治 政 大 Expectation-maximization 或 EM。 立. 指出此方法之前,已被許多作者的研究領域中多次提出,且將其命名為. ‧ 國. 學. 如現在有一筆不完整的資料(incomplete-data),那完整資料 Y 一定可以拆解 成可觀測資料和遺漏資料為. ‧. P(Y |  )  P(Yobs |  ) P(Ymis | Yobs , ). y. Nat. er. io. sit. 在(2.5.1)等式的兩邊同時取自然對數即可得公式為. l ( | Y )  l ( | Yobs )  log P(Ymis | Yobs ,  )  c. n. al. Ch. (2.5.1). n engchi U. iv. (2.5.2). (2.5.2)中 l ( | Y )  log P(Y |  ) 表示完整資料的對數概似函數(log- likelihood),. l ( | Yobs )  log L( | Yobs ) 表示可觀測資料的對數概似函數,P(Ymis | Yobs , ) 這項可表 示為給定可觀測資料及參數  來對遺漏資料做預測,而 c 為常數。 因為 Ymis 未知,所以(2.5.2)式中的 log P(Ymis | Yobs , ) 無法求得,於是同時對 P(Ymis | Yobs , (t) ) 取期望值得 Q( |  (t ) )  l ( | Yobs )  H ( |  (t ) )  c. 其中. 19. (2.5.3).

(28) Q( |  (t ) )   l ( | Yobs ) P(Ymis | Yobs , (t ) )dYmis H ( |  (t ) )   log P(Ymis | Yobs , ) P(Ymis | Yobs , (t ) )dYmis. 如假定一直照著 EM 步驟,第 t  1 次得到參數  (t 1) 使得 Q( |  (t) ) 的值最大,這時.  (t 1) 一定會比  (t) 估計要來的好 Q( (t 1) |  (t ) )  Q( (t ) |  (t ) ). (2.5.4). 可以推得  (t 1) 所做出來的概似估計必定會大於等於  (t) 所做出來的概似估計為 l ( (t 1) | Yobs )  l ( (t ) | Yobs ). 証明: l ( (t 1) | Yobs )  l ( (t ) | Yobs ). 立. (2.5.5). 政 治 大. ‧ 國. 學.  Q( (t 1) |  (t ) )  Q( (t ) |  (t ) )  H ( (t ) |  (t ) )  H ( (t 1) |  (t ) ). Nat. io. sit. Q( (t 1) |  (t ) )  Q( (t ) |  (t ) )  0. y. ‧. 由(2.5.4)得到. er. 又其中的 H ( (t ) |  (t ) )  H ( (t 1) |  (t ) ) 可改寫成. al. n. iv n C P(Y | Yh e , n) i| YU, )dY h c g log[ ] P ( Y  (t ). mis. (t ). obs. P(Ymis | Yobs , (t 1) ). mis. obs. mis. 經由 Jensen(1906)提出的 Jensen’s 不等式可表示成凸函數 x logx ,由此可得. H ( (t ) |  (t ) )  H ( (t 1) |  (t ) )  0. 最後總結 EM 步驟可簡單表示為兩步驟: 1. E 步驟: l ( | Y ) 對 log P(Ymis | Yobs , (t ) ) 取期望值求得 Q( |  (t ) ) 2. M 步驟:求得參數  (t 1) 使得 Q( |  (t ) ) 最大 重複以上步驟 E 和步驟 M 多次,從  (0) 起始值開始迭代,直到  (t 1) 收斂,而在 20.

(29) 大多數的情況下最終都會迭代到一個總體極大值(global maximum),並非每個情 況都可以這麼完美,在有些情況,隨著使用不同的  (0) 會導致最後迭代到不同的 極大值。 (二)混和資料(mixed data)處理 首先,有 p 個類別型變數 W1 ,W2 ,. ,Wp 和 q 個連續型變數 Z1 , Z 2 ,. , Z q ,現在. 擁有 n 筆觀測資料,就擁有 n  ( p  q) 的資料矩陣 Y  (W , Z ) ,其中 W 和 Z 表示 類別型和連續型變數,類別型 W 可以表示為列聯表形式,假定第 1 到第 j 個類 別 W1 ,W2 ,. 立. p. , d j,因此 D   d j 可表示為總共所有可. 政 治 大. ,W j 的選項個數分別為 1, 2,. j 1. 表 U 中每列可表示為 uiT ,其中 i  1, 2,. 學. ‧ 國. 能的分類個數,因此原始資料的類別行部分即可表示為 n  D 的列聯表 U,列聯 ,n,. ‧. ui 為一個 1 D 的向量,其中只有所對應的第 d 個位置為 1,其餘位置都為 0 的向. Nat. n. al. 當中對角線 x1 , x2 ,. Ch. e n g0 c h i. 0 0    xD . sit. 0 x2. er. io.  x1 0 T U U  diag (x)     0. y. 量,因此每一列 U 中都只有一個位置為 1,而 U TU 為. i Un. v. (2.5.6). , xD 表示資料 n 筆中所對應於 D 種分類所佔的個數,因此可. D. 得到  xi  n 。 i 1. 處理連續型部分 Z,可以簡單表示為一多項分配為 x |  ~ M(n,  ). 其中   { d : d  1, 2,. (2.5.7). , D} 為一 1 D 向量,表示為其所對應到 D 類 x1 , x2 ,. , xD 的. 機率值。令 Ed 表示第 d 個位置為 1 其餘為 0 的 1 D 向量,給定類別型 W 的情況 21.

(30) 下想求的連續型分配可表示為一多元常態分配為. zi | ui  Ed , d ,  ~ N (d , ) 對於 i  1, 2,. (2.5.8). , n 兩兩間獨立,其中  d 為對應到第 d 類的平均數之 1 q 向量, 為. q  q 的兩兩連續型變數間之共變異數矩陣。 因此,所估計的參數可寫成.   ( ,  , ) 其中   (1 , 2 ,. , D )T 為 D  q 平均數矩陣,要估計此未限制模型(unrestricted. model)的自由度為. 政 治 大. ( D 1)  Dq  q(q  1) / 2. 立. 學. ‧ 國. 而(2.5.8)式為 Z 給定 W 下的多元常態模型可表示為 Z U . (2.5.9). sit. y. Nat. 的矩陣,包含 d 種類別分類的虛擬變數(dummy variable)。. ‧. 其中  為一個 n  q 矩陣服從 N (0, ) ,且其兩兩列之間皆獨立,而 U 為一個 n  D. n. al. er. io. 由(2.5.7)和(2.5.8)可得到完整資料的 likelihood 為. i Un. v. L( | Y )  L( | W ) L( ,  | W , Z ). 又(2.5.10)式子中的前項. Ch. engchi. (2.5.10). D. L( | W )    dxd d 1. 而後項. L(  ,  | W , Z )  . . n 2. exp{. 1 D ( zi  d )T 1 ( zi  d )}   2 d 1 iBd. 其中 Bd  {i : ui  Ed } 表示全部資料中第幾個屬於第 d 種類別型分類,而後項經過 代數上的轉換後可表示為 L(  ,  | W , Z )  . . n 2. 1 1 exp{ tr1Z T Z  tr1 TU T Z  tr1 TU TU } 2 2 22.

(31) 當中由下方的充分統計量的線性組合所組成 T1  Z T Z , T2  U T Z 和 T3  U TU. (2.5.10)式經由最大概似估計可得到  ,  和  的估計式為. ˆ  n1 x. (2.5.11). ˆ  (U TU )1U T Z  T31T2. (2.5.12). 1 1 ˆ  ˆT ˆ  (T1  T2T31T2 ) n n. (2.5.13). 其中 ˆ  Z  U ˆ 為估計殘差矩陣。. 政 治 大 都可能有遺漏值的情況,可以使用類似 EM 轉換過後的方法叫資料增廣(Data 立. 非完整混和型資料(incomplete mixed data)中類別型變數與連續型變數同時. ‧ 國. 學. augmentation)或稱 DA,分別為插補步驟(Imputation-step, I-step)和算出後驗分配 步驟(Posterior-step, P-step)。. ‧. 第一步驟為 I 步驟,使用未遺漏部分算出跟種類別分類所佔有的比例,經由. y. Nat. ( t 1) Ymis ~ P(Ymis | Yobs , (t ) ). er. io. al. sit. 多項分配來對遺漏部分做填入的動作。. n. iv n C h e n g c h i U 做抽取的動作為 接著 P 步驟在更新後驗機率並對想估計的參數 ( t 1)  (t 1) ~ P( | Yobs , Ymis ). 由此得到 T1 , T2 , T3 ,各參數的後驗分配為.  | Y ~ D(  x). (2.5.14).  |  , Y ~ W 1 (n  D,(ˆT ˆ)1 ). (2.5.15).  |  , , Y ~ N (ˆ , x1). (2.5.16). 如同 EM 演算法,重複以上步驟 I 和步驟 P 多次,大部分的假設情況下,都能收 斂到理論的後驗機率密度函數。 23.

(32) 第三章、資料補值之正確性模擬 第一節、基本資料分析 首先對於資料的分布狀況如表 11 到表 14 和圖 4,第一個變數為類別變數性 別,在此次問卷資料當中男性和女性受訪者分別占 413 人和 597 人。第二個變數 為類別變數滿意度,資料當中 1 到 4 分別代表非常不滿意、不滿意、滿意和非常 滿意,當中受訪者所給予各滿意程度分別有 240 人、208 人、271 人、82 人和 209 人為遺漏值。第三個變數為類別變數學歷,但在此分析希望有更多連續型變數,. 政 治 大. 因此將此變數改為連續變數學齡,因此資料當中學齡有 6 年、9 年、12 年、14. 立. 年和 16 年,分別表示擁有國小、國中、高中職、五專二專和大學學歷,當中受. ‧ 國. 學. 訪者學齡分布狀況分別有 104 人、75 人、272 人、187 人、363 人和 9 人為遺漏. ‧. 值。第四個變數為連續變數滿意度評分其分布範圍為 0 到 100 分,給予越高分表 示滿意程度越高,其分狀況如圖 4。最後一個變數年齡為類別變數,一樣當連續. y. Nat. er. io. sit. 型變數分析,因此取各區間中點當作連續型資料如表 14,因此資料當中學齡 22 歲、27 歲、32 歲等,當中受訪者學齡分布狀況分別有 37 人、46 人、62 人等和. n. al. 5 人為遺漏值。. Ch. engchi. i Un. v. 表 11、性別變數資料 性別(Gender). 人數. 比例. 男生 (1). 413. 41%. 女生 (2). 597. 59%. 24.

(33) 表 12、滿意度變數資料 滿意度(Satisfaction). 人數. 比例. 非常不滿意 (1). 240. 24%. 不滿意 (2). 208. 20%. 滿意 (3). 271. 27%. 非常滿意 (4). 82. 8%. 遺漏值. 209. 21%. 表 13、學歷變數資料 學歷(Schooling). 立. 比例. 104. 10%. 高中職 (12). 272. 五專 (14). 187. ‧. 19%. 363. 36%. n. al. 9. Ch. engchi. 25. sit. io. 遺漏值. Nat. 大學 (16). 7% 27%. er. ‧ 國. 75. 學. 國中 (9). y. 國小 (6). 政人數 治 大. i Un. v. 1%.

(34) 立. ‧ 國. 學 sit. y. 表 14、年齡變數資料. al. 比例. er. 人數. n. 25~29 (27). io. 20~24 (22). ‧. 圖 4、滿意度評分變數資料. Nat. 年齡(Age). 政 治 大. Ch. 37. e n46g c h i. i Un. v. 4% 5%. 30~34 (32). 62. 6%. 35~39 (37). 83. 8%. 40~44 (42). 100. 10%. 45~49 (47). 111. 11%. 50~60 (55). 265. 26%. 60~70 (65). 178. 18%. 70 以上 (75). 123. 12%. 遺漏值. 5. 0%. 26.

(35) 此次資料使用上述 5 個變數,原始資料 1010 筆去除任一變數中有遺漏值的 部分,用所剩下的 768 筆資料做接下來的分析,其中主要觀察目標為類別型變數 滿意度和連續型變數滿意度評分之間的合意度判斷,將連續型變數經過轉換而變 成類別型變數,再將兩類別型變數帶入前述方法來做分析其兩變數之間的合意度 觀測,在此有兩種轉換方法為等級轉換方法(Rank transformation)和常態分數轉換 方法(Normal score transformation): (一) 等級轉換方法(Rank transformation) 首先提到等級轉換方法第一步為將類別型變數滿意度中所給非常不滿意到. 政 治 大 成非常不滿意到非常滿意。因此原始資料可轉成如表 15 矩陣,其中 X 表示滿意 立 非常滿意所占比例,再將連續型變數從小到大排序後以相同的各分類比例做轉換. ‧ 國. 學. 度,Y 表示滿意度評分經過等級轉換後滿意度。. 表 15、無遺漏值資料經過等級轉換後的矩陣 非常 滿意 1. y. 非常 不滿意. 滿意. sit. Nat. Y. 非常 不滿意 不滿意. ‧. X. 1. 不滿意. C55h. 109. 35. v0. 滿意. 5. 32. 198. 29. 非常 滿意. 0. 0. 30. 49. n. al. er. 58. io. 166. engchi. i Un. (二) 常態分數轉換方法(Normal score transformation) 常態分數轉換方法第一步將類別型變數滿意度中各分類比例算出來,把各分 類累積比例當成機率值轉換成 Z 值,而連續型部分轉換成標準化模式,因此可 把連續型部分的標準化值依照類別型的累積機率值轉換成非常不滿意到非常滿 意的類別變數如表 16。 27.

(36) 表 16、無遺漏值資料經過常態分數轉換後的矩陣 X Y. 非常 不滿意 不滿意. 滿意. 非常 滿意. 非常 不滿意. 135. 24. 0. 0. 不滿意. 88. 151. 47. 1. 滿意. 3. 24. 199. 48. 非常 滿意. 0. 0. 18. 30. 政 治 大 經由上述兩種轉換,可使用合意度檢查的統計量做分析,首先探討使用等級 立. 轉換的方法,轉換後的資料兩變數邊際次數會非常相近甚至相同,如果連續型資. ‧ 國. 學. 料有出現評分者給予相同分數的情況,可能會發生邊際次數不相同的情況,但在. ‧. 此次的連續型變數滿意度評分有經過調整,因此不會遇到邊際不相同的情況,此. sit. y. Nat. 情況就只能使用系統差異來比較其合意度,由表 17 可看到 MA、Spearman 和. io. er. Kendall's W 的值比較接近,RV 值也很小代表評分者對於滿意度和滿意度評分的. al. 合意度高,而 Kappa 統計量主要是受到矩陣樣本位於對角線的次數所影響,對. n. iv n C 角線次數越多 Kappa 值就會越大,此統計量的變動幅度會較明顯。 hengchi U. 使用常態分數轉換後,資料不會有上述兩變數的邊際次數的情況,在此情況 不僅只使用系統差異,且要用隨間差異比較合意度,由表 17 可看到 MA、Spearman 和 Kendall's W 的值較為接近,且 Kappa 值依舊變動幅度大。接著談到隨機差異 的 RP 和 RC 值,此兩統計量皆為觀測兩變數的分布狀況有無偏性,從中可看出 RP 值為正數且很小,代表評分者在給予滿意度評分的分數時會相對於給予滿意 度稍微來的高。RC 也為正數,表示當評分者拿到問卷時在評定滿意度時總是較 集中給予滿意和不滿意者兩個選項,相對於滿意度評分的分數會給予較集中在中 間的選項,這都是可能導致合意度不佳的原因,但是可以看出兩種轉換基本上其 28.

(37) 實差異不會很大,最主要的差異就在邊際數目是否相同。 表 17、無遺漏值資料分別使用兩種轉換方式後所做出各類統計量 等級轉換. 常態分數轉換. Kappa. 0.5536. 0.5381. MA. 0.9450. 0.9594. Spearman. 0.8581. 0.8575. Kendall's W. 0.8360. 0.8240. RV. 0.0134. 0.0081. RP RC. 立. 0.0000 治 0.0138 政 大0.1515 0.0000. ‧ 國. 學. 此次資料,當中所做的滿意度評分結果可能會受到許多不同變數,而造成合. ‧. 意度結果產生的影響,在此希望了解滿意度評分與滿意度之間的合意度是否會分. io. sit. y. Nat. 別受到性別、年齡和學歷三個變數的不同而影響。. n. al. er. 第一,對於性別變數進行分析,當滿意度分別為非常不滿意、不滿意、滿意. Ch. i Un. v. 和非常滿意的情況下,如圖 5 從箱型圖中看到中位數女生都略高於男生所給的分. engchi. 數,但可以看到 p-value 的值都大於 0.05,表示在各個滿意度的情況下男女所給 的滿意度評分沒有顯著不同,因此可以判斷滿意評分不會受到性別的影響。. 29.

(38) 立. 政 治 大. ‧. ‧ 國. 學 y. Nat. er. io. sit. 圖 5、給定滿意度下性別與滿意度評分圖. al. 第二,變數年齡對其分析看不同年紀是否會影響到所給的滿意度評分,此變. n. iv n C 數年齡從小到大分為 9 個區間做探討,如圖 6 可看到年齡的第 1 個區間和第 9 hengch i U. 個區間所給滿意度評分有高於其他區間的趨勢,於是對於全部區間一起做 F 檢定 如表 18 得到 p-value=0.144 發現到全部區間沒有顯著不相同。 使用等級轉換後的資料兩變數的邊際次數會非常相近甚至相同,在此情況使 用系統差異來比較其合意度,由表 19 可看到 MA、Spearman 和 Kendall's W 的值 比較接近且變動的幅度比較小,RV 值也都很小代表評分者對於滿意度和滿意度 評分的合意度很高,而 Kappa 統計量主要是受到矩陣樣本位於對角線的次數所 影響,對角線次數越多 Kappa 值就會越大,此統計量的變動幅度會比較明顯, 但從中可看出年紀在 30~34 歲區間的人對於滿意度和滿意度評分的合意度較低, 30.

(39) 而其餘的合意度差異不大。 使用常態分數轉換後的資料就不會有上述兩變數的邊際次數的情況,此情況 不僅只使用系統差異還要用隨間差異來比較其合意度,由表 19 可看到一樣 MA、 Spearman 和 Kendall's W 的值較接近且變動的幅度較小,而 Kappa 統計量主要是 受到矩陣對角線的次數所影響, Kappa 值依舊變動幅度大,但在此分類情況下 30~34 歲區間的人對於滿意度和滿意度評分的合意度就和其他區間的差異不大, 談到隨機差異的 RP 和 RC 值,此兩統計量皆為觀測兩變數裡的分布狀況有無偏 性,從中可看出 RP 值大多為正數且很小,代表評分者在給予滿意度評分的分數. 政 治 大 時在評定滿意度時總是較集中給予滿意和不滿意者兩個選項,相對於滿意度評分 立 時會相對於給予滿意度稍微來的高,RC 也大多為正數,表示當評分者拿到問卷. ‧. ‧ 國. 學. 的分數會給予較集中在中間的選項,這都是可能導致合意度不佳的原因。. n. er. io. sit. y. Nat. al. Ch. engchi. 31. i Un. v.

(40) 政 治 大. 立. n. al. er. io. sit. y. ‧. ‧ 國. 學. Nat. 圖 6、年齡與滿意度評分圖. i Un. v. 表 18、不同年齡所給滿意度評分的 F 檢定 Df. Ch. e n g cMSh i. SS. 年齡. 8. 5567. 695.8. 殘差. 759. 345781. 455.6. 32. value. p-value. 1.527. 0.144.

(41) 表 19、使用年齡來分類再經由等級轉換後所做出各類統計量 20~24. 25~29. 30~34. 35~39. 40~44. 45~49. 50~59. 60~69. 70~79. Kappa. 0.7332. 0.6786. 0.3580. 0.5543. 0.5343. 0.5513. 0.5215. 0.5373. 0.5891. MA. 0.9757. 0.9641. 0.8839. 0.9480. 0.9491. 0.9261. 0.9447. 0.9235. 0.9551. Spearman. 0.9049. 0.8681. 0.8023. 0.8565. 0.8300. 0.8285. 0.8570. 0.8333. 0.8650. Kendall's W. 0.9589. 0.9081. 0.8360. 0.9166. 0.9034. 0.8843. 0.9166. 0.9028. 0.9273. RV. 0.0030. 0.0061. 0.0387. 0.0106. 0.0094. 0.0258. 0.0108. 0.0276. 0.0074. 表 20、使用年齡來分類再經由常態分數轉換後所做出各類統計量 35~39 治 40~44 45~49 政 大. 30~34. Kappa. 0.7302. 0.6291. 0.5731 立. MA. 0.9805. 0.9675. Spearman. 0.9051. Kendall's W. 0.9504. RV. 0.0027. 0.0059. RP. 0.0092. 0.0152 -0.0122 0.0225. RC. 0.0261. 0.0918. 50~59. 60~69. 70~79. 0.5051. 0.5315. 0.6022. 0.5863. 0.9764. 0.9696. 0.9660. 0.9867. 0.9497. 0.9468. 0.9590. 0.8685. 0.8005. 0.8558. 0.8292. 0.8259. 0.8569. 0.8332. 0.8646. 0.8946. 0.9000. 0.9009. 0.9106. 0.9105. 0.9171. 0.9287. 0.0034. 0.0056. 0.0058. 0.0016. 0.0109. 0.0122. 0.0064. 0.0611 -0.0018 0.0451. 0.0055. 0.0208. 0.1027. -0.0052. io. sit. Nat. n. al. iv C h 0.1415 0.1021U n0.1882 engchi. 0.1374. 0.9091. er. ‧ 國. 0.5839. 學. 0.5404. y. 25~29. ‧. 20~24. 0.1244. 第三,不同學歷是否會影響到所給的滿意度評分,此變數學歷從國小到大學 以上分為 5 個區間來做探討,如圖 7 可以得到此五區間的學歷程度所給予的滿意 度評分的中位數大致相同,於是對於全部區間一起做 F 檢定如表 21 得到 p-value=0.143 發現全部區間沒有顯著不相同。 使用等級轉換後的資料兩變數的邊際次數會非常相近甚至相同,在此情況使 用系統差異來比較其合意度,由表 22 可看到 MA、Spearman 和 Kendall's W 的值 較接近且變動的幅度比較小,RV 值也都很小,代表評分者對於滿意度和滿意度 33.

(42) 評分的合意度較高,而 Kappa 統計量主要是受到矩陣樣本位於對角線的次數所 影響,依然變動幅度較明顯,也可從表格中看出學歷越高的給予滿意度和滿意度 評分的合意度有逐漸上升的趨勢。 使用常態分數轉換後的資料也不會有上述兩變數的邊際次數的情況,在此情 況不僅只使用系統差異還要用隨間差異來比較其合意度,由表 23 可看到 MA、 Spearman 和 Kendall's W 的值較接近且變動的幅度比較小,而 Kappa 統計量主要 是受到矩陣對角線的次數所影響,所以 Kappa 值依舊變動幅度大。接著談到隨 機差異的 RP 和 RC 值,此兩統計量皆為觀測兩變數裡的分布狀況有無偏性,從. 政 治 大 對於給予滿意度稍微來的高。RC 立 也大多為正數,表示當評分者拿到問卷時在評. 中可看出 RP 值大多為正數且很小,代表評分者在給予滿意度評分的分數時會相. ‧ 國. 學. 定滿意度時,總是較集中給予滿意和不滿意者兩個選項,相對於滿意度評分的分 數會給予較集中在中間的選項,都是可能導致合意度不佳的情況,而跟等級轉換. ‧. 後的結果一樣可看到學歷越高的給予滿意度和滿意度評分的合意度有逐漸上升. n. al. er. io. sit. y. Nat. 的趨勢。. Ch. engchi. 34. i Un. v.

(43) 立. 政 治 大. ‧. ‧ 國. 學 圖 7、學歷與滿意度評分圖. y. Nat. SS. MS. value p-value. er. io. a l 4 3141 785.2 1.721i v 0.143 763 C h348206 456.4 U n engchi. n. 學歷. Df. 殘差. sit. 表 21、不同學歷所給滿意度評分的 F 檢定. 表 22、先使用學歷來分類再經由等級轉換後所做出各類統計量 6. 9. 12. 14. 16. Kappa. 0.4878. 0.4869. 0.5187. 0.5417. 0.6003. MA. 0.8868. 0.9420. 0.9433. 0.9425. 0.9561. Spearman. 0.8033. 0.8248. 0.8491. 0.8732. 0.8693. Kendall's W. 0.8957. 0.9126. 0.9090. 0.9150. 0.9197. RV. 0.0366. 0.0107. 0.0117. 0.0126. 0.0086. 35.

(44) 表 23、先使用學歷來分類再經由常態分數轉換後所做出各類統計量 6. 9. 12. 14. 16. Kappa. 0.4372. 0.4299. 0.5175. 0.5571. 0.5837. MA. 0.8887. 0.9382. 0.9553. 0.9561. 0.9765. Spearman. 0.8021. 0.8238. 0.8485. 0.8730. 0.8688. Kendall's W. 0.8800. 0.9005. 0.9043. 0.9266. 0.9208. RV. 0.0380. 0.0122. 0.0088. 0.0090. 0.0030. RP. 0.0287. -0.0069. 0.0301. -0.0584. 0.0065. RC. 0.0232. 0.0312. 0.1364. -0.0270. 0.1585. 立. 政 治 大. ‧ 國. 學. 觀測年齡與學歷一起放入模型做觀測,於是畫出圖 8 為先經過年齡分為 9. ‧. 個組別,在各個組分別依照不同學歷分析是否會影響滿意度評分,給定在不同年 齡下,不同學歷程度是否影響所給予的滿意度分數,如圖 15 可看到在給定年齡. y. Nat. io. sit. 情況下的學歷,五個區間的學歷程度所給予的滿意度評分的中位數大致相同,除. n. al. er. 了第 1 組、第 2 組和第 6 組當中幾個有些差異外其餘的組別所給的滿意度評分大. Ch. i Un. v. 致相同。如表 24 對於全部組別一起做檢定得到年齡的 p-value=0.1367 無顯著,. engchi. 而學歷的 p-value=0.0056 有顯著,這結果可以從圖 8 的第 1 組、第 2 組與第 6 組 的滿意度評分差異造成。. 36.

(45) 政 治 大. 立. ‧. ‧ 國. 學 sit. y. Nat. n. al. er. io. 圖 8、給定不同年齡下學歷與滿意度評分箱型圖. i Un. v. 表 24、年齡和學歷變異數分析表. Ch. Df 年齡. eSSn g cMS hi. 8. 學歷. 4. 殘差. value. p-value. 5567. 695.8 1.542. 0.1368. 6618. 1655. 0.0056. 755 329789 451.1. 37. 3.667.

(46) 第二節、資料模擬 模擬所使用的 1010 筆資料為對於生活環境滿意度的評分,五個變數分別為 性別(gender)、滿意度(satisfaction)、學歷(schooling)、滿意度評分(score)和年齡(age), 將資料中有遺漏值的筆數刪除剩下 768 筆資料。第二章 Schafer (1997)提到的 DA(data augmented)的方式做補值,用於檢查補值的正確性,接著隨機將此 768 筆資料隨機刪除 1%、5%和 10%的資料當成遺漏值,使用 DA 的補值方法對資料 做 2000 次補值,資料補完值後,再取當中的滿意度和滿意度評分兩個變數計算 合意度,最後與原始 768 筆資料所做出的合意度判別之間的差異狀況。. 政 治 大. 每次做完補值後,將連續型變數滿意度評分經由等級和常態分數兩種轉換,. 立. 再對滿意度和滿意度評分兩變數來算出其 Kappa、MA 和 Kendall’s W 等統計量估. ‧ 國. 學. 算補完值後資料的合意度。2000 次補完值的 Kappa、MA 和 Kendall’s W 值會再. ‧. 取中位數或平均數,接著重複以上步驟 500 次,可以得到 500 個,經由等級轉換 和常態分數轉換後所算出的平均數或中位數所畫出的箱型圖如圖 9 到圖 12 和摘. y. Nat. er. io. sit. 要表 25,其中各個圖中的橫線條表示 768 筆原始資料的 Kappa、MA 和 Kendall’s W 值,同表 25 中之實際值。圖 9 為遺漏值比例 1%並使用等級轉換方法,從中. n. al. Ch. i Un. v. 發現取中位數或是平均數其實差異不大,因此圖 10 到圖 12 都取中位數做為分析。. engchi. 由圖 10 到圖 12 發現使用常態分數轉換相較於等級轉換後的 Kappa 和 Kendall’s W 會相對於實際值會變得較低、而 MA 會變得較高,經由常態分數轉換和等級轉換 的模擬值 500 次分別與 768 筆原始資料的實際值做比較,發現使用等級轉換後的 值要來的比較小,也就是使用常態分數轉換後的結果會與實際狀況較接近。經過 等級轉換後,可降低系統差異,而經過常態分數轉換可降低隨機差異,兩種轉換 方法各有好壞,因此第四章實證分析使用此兩種轉換方法分別做分析。. 38.

(47) 最小值 第一四分位數 中位數 平均數 第三四分位數 最大值 實際值 遺漏值比例:1% 模擬 500 次:取平均數 轉換方法:等級轉換 Kappa. 0.5421. 0.5496. 0.5521. 0.5522. 0.5549. 0.5640. 0.5536. MA. 0.9413. 0.9432. 0.9437. 0.9438. 0.9444. 0.9490. 0.9450. Kendall's W 0.9099 0.9117 0.9122 0.9123 0.9129 遺漏值比例:1% 模擬 500 次:取中位數 轉換方法:等級轉換. 0.9166. 0.9133. Kappa. 0.5422. 0.5499. 0.5520. 0.5523. 0.5550. 0.5641. 0.5536. MA. 0.9415. 0.9433. 0.9440. 0.9440. 0.9446. 0.9492. 0.9450. Kendall's W 0.9101 0.9118 0.9124 0.9124 0.9130 遺漏值比例:1% 模擬 500 次:取中位數 轉換方法:常態分數轉換. 0.9167. 0.9133. Kappa. 0.5269. 0.5346. 0.5369. 0.5370. 0.5395. 0.5472. 0.5381. MA. 0.9566. 0.9586. 0.9591. 0.9592. 0.9597. 0.9633. 0.9594. Kendall's W 0.9085 0.9105 0.9111 0.9112 0.9118 遺漏值比例:5% 模擬 500 次:取中位數 轉換方法:等級轉換. 0.9145. 0.9113. 0.5456. 0.5619. 0.5536. 0.9429. 0.9470. 0.9450. Kendall's W 0.9039 0.9083 0.9096 0.9097 0.9110 遺漏值比例:5% 模擬 500 次:取中位數 轉換方法: 常態分數轉換. 0.9147. 0.9133. 立. 0.5353. MA. 0.9350. 0.9398. 0.9413. 0.5254. 0.5310. 0.5309. 0.5359. 0.5541. 0.5381. 0.9546. 0.9559. 0.9559. 0.9572. 0.9612. 0.9594. y. 0.9411. ‧. ‧ 國. 0.5169. 學. Kappa. 政 治 大 0.5406 0.5405. 0.9147. 0.9113. i v0.9396. 0.5571. 0.5536. 0.9466. 0.9450. Kendall's W 0.8989 0.9043 0.9079 遺漏值比例:10% 模擬 500 次:取中位數 轉換方法: 常態分數轉換. 0.9142. 0.9133. Kappa. 0.5039. MA. 0.9500. Nat. MA. 0.9301. sit. 0.5191. al. 0.9358. 0.5262. 0.5266. er. 0.4983. n. Kappa. io. Kendall's W 0.9028 0.9076 0.9088 0.9088 0.9101 遺漏值比例:10% 模擬 500 次:取中位數 轉換方法:等級轉換. C h 0.9378 0.9378U n e n g c0.9061 0.9061 hi. 0.5340. Kappa. 0.4906. 0.5167. 0.5230. 0.5232. 0.5300. 0.5561. 0.5381. MA. 0.9434. 0.9497. 0.9515. 0.9515. 0.9534. 0.9603. 0.9594. Kendall's W. 0.8971. 0.9038. 0.9057. 0.9058. 0.9077. 0.9158. 0.9113. 表 25、填補遺漏值後模擬 500 次之統計量摘要表. 39.

(48) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 圖 9、1%遺漏值模擬 500 次使用等級轉換後各統計量箱型圖. 40.

(49) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 圖 10、1%遺漏值模擬 500 次各統計量箱型圖. 41.

(50) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 圖 11、5%遺漏值模擬 500 次各統計量箱型圖. 42.

(51) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 圖 12、10%遺漏值模擬 500 次各統計量箱型圖 43.

(52) 由圖 10 到圖 12 資料 500 次的 Kappa、MA 或是 Kendall’s W 值,圖中的中位 數大部分都小於實際值,且經過常態分數轉換比起使用等級轉換與實際值的差異 要來的小,在接下來以實際值差異較大的等級轉換方法做圖當代表。模擬 500 次當中每一次都包含 2000 個模擬的值,將 2000 個模擬的值以箱型圖做分析如圖 13,其中第一次 2000 個模擬值的中位數與實際值的差異略大,緊接著再做第二 次卻發現差異與實際值差異變小,經過多次驗證都經由滿意度和滿意度評分兩變 數來看,是否因為遺漏值剛好大部分都抽到此兩變數所導致,其中一次模擬的滿. 政 治 大. 意度評分所包含的遺漏值有 50 個,但是差異卻沒有特別大。. 立. 如圖 13,雖然補完值後的結果 2000 筆 Kappa、MA 或是 Kendall’s W 值多數. ‧ 國. 學. 會高於實際值,但有時會小於實際值,資料都有左偏的趨勢,且在大多情況下 2000 次模擬值的中位數都略小於實際值,造成 500 次資料的平均值和中位數值. ‧. 都小於實際值。因此,會得到 500 次平均值和中位數值的結果畫箱型圖低於實際. Nat. sit. y. 的 Kappa、MA 或是 Kendall’s W 值,造成此影響是所研究的樣本之合意度都有一. n. al. er. io. 定的水準,使用各個統計量分析資料的合意度一定很高,所以會造成有左偏的現. i Un. v. 象,且 MA 和 Kendall’s W 值特別明顯,因為此兩統計量值皆非常趨近於 1,反. Ch. engchi. 觀 Kappa 值的變化較容易受影響且波動較大,因此左偏的情況沒有像 MA 和 Kendall’s W 值來的明顯。儘管 500 次模擬出來值的平均數和中位數值還是都略小 於實際值,但可以從圖形中看出偏離的情況較不嚴重,仔細觀察當中的差異不會 超過 0.05,經過模擬後,驗證出補值後與實際狀況差異不大。. 44.

(53) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 45. i Un. v.

(54) 立. 政 治 大. ‧ 國. 學 ‧. 圖 13、1%遺漏值模擬 2000 筆各統計量的箱型圖(其中三次). n. er. io. sit. y. Nat. al. Ch. engchi. 46. i Un. v.

(55) 第四章、實證分析 第一節、資料介紹 所使用的資料為生活環境滿意程度的 1010 筆,當中有包含許多變數,但是 在此分析只使用其中的性別、滿意度、學歷、滿意度評分和年齡這五個變數做分 析,性別和滿意度為類別變數,所剩下的學歷、滿意度評分及年齡為連續型變數, 由此五個變數對遺漏值進行填補之後,將連續型變數滿意度評分經過等級轉換或 常態分數轉換成為類別型變數,再與類別型變數滿意度做合意度的分析。. 政 治 大 合意度分析關注在連續型變數滿意度評分和類別型變數滿意度兩個,在給定 立. ‧ 國. 學. 滿意度評分為遺漏值的情況下分別觀察性別、學歷和年齡三個變數,變數中的選 項遺漏值比例,如表 26 看到女生較容易產生不填答的情況;學歷有越低越不填. ‧. 答的趨勢,其中國小和遺漏值最容易產生不填答的情況;年齡不填答比例大致上. sit. y. Nat. 相同,其中年齡介於 20 到 24 最不容易發生不填答情況,而大於 70 的人最容易. n. al. er. io. 產生不填答的情況。另外,在給定滿意度為遺漏值的情況下如表 27,一樣是女. i Un. v. 生較容易有不填答的情況,學歷越低,如國小、國中或為遺漏值時較容易產生不. Ch. engchi. 填答的情況,年齡大於 70 的人一樣最容易產生不填答的情況。各個變數遺漏值 比例也是造成合意度不佳的原因之一,而第二節會再做更進一步的解釋。. 47.

(56) 表 26、給定滿意度評分為遺漏值各別變數各選項的個數及比例. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 48. i Un. v.

(57) 表 27、給定滿意度為遺漏值各別變數各選項的個數及比例. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 49. i Un. v.

(58) 第二節、補值與合意度分析 首先,資料補值使用原始資料的 1010 筆,變數包含性別、滿意度、學歷、 滿意度評分和年齡五個變數,基本資料當中,五個變數的遺漏值個數分別佔 0 個、209 個、9 個、62 個和 5 個,共 285 個,佔總資料大約 5%。研究目標是觀 察經過補值後,五個變數當中的類別型變數滿意度和連續型變數滿意度評分之間 的合意度判斷。將連續型變數經過轉換而變成類別型變數,分別使用等級轉換和 常態分數轉換兩種方法進行分析。連續型變數滿意度評分經過轉換後,將兩個類 別型變數使用第二章所提到的統計量,分析評分者給予滿意度分數和滿意度評分 之間的合意度。. 立. 政 治 大. 如圖 14 為模擬 5000 次補值後算出各個統計量的箱型圖,其中橫線條表示原. ‧ 國. 學. 始資料刪去遺漏值後剩下的 768 筆資料所做出的統計量值,從圖 14 中可以很明. ‧. 顯的看出差異。使用等級轉換方法,經過此轉換後,兩類別變數滿意度和滿意度 評分的各個尺度次數大致相同,因此不考慮系統差異的合意度統計量。經過補值. y. Nat. n. al. er. io. 表示合意度變差。. sit. 後統計量 Kendall’s W、Spearman、Kappa、MA 值都明顯合意度變差,RV 值變大. Ch. engchi. 50. i Un. v.

(59) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 圖 14、模擬 5000 次經等級轉換後各統計量箱型圖. 51.

(60) 使用常態分數轉換方法與等級轉換方法不同,不會有滿意度和滿意度評分的 尺度次數大致相同的情況,因此要多考慮到系統差異的合意度統計量 RP 和 RC。 如圖 15 趨勢與等級轉換後的結果相同,經過補完值後統計量 Kendall’s W、 Spearman、Kappa、MA 值都明顯合意度變差,RV 值變大同理。同第三章模擬情 形一樣,使用常態分數轉換的結果相較於等級轉換方法隨機差異有稍微小一點。 而系統差異經過補值後的 RP 和 RC 合意度都有稍微變好的趨勢,代表評分者在 給予滿意度和滿意度評分的分數時,不會有給予其中一種分數較高的情況,且評 分者對於兩變數不會給予滿意度較集中在中間尺度的分數。. 政 治 大 評分和年齡這 5 個變數的遺漏值個數分別佔 0 個、209 個、9 個、62 個和 5 個, 立 由圖 15 的結果,可以從遺漏值的比例來看,性別、滿意度、學歷、滿意度. ‧ 國. 學. 共 285 個。看似遺漏值個數大約只有 5%,但遺漏值大多集中在滿意度和滿意度 評分,這跟用來判斷合意度的變數相同,只關注在這兩個變數就會發現遺漏值比. ‧. Nat. er. io. sit. 非隨機產生,而當中的遺漏值是受到某特定變數所影響。. y. 例高達有 13%之多,導致差異會如此之大的原因。另一個可能是當中的遺漏值並. 如表 26、27 看到女生較容易產生不填答的情況,學歷有越低越不填答的趨. n. al. Ch. i Un. v. 勢,且年齡大於 70 歲的人最容易產生不填答的情況。與第三章表 22、23 當中顯. engchi. 示學歷越低的評分者合意度也越低,且表 26、27 顯示學歷越低也越有不填答的 趨勢,因此這也是原因之一,使得模擬 5000 次的各統計量與刪去遺漏值樣本時 的結果差異狀況,會比第三章模擬 10%遺漏值來的較大。. 52.

(61) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 圖 15、模擬 5000 次經常態分數轉換後各統計量箱型圖. 53.

參考文獻

相關文件

下圖一是測量 1994 年發生於洛杉磯的 Northridge 地震所得 到的圖形。任意給定一個時間 t ,從圖上可看出此時間所對

這次的實驗課也分成兩個禮拜完成,在實驗過程中我們幾乎都很順利完成了課堂上要達到的目標

相關分析 (correlation analysis) 是分析變異數間關係的

危機事件 後果 可預測性 持續性 震撼程度 估計危機 影響程度 一對小四及小. 二的兄妹,居 於學校同邨的

古代希臘人對幾何學的貢獻,眾所周知。有位數學家把它

l  對事情高度敏感 l  對於細節沒有興趣 l  對別人的批評有過激反應 l  隱藏資優特質以獲取認同 l  有高度的社會及道德責任 l  不樂意接受微不足道的任務

將基本學力測驗的各科量尺分數加總的分數即為該考生在該次基測的總 分。國民中學學生基本學力測驗自民國九十年至九十五年止基測的總分為 300 分,國文科滿分為 60

因此在表 5-4 評估次項目中,統計結果顯示政治穩定度、房產政 策、官僚政治以及景氣是接受度最高的,可以顯示政局安定以及當局