第二章、 文獻探討
第四節 隨機差異和系統差異
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
8
在做運算時會將列聯表做等級化合意度格式轉換(Rank-transformable pattern of agreement)或稱為 RTPA 的轉換,這個轉換就是將表中格子整個重新排列,在 不影響到兩變數邊際數目的情況下,使得每個非零的格子都滿足Rij(X) Rij( )Y ,也 就是將原本表 3 的列聯表轉換成如表 4 形式。
表 4、經過 RTPA 後的病患自我評估(X)和醫生評估(Y)的 58 筆樣本
第四節 隨機差異和系統差異
Svensson(1994)提到比較兩觀察者之間的差異會同時存在隨機差異(Random difference)和系統差異(System difference),如表 5 為 Svensson(1994)的資料,為兩 組神經放射研究員 A 和 B 在調查 59 位腦水腫病患的嚴重程度所打的分數,腦水 腫程度由輕微到嚴重分別為 H1、H2、H3 和 H4。
當表 5 經過 RTPA 轉換後如表 6,轉換方式僅由邊際個數來做排序,可藉由 表 7 輔助觀察,前 22 個觀察資料都為 H1,所以(H1,H1)格子就填 22,而第 23
‧
‧
(一)隨機差異(Random difference)
在做兩觀測者之間的合意度比較時會同時存在系統差異和隨機差異,這時等 級轉換後的值差異越大就會造成合意度越差,所以均方差即是一個適合用來對隨 機差異做觀測的統計量,稱為相對等級變異(relative rank variance)或稱為 RV ,定 義公式為
‧
‧
of monotonic agreement),簡稱為 MA。其定義為合意度和合意度不佳比率之差對 於成對樣本的結果,表示為A D
或 1 2 D (2.4.4)
滿足 1 1,參數不僅是用來表示合意度比率和合意度不佳比率之間的相
‧
(二)位置分布系統差異(Systematic difference in position)
給定變數 X 和 Y 為成對且有順序的資料,其分配可寫為pv(X) p X( v)和 來表示位置的分布程度,稱為相對位置(Relative position)或稱 RP ,
( ) ( ) ( ) ( )
受試者操作特徵曲線(receiver operating characteristic curve)或稱 ROC 曲線,
由雷達工程師發明用於戰爭當中,座標圖式的分析工具可用來偵測戰場上的敵軍 飛機、船艦。後來 ROC 曲線被用於醫學、無線電、生物學、犯罪心理學領域中,
且近年來也經常使用在數據挖掘的領域。
Svensson and Holm (1994)提到的 ROC 曲線也可用來判斷兩觀測者之間是否 誰給予較高的評分,若觀測者Y 對於 X 的習慣給予較低的評分,則 ROC 曲線會 偏向Y 的方向如圖 1。
‧
(三)位置集中系統差異(Systematic difference in concentration)
其中一位觀測員習慣給予較集中的評分,此時 ROC 曲線會呈現 S 型如圖 2,
此資料為 Svensson(1994)中另外一筆由兩組神經放射研究員 A 和 B 在調查 59 位 腦水腫病患的嚴重程度所打的分數,腦水腫程度由輕微到嚴重分別為 F1、F2、
F3 和 F4,結果如表 9。經由此筆資料所算出之RP 值會很小,但是其中一位觀測 員給予過度集中的評分依然會造成合意度不佳,使用統計量稱為相對集中 (relative concentration)或稱 RC ,定義為
( ) ( ) ( ) ( ) ( ) ( )
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
16
圖 2、兩觀測者給予評分的 ROC 曲線
表 10 有四個例子,樣本中的邊際數目都相同,此時RP RC, 值都為相同,但 是從四個表中樣本分布的趨勢可以很明顯地看出有所不同,也可以很明確地看出 合意度差異很大,此時無法經由系統差異的RP RC, 來對樣本合意度不佳做合理 的解釋,因此要看到隨機差異的部分,經由 RV 值得變化來解釋合意度不佳的產 生。
表 10 中四筆資料的系統差異合意度不佳統計量值,經過計算得RP0.0562, 此值為正且很小,這表示觀測者 B 相對於觀測者 A 習慣給予較高的評分,但是 差異不大。當中的RC 0.00785,此值為負且很小,這表示觀測者 A 相對於觀 測者 B 習慣給予較集中在中間等級的評分。緊接著看到隨機差異 RV 值,表 10 中四個表的 RV 值從小到大分別為一、二、三和四,表一的合意度最高而表四的 合意度最低,結果與四個表中所查到的樣本分布狀況來判斷結果也相同。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
17
表 10、四組不同資料但邊際數目皆相同
表 10 所計算出的各個統計量值可把順序資料的合意度檢查流程整理如圖 3。
首先,經判斷資料分布的邊際次數,當邊際次數相等,此時又Rij(X)Rij( )Y ,則 0
RV RPRC ,若Rij(X)Rij( )Y 則就可經由 RV 值對合意度不佳的原因做解釋。
另一部份是當邊際次數不相等,若Rij(X)Rij( )Y 則RV 0,此時要用系統差異的 ,
RP RC值和 ROC曲線來判斷,而若是Rij(X) Rij( )Y 則還需要經過系統及隨機差異 等多種統計量及 ROC曲線來做分析。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
18
圖 3、系統差異和隨機差異判斷流程圖