研究工具

第三章研究方法

第三節研究工具

本研究採用兩份健康相關生活品質問卷(1).EORTC QLQ-C30：為歐洲癌症研究與治療組織癌症生活品質核心問卷；(2).EORTC QLQ-PR25：

為歐洲癌症研究與治療組織攝護腺癌生活品質問卷。問卷採以病人自填為優先進行方式，若病患無法自填則由家屬逐題詢問，或者由本研究人

員以標準結構式訪視完成。

EORTC QLQ-C30 問卷

EORTC QLQ-C30 （European Organization for Research and Treatment of Cancer 30-item core quality of life questionnaire）^{(41, 42)}問卷前身為 EORTC QLQ-C36，於 1987 年被發表，原有 36 道題目，是由歐洲癌症治療與研究組織發展出來的一份測量癌症患者生活品質的問卷，此問卷適用於所有癌症的患者，經不斷修改，於1993 年正式修訂為 30 題。EORTC QLQ-C30 健康量表被提出後，翻譯成十幾種語言⁽⁴³⁾，Aaronson 等人於 1993 年對英語系國家進行 EORTC QLQ-C30 之信效度檢定⁽⁴⁴⁾，其測量信度（reliability）之 Cronbach’s alpha 值大部份皆≧0.70；效度方面（validity）

則可依不同測量項目間之關係與不同症狀或功能間的分別差異。本問卷中文版係由季瑋珠等學者翻譯與驗證⁽⁴⁵⁾，其問卷結構內容及屬性如下：

範疇（構面）屬性題數級距題目摘要題目編號

身體功能

（Physical Functioning，PF）

功能 5 4 費力活動、長距離步行、短距

離步行、需要坐臥、他人輔助

1-5

角色功能

（Role Functioning，RF）

功能 2 4 工作受限、休閒娛樂受限 6,7

情緒功能

（Emotional Functioning，EF）

功能 4 4 緊張、焦慮、易怒、情緒低落 21-24

範疇（構面）屬性題數級距題目摘要題目編號

（Nausea / Vomiting，NV）

症狀 2 4 噁心、嘔吐 14,15

（Global health status，QL）

整體 2 7 整體健康、整體生活品質 29,30

題目特質上，除整體生活品質總評之題目為序位性七選一（非常差到極好）的單選題以外，每一題各有四個選項，均為序位性四選一，量尺內容為1：完全沒有（not at all）、2：有一點（a little）、3：相當多（quite a bit）、4：非常多（very much）。原始分數每題可轉換為 1-4 分方向一致的正向分數（分數越高表生活品質越好、越沒有症狀），而有關範疇

之計分方式，每一題採相同權重，透過公式線性轉換，可轉為0-100 的分數。除與癌症症狀相關之範疇測量其分數愈高表示愈嚴重或生活品質愈差外，其餘範疇均是分數愈高代表生活品質愈佳。整體而言，題型整齊，

用語簡明，便於自填或由訪員訪問作答，自填時間約10 分鐘⁽⁴⁵⁾。

EORTC QLQ-PR25 問卷

為歐洲癌症研究與治療組織專為攝護腺癌所發展出來的一份疾病特定性的生活品質問卷，須搭配EORTC QLQ-C30 問卷使用⁽⁴⁵⁾，共有25 個題目，涵蓋了 4 個層面，所有的題目皆為序位性四選一的題型，量尺內容為1：完全沒有（not at all）、2：有一點（a little）、3：相當多（quite a bit）、4：非常多（very much）。原始分數每題可轉換為 1-4 分方向一致的正向分數（分數越高表生活品質越好、越沒有症狀），而範疇之計分方式，每一題採相同權重，透過公式線性轉換，可轉為0-100 的分數。

除性功能範疇分數愈高代表生活品質愈佳外，其餘均是分數愈高表示病症愈嚴重或生活品質愈差。其問卷結構內容及屬性如下：

範疇（構面）屬性題數級距題目摘要題目代號

排尿症狀

（Urinary Symptoms，US）

症狀 9 4 白天頻尿、夜晚頻尿、尿急、夜尿、影響外出、漏尿、小便疼痛、

尿片或護墊問題、日常活動受限

31-39

排便症狀症狀 4 4 日常活動受限、大便失禁、大便 40-43

範疇（構面）屬性題數級距題目摘要題目代號

（Bowel Symptoms，BS）帶血、腹脹

與治療相關之症狀

（Treatment-related Symptoms，TS）

症狀 6 4 熱潮紅、乳頭或乳房酸痛增大、

腿部或腳踝腫脹、體重減輕、體重增加、缺乏男人味

44-49

性功能

（Sexual Functioning，SX）

功能 6 4 興趣的程度、性生活活躍的程

度、愉快的程度、勃起困難、射精問題、接觸不舒服

50-55

第四節資料統計與分析

傳統心理計量分析

（1）為瞭解各範疇題目分數的分布情形以平均值、標準差進行描述，並按分數高低排名，以了解各試題的難度順序。而各題選答最高選項

（例：完全沒有）的比例及選答最低選項（例：非常多）的比例，

則用以估計各題目得分的天花板效應（ceiling effect）與地板效應

（floor effect）。

（2）問卷內部ㄧ致性分析：各範疇之內部ㄧ致性以 Cronbach’s

α coefficient 表示，值大於 0.7 則認為具有好的內部ㄧ致性；並揭示各題與其所屬範疇各題之間的相關係數，如果係數太低即可考慮刪除此題。

（3）以二獨立樣本的 t 檢定或 ANOVA 分析兩問卷各範疇平均得分在不

同治療方式、不同疾病嚴重程度、不同年齡層的患者間是否有統計上的顯著差異，藉此判斷問卷的區辨效度。並比較以範疇測量或以題目逐項測量的結果是否相同，何者較能敏銳偵測患者的生活品質差異狀況。

（4）以成對樣本的 t 檢定比較患者在治療前與治療後隨時間變化之各項生活品質的反應變化情況，測量的時間點為治療前、治療後1 個月、

治療後3 個月、治療後 6 個月，均以治療前當做基期，各自互相比較。

現代心理計量分析

鑒於傳統的測量方法，受限於遺漏值、常將順序尺度當作等距尺度處理、研究樣本不同而推論結果也將不同的樣本依賴（sample dependent）

與試題依賴（item depencent）的限制、與各層面項目權重比值不同而逕以相同權重處理等的資料處理困難性，而使分析出來的資料品質或是統計推論，產生不穩定的瑕疵，同時亦無法區別及預測每一個人的能力，

因此如何利用現代測量理論（modern test theory, MTT）的 Rasch 測量工具，以期更充分且客觀的測量，以正確估計出受試者的潛在特質（即能力的大小）也是本研究的立意所在。

因此本研究除了運用傳統的測量方式之外，並利用 IRT 中之 Rasch

系列的部分給分模式（partial credit model）將順序的量尺（總分）化為等距的量尺，評估EORTC QLQ-C30 與 EORTC QLQ-PR25 應用在攝護腺癌患者的適用性，檢測問卷是否具有下列心理計量特質⁽²⁹⁾：

（1）單一向度（unidimensionality）：

同一範疇內的所有題目都是測量相同的某一項能力，這是大部分測驗的必備條件，只有當測驗中的題目都是測量相同的能力，我們才適合將受試者在這些題目上的得分經由某種轉換而得到一個分數，而用這分數來代表這些受試者的能力。

適合度指標的估計是計算每一個受試者在每個題目的反應殘差，即真實的反應（^xⁿⁱ）與Rasch模式所估計的期望值（^Eⁿⁱ）相差多少？

ni ni

ni x -E

y =

殘差的分佈常為一個z或t分佈，當要檢驗題目於所屬範疇的適合度時，我們常以其平均值均方（mean square fit statistic）做為統計量，

此適合度指標可進ㄧ步分為：(1) outfit statistic－是傳統標準化殘差平方的加總，為受試者對試題太容易或太困難之非期望反應的敏感性指標；(2) infit statistic－是加權變異數（σ²）後的標準化殘差平方加總，故是對極端值外不太易或不太難試題之非期望反應的敏感性指標。Fit統計數值大小與解釋可如下表^{(33, 46)}：

Fit 統計值與診斷訊息

試題反應 MNSQ

容易適中困難診斷訊息

Outfit Intfit 1 1 1 0 1 1 0 1 1 0 1 0 0 0 0 0 理想模式型態 → 0.7 < Fit < 1.4 1.0 1.0 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 太神奇準確 → Infit 與 Outfit 皆低 0.3 0.5 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 太離譜(全錯) → Infit 與 Outfit 皆很高 12.6 4.3 0 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 易題粗心錯 → Infit 較無影響 3.8 1.0 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 1 難題猜對 → Outfit 上升, Infit 無影響 3.8 1.0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 各題型皆略離譜 → Infit 與 Outfit 皆較高 4.0 2.3 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 適中題稍離譜 → Infit 略昇 0.9 1.3 1 1 1 1 0 1 0 1 1 0 0 1 0 0 0 0 難易正常, 適中題尚可 → Onfit 略低 0.6 1.0 註：Fit<0.7 表示資料變易情況比模式預期的少，受測者做答型態過於一致

Fit>1.4 表示資料變易情況比模式預期的多，受測者做答型態過於隨機

由於infit是將outfit經訊息加權後的形式（information-wieghted form），此加權過程將可減低較偏離主要研究對象能力所在範圍部份所造成的影響，因此infit statistic較outfit statistic敏感，且不易受極端值的影響，故在本研究的Rasch分析中，我們將以infit statistic 作為評估單一向度的指標，若infit統計量＞1.4則代表題目不符合單一向度的假設^{(33, 46)}。

（2）題目難度（item difficulty）：

Rasch模式可經由理論機率模式將題目難度與人的能力放在相同尺度上來比較，單位為logit，logit尺度為一連續的尺度。若題目難度的logit越大，代表題目難度越高，亦即該題目對受試者而言不容易填答高分的選項；相同的，若題目難度的logit越低，則表示該題目難度較低，受試者較容易填答高分的選項。在本研究中，題目難度

指的為受試者的生活品質（quality of life, QoL），分數較高代表生活品質越好。

（3）區別性指標（person and item separation）：

描述該範疇的題目區辨不同能力受試者的程度，指標越大，代表題目越能在測量中區辨出人的能力。若person separation index達1.5代表可接受的區辨能力，2.0代表良好的區辨能力，3.0代表題目具有非常好的區辨能力

（4）題目適中性（targeting）：

用來評估題目難度與研究對象能力的適中性。在題目的校準上，假設不同題目間平均難度固定為0。因此，若所有人在該範疇的平均得分若為0，表示這些題目的難度對研究對象是適中的。所有人在該範疇的平均得分離0越遠，表示這一組題目是mis-targeted。

統計分析工具

1. 以 Excel 建立檔案。

2. 以 SAS 9.1 進行資料處理與統計分析。

3. 以 WINSTEPS 套裝軟體進行 Rasch 系列的部分給分模式（partial credit model）分析。

第四章研究結果

第一節基本人口學變項之統計

本研究共收案攝護腺癌患者 91 人，但其中有 13 人屬進階療程，全部個案平均年齡為70.4±7.3（範圍 53.9~92 歲），攝護腺特異抗原（PSA）

指標平均為46.4±146.7（範圍 0.02~933），而 Gleason score 平均為 6.5±1.6

（範圍3~9）。診斷後之治療接受手術者 37 人（40.7%），放射線治療者 33 人（36.3%），荷爾蒙治療者 17 人（18.7%），化學治療 4 人（4.4%）。

依腫瘤的侵犯程度分期：T1-T2 有 65 人（74.7%）、T3-T4 有 22 人

（25.3%）。依疾病嚴重度分期：Stage I 有 1 人（1.1%）、Stage II 有 61 人（70.1%）、Stage III 有 13 人（14.9％）、Stage IV 有 12 人（13.8%）。

依治療危險程度分級：低危險族群（Low）有 15 人（18.3%）、中危險族群（Mediate）有 44 人（53.7%）、高危險族群（Hight）23 人（28%）。

依疼痛程度分級：完全沒有者62 人（68.1%）、有一點者 26 人（28.6%）、

相當多者3 人（3.3%）（表一）

整體而言，在年齡分布上，手術組的患者相較於放射線治療與其他治療組年輕；而在疾病嚴重度方面，其他治療（賀爾蒙或化療）組則相較於手術組與放射線治療組有較嚴重的疾病分期與PSA 指數。（表一）

在文檔中測量攝護腺癌患者的生活品質：EORTC-C30及EORTC-PR25問卷之心理計量特質 (頁 42-0)

第三章 研究方法

第三節 研究工具

第三節 研究工具

EORTC QLQ-C30 問卷

EORTC QLQ-PR25 問卷

第四節 資料統計與分析

統計分析工具

第四章 研究結果

第一節 基本人口學變項之統計

第三章研究方法

第三節研究工具

第三節研究工具

第四節資料統計與分析

第四章研究結果

第一節基本人口學變項之統計