第三章 研究方法
第三節 研究工具
第三節 研究工具
本研究採用兩份健康相關生活品質問卷(1).EORTC QLQ-C30:為歐 洲癌症研究與治療組織癌症生活品質核心問卷;(2).EORTC QLQ-PR25:
為歐洲癌症研究與治療組織攝護腺癌生活品質問卷。問卷採以病人自填 為優先進行方式,若病患無法自填則由家屬逐題詢問,或者由本研究人
員以標準結構式訪視完成。
EORTC QLQ-C30 問卷
EORTC QLQ-C30 (European Organization for Research and Treatment of Cancer 30-item core quality of life questionnaire)(41, 42)問卷前身為 EORTC QLQ-C36,於 1987 年被發表,原有 36 道題目,是由歐洲癌症治 療與研究組織發展出來的一份測量癌症患者生活品質的問卷,此問卷適 用於所有癌症的患者,經不斷修改,於1993 年正式修訂為 30 題。EORTC QLQ-C30 健康量表被提出後,翻譯成十幾種語言(43),Aaronson 等人於 1993 年對英語系國家進行 EORTC QLQ-C30 之信效度檢定(44),其測量信 度(reliability)之 Cronbach’s alpha 值大部份皆≧0.70;效度方面(validity)
則可依不同測量項目間之關係與不同症狀或功能間的分別差異。本問卷 中文版係由季瑋珠等學者翻譯與驗證(45),其問卷結構內容及屬性如下:
範疇(構面) 屬性 題數 級距 題目摘要 題目編號
身體功能
(Physical Functioning,PF)
功能 5 4 費力活動、長距離步行、短距
離步行、需要坐臥、他人輔助
1-5
角色功能
(Role Functioning,RF)
功能 2 4 工作受限、休閒娛樂受限 6,7
情緒功能
(Emotional Functioning,EF)
功能 4 4 緊張、焦慮、易怒、情緒低落 21-24
範疇(構面) 屬性 題數 級距 題目摘要 題目編號
(Nausea / Vomiting,NV)
症狀 2 4 噁心、嘔吐 14,15
(Global health status,QL)
整體 2 7 整體健康、整體生活品質 29,30
題目特質上,除整體生活品質總評之題目為序位性七選一(非常差 到極好)的單選題以外,每一題各有四個選項,均為序位性四選一,量 尺內容為1:完全沒有(not at all)、2:有一點(a little)、3:相當多(quite a bit)、4:非常多(very much)。原始分數每題可轉換為 1-4 分方向一 致的正向分數(分數越高表生活品質越好、越沒有症狀),而有關範疇
之計分方式,每一題採相同權重,透過公式線性轉換,可轉為0-100 的分 數。除與癌症症狀相關之範疇測量其分數愈高表示愈嚴重或生活品質愈 差外,其餘範疇均是分數愈高代表生活品質愈佳。整體而言,題型整齊,
用語簡明,便於自填或由訪員訪問作答,自填時間約10 分鐘(45)。
EORTC QLQ-PR25 問卷
為歐洲癌症研究與治療組織專為攝護腺癌所發展出來的一份疾病特 定性的生活品質問卷,須搭配EORTC QLQ-C30 問卷使用(45),共有25 個 題目,涵蓋了 4 個層面,所有的題目皆為序位性四選一的題型,量尺內 容為1:完全沒有(not at all)、2:有一點(a little)、3:相當多(quite a bit)、4:非常多(very much)。原始分數每題可轉換為 1-4 分方向一 致的正向分數(分數越高表生活品質越好、越沒有症狀),而範疇之計 分方式,每一題採相同權重,透過公式線性轉換,可轉為0-100 的分數。
除性功能範疇分數愈高代表生活品質愈佳外,其餘均是分數愈高表示病 症愈嚴重或生活品質愈差。其問卷結構內容及屬性如下:
範疇(構面) 屬性 題數 級距 題目摘要 題目代號
排尿症狀
(Urinary Symptoms,US)
症狀 9 4 白天頻尿、夜晚頻尿、尿急、夜 尿、影響外出、漏尿、小便疼痛、
尿片或護墊問題、日常活動受限
31-39
排便症狀 症狀 4 4 日常活動受限、大便失禁、大便 40-43
範疇(構面) 屬性 題數 級距 題目摘要 題目代號
(Bowel Symptoms,BS) 帶血、腹脹
與治療相關之症狀
(Treatment-related Symptoms,TS)
症狀 6 4 熱潮紅、乳頭或乳房酸痛增大、
腿部或腳踝腫脹、體重減輕、體 重增加、缺乏男人味
44-49
性功能
(Sexual Functioning,SX)
功能 6 4 興趣的程度、性生活活躍的程
度、愉快的程度、勃起困難、射 精問題、接觸不舒服
50-55
第四節 資料統計與分析
傳統心理計量分析
(1) 為瞭解各範疇題目分數的分布情形以平均值、標準差進行描述,並 按分數高低排名,以了解各試題的難度順序。而各題選答最高選項
(例:完全沒有)的比例及選答最低選項(例:非常多)的比例,
則用以估計各題目得分的天花板效應(ceiling effect)與地板效應
(floor effect)。
(2) 問卷內部ㄧ致性分析:各範疇之內部ㄧ致性以 Cronbach’s
α coefficient 表示,值大於 0.7 則認為具有好的內部ㄧ致性;並揭示 各題與其所屬範疇各題之間的相關係數,如果係數太低即可考慮刪 除此題。
(3) 以二獨立樣本的 t 檢定或 ANOVA 分析兩問卷各範疇平均得分在不
同治療方式、不同疾病嚴重程度、不同年齡層的患者間是否有統計 上的顯著差異,藉此判斷問卷的區辨效度。並比較以範疇測量或以 題目逐項測量的結果是否相同,何者較能敏銳偵測患者的生活品質 差異狀況。
(4) 以成對樣本的 t 檢定比較患者在治療前與治療後隨時間變化之各項 生活品質的反應變化情況,測量的時間點為治療前、治療後1 個月、
治療後3 個月、治療後 6 個月,均以治療前當做基期,各自互相比 較。
現代心理計量分析
鑒於傳統的測量方法,受限於遺漏值、常將順序尺度當作等距尺度 處理、研究樣本不同而推論結果也將不同的樣本依賴(sample dependent)
與試題依賴(item depencent)的限制、與各層面項目權重比值不同而逕 以相同權重處理等的資料處理困難性,而使分析出來的資料品質或是統 計推論,產生不穩定的瑕疵,同時亦無法區別及預測每一個人的能力,
因此如何利用現代測量理論(modern test theory, MTT)的 Rasch 測量工 具,以期更充分且客觀的測量,以正確估計出受試者的潛在特質(即能 力的大小)也是本研究的立意所在。
因此本研究除了運用傳統的測量方式之外,並利用 IRT 中之 Rasch
系列的部分給分模式(partial credit model)將順序的量尺(總分)化為等 距的量尺,評估EORTC QLQ-C30 與 EORTC QLQ-PR25 應用在攝護腺癌 患者的適用性,檢測問卷是否具有下列心理計量特質(29):
(1) 單一向度(unidimensionality):
同一範疇內的所有題目都是測量相同的某一項能力,這是大部分測 驗的必備條件,只有當測驗中的題目都是測量相同的能力,我們才 適合將受試者在這些題目上的得分經由某種轉換而得到一個分 數,而用這分數來代表這些受試者的能力。
適合度指標的估計是計算每一個受試者在每個題目的反應殘差,即 真實的反應(xni)與Rasch模式所估計的期望值(Eni)相差多少?
ni ni
ni x -E
y =
殘差的分佈常為一個z或t分佈,當要檢驗題目於所屬範疇的適合度 時,我們常以其平均值均方(mean square fit statistic)做為統計量,
此適合度指標可進ㄧ步分為:(1) outfit statistic-是傳統標準化殘差 平方的加總,為受試者對試題太容易或太困難之非期望反應的敏感 性指標;(2) infit statistic-是加權變異數(σ2)後的標準化殘差平方 加總,故是對極端值外不太易或不太難試題之非期望反應的敏感性 指標。Fit統計數值大小與解釋可如下表(33, 46):
Fit 統計值與診斷訊息
試題反應 MNSQ
容易 適中 困難 診斷訊息
Outfit Intfit 1 1 1 0 1 1 0 1 1 0 1 0 0 0 0 0 理想模式型態 → 0.7 < Fit < 1.4 1.0 1.0 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 太神奇準確 → Infit 與 Outfit 皆低 0.3 0.5 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 太離譜(全錯) → Infit 與 Outfit 皆很高 12.6 4.3 0 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 易題粗心錯 → Infit 較無影響 3.8 1.0 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 1 難題猜對 → Outfit 上升, Infit 無影響 3.8 1.0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 各題型皆略離譜 → Infit 與 Outfit 皆較高 4.0 2.3 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 適中題稍離譜 → Infit 略昇 0.9 1.3 1 1 1 1 0 1 0 1 1 0 0 1 0 0 0 0 難易正常, 適中題尚可 → Onfit 略低 0.6 1.0 註:Fit<0.7 表示資料變易情況比模式預期的少,受測者做答型態過於一致
Fit>1.4 表示資料變易情況比模式預期的多,受測者做答型態過於隨機
由於infit是將outfit經訊息加權後的形式(information-wieghted form),此加權過程將可減低較偏離主要研究對象能力所在範圍部 份所造成的影響,因此infit statistic較outfit statistic敏感,且不易受 極端值的影響,故在本研究的Rasch分析中,我們將以infit statistic 作為評估單一向度的指標,若infit統計量>1.4則代表題目不符合單 一向度的假設(33, 46)。
(2) 題目難度(item difficulty):
Rasch模式可經由理論機率模式將題目難度與人的能力放在相同尺 度上來比較,單位為logit,logit尺度為一連續的尺度。若題目難度 的logit越大,代表題目難度越高,亦即該題目對受試者而言不容易 填答高分的選項;相同的,若題目難度的logit越低,則表示該題目 難度較低,受試者較容易填答高分的選項。在本研究中,題目難度
指的為受試者的生活品質(quality of life, QoL),分數較高代表生 活品質越好。
(3) 區別性指標(person and item separation):
描述該範疇的題目區辨不同能力受試者的程度,指標越大,代表題 目越能在測量中區辨出人的能力。若person separation index達1.5代 表可接受的區辨能力,2.0代表良好的區辨能力,3.0代表題目具有 非常好的區辨能力
(4) 題目適中性(targeting):
用來評估題目難度與研究對象能力的適中性。在題目的校準上,假 設不同題目間平均難度固定為0。因此,若所有人在該範疇的平均 得分若為0,表示這些題目的難度對研究對象是適中的。所有人在 該範疇的平均得分離0越遠,表示這一組題目是mis-targeted。
統計分析工具
1. 以 Excel 建立檔案。
2. 以 SAS 9.1 進行資料處理與統計分析。
3. 以 WINSTEPS 套裝軟體進行 Rasch 系列的部分給分模式(partial credit model)分析。
第四章 研究結果
第一節 基本人口學變項之統計
本研究共收案攝護腺癌患者 91 人,但其中有 13 人屬進階療程,全 部個案平均年齡為70.4±7.3(範圍 53.9~92 歲),攝護腺特異抗原(PSA)
指標平均為46.4±146.7(範圍 0.02~933),而 Gleason score 平均為 6.5±1.6
(範圍3~9)。診斷後之治療接受手術者 37 人(40.7%),放射線治療者 33 人(36.3%),荷爾蒙治療者 17 人(18.7%),化學治療 4 人(4.4%)。
依腫瘤的侵犯程度分期:T1-T2 有 65 人(74.7%)、T3-T4 有 22 人
(25.3%)。依疾病嚴重度分期:Stage I 有 1 人(1.1%)、Stage II 有 61 人(70.1%)、Stage III 有 13 人(14.9%)、Stage IV 有 12 人(13.8%)。
依治療危險程度分級:低危險族群(Low)有 15 人(18.3%)、中危險 族群(Mediate)有 44 人(53.7%)、高危險族群(Hight)23 人(28%)。
依疼痛程度分級:完全沒有者62 人(68.1%)、有一點者 26 人(28.6%)、
相當多者3 人(3.3%)(表一)
整體而言,在年齡分布上,手術組的患者相較於放射線治療與其他 治療組年輕;而在疾病嚴重度方面,其他治療(賀爾蒙或化療)組則相 較於手術組與放射線治療組有較嚴重的疾病分期與PSA 指數。(表一)