發展思覺失調症患者之工作社交技巧電腦化多階段角色扮演測驗

(1)

國立臺灣大學醫學院職能治療學系博士論文

School of Occupational Therapy College of Medicine National Taiwan University

Doctoral Dissertation

發展思覺失調症患者之工作社交技巧電腦化多階段角色扮演測驗

Development of a computerized multistage role-play testing of employment social skills in patients with schizophrenia

黃怡靜 Yi-Jing Huang

指導教授：謝清麟教授

Advisor: Ching-Lin Hsieh, Professor

中華民國 107 年 5 月

May, 2018

(2)

口試委員會審定書

(3)

中文摘要

背景與目的：工作社交技巧 (employment social skills) 為影響思覺失調症患者求職與工作適應的主因之一。完整、精確且快速地評估患者之工作社交技巧，可協助臨床人員擬訂職業復健計畫與呈現復健成效。角色扮演測驗為當今最為推薦之工作社交技巧評估方式，然而目前缺乏內容完整、對於施測者負擔小、具備良好心理計量特性的工作社交技巧角色扮演測驗。此限制嚴重影響專業人員快速且精準地掌握患者問題，使得社交技巧訓練與職業重建的成效難以進一步提升。為克服現有測驗之限制，本研究之目的有二：(1) 發展一套適用於思覺失調症患者之完整、快速暨精準的「工作社交技巧電腦化多階段角色扮演測驗」(COmputerized Multistage role-play Testing of Employment Social Skills, COMTESS)。(2) 初步驗證 COMTESS 之心理計量特性（含信度、收斂效度與已知族群效度）與施測效率。

方法：研究者以二階段研究分別發展與驗證COMTESS。第一階段中，研究者依據以下六步驟發展COMTESS：(1) 文獻回顧：彙整過去研究中常見的工作社交技巧相關行為與觀察指標。(2) 編製初版題庫：依文獻彙整結果編寫社交情境劇本與計分量尺。(3) 專家審核題庫：邀請專家評分初版題庫中各題情境之重要性並提供修改建議。(4) 建置施測介面：以投影片放映檔設計施測介面與施測平台。(5) 題庫驗證：施測題庫於慢性思覺失調症患者，並以單向度羅序分析驗證各向度題目之模型適配度。(6) 選題並建構 COMTESS：以多向度羅序分析估計題庫難度與患者能力參數，並挑選分派題與高/低難度測驗組以構成 COMTESS。

第二階段中，研究者使用患者的能力估計標準誤 (standard error) 計算 COMTESS 之個別與平均信度。收斂效度以 COMTESS 能力值與個人與社會功能量表 (Personal and Social Performance Scale, PSP) 總分之相關性驗證。已知族群效度則以蒙特利爾認知評估 (Montreal Cognitive Assessment) 為效標，使用 t 檢定與Cohen’s d 比較有/無明顯認知障礙組間 COMTESS 能力之差異顯著性與大小。

COMTESS 之施測效率以患者作答題庫所需之時間估算。

(4)

結果：第一階段中，研究者發展94 題初版題庫，其中「個人社交技巧」向度與

「職務相關社交技巧」向度各有47 題，每題的計分量尺為 0~4 分。初版題庫經 28 位精神復健與職業重建領域之專家審核，共刪除 14 題較不重要或不適切的題目，保留80 題題目，其中 2 題作為練習題，其餘 78 題作為正式測驗題。共 144 位思覺失調症患者參與題庫驗證。題庫中所有題目皆符合羅序模型之假設。然而，原計分量尺之階難度順序錯置，故研究者將每題之計分量尺修改為0~2 分。

研究者自二向度題庫中，分別挑選1 題分派題與高難度及低難度測驗組各 4 題構成COMTESS（共 18 題）。每位患者僅須作答 2 題分派題與二向度各 4 題高/低難度測驗組，共10 題。

第二階段初步驗證COMTESS 之結果顯示 COMTESS 二向度皆具有可接受的個別信度（二向度皆有97.8%的患者信度 ≥ 0.70）與良好的平均信度（二向度皆為0.80）。COMTESS 二向度能力與 PSP 總分之相關係數皆為 0.41，顯示

COMTESS 之收斂效度良好。在有/無明顯認知障礙之患者間，COMTESS 二向度能力皆有顯著差異 (p < 0.001) 且差異量大 (d = 0.91~0.92)，顯示 COMTESS 具有良好的已知族群效度。COMTESS 之施測時間預估僅需 9.9 分鐘，顯示

COMTESS 之施測效率高。

結論：COMTESS 為第一個針對思覺失調症患者之工作社交技巧所發展的電腦化角色扮演測驗。COMTESS 完整包含「個人社交技巧」向度與「職務相關社交技巧」向度。COMTESS 利用電腦化多階段測驗之優勢，每位患者僅須作答 10 題，

約12.8%的題庫題數（78 題），施測時間僅需近 10 分鐘，且 COMTESS 具備良好信度、收斂效度與已知族群效度，顯示COMTESS 可完整、快速且精準地評量思覺失調症患者之工作社交技巧，且可有效區辨不同認知程度患者間的工作社交技巧差異。此外，透過電腦化施測，可大幅減少施測者訓練時間與施測負擔，並增加臨床施測的可行性。

關鍵詞：思覺失調症，工作社交技巧，電腦化多階段測驗，角色扮演，心理計量

(5)

英文摘要

Background and purposes: Employment social skills can be defined as the capability

to interact appropriately with others or deal with social situations that are required at work. For patients with schizophrenia, a lack of employment social skills has been recognized as one of the major barriers in seeking employment, adapting to a new job, and learning job-specific skills. Thus, accurate, precise, and efficient assessments of employment social skills is the basis for successful vocational rehabilitation. However, there are no content-comprehensive, low-burden, and psychometrically sound measures of employment social skills. Such a limitation has restricted clinicians in efficiently capturing the problems of patients, thereby compromising the treatment effects of social skills training and vocational rehabilitation. To ameliorate the drawbacks of the existing measures, this dissertation had 2 purposes: (1) to develop a content-comprehensive, efficient, and precise measure for assessing employment social skills in patients with schizophrenia; i.e., the COmputerized Multistage role-play Testing of Employment Social Skills (COMTESS); (2) to preliminarily examine the reliability, convergent validity, known-group validity, and efficiency of the COMTESS.

Methods: This dissertation contained 2 stages. Stage 1: the development of the

COMTESS was divided into 6 steps: (1) literature review; (2) development of the draft item bank; (3) expert review of the draft item bank; (4) construction of the test interface and platform; (5) Rasch analysis of the item bank; (6) selection of routing items and hard/easy modules to establish the COMTESS.

Stage 2: we used the standard errors for patients’ ability estimates to calculate the individual reliabilities and average reliability of the COMTESS. We investigated the correlations between the scores of the COMTESS and the Personal and Social Performance Scale (PSP) to examine the convergent validity of the COMTESS. To

(6)

examine the known-group validity, we divided the patients into groups with and without significant cognitive impairments by the Montreal Cognitive Assessment. We further used independent t test and Cohen’s d to test the significance and amount of differences in the COMTESS scores between the two groups. The efficiency of the COMTESS was estimated by the average administration time per item multiplied by the number of items.

Results: In Stage 1, we developed a total of 94 items equally divided into the domains

of “personal social skills” and “task-related social skills”. Each item was rated based on patients’ both non-verbal and verbal expressions by a 5-point scale (0~4 points). The draft item bank was reviewed by 28 experts. Fourteen items that were less important or inappropriate were deleted, and 80 items remained in the item bank. Thereafter, the item bank were examined in a total of 144 patients with schizophrenia using Rasch analysis.

The items fitted the model well. However, the rating scale was modified as a 3-ponit scale (0~2 points) due to the reversed step difficulties. Finally, we selected 1 routing item and 4 items in each of the hard and easy modules, from each domain of item bank, to establish the COMTESS (a total of 18 items).

In Stage 2, the average reliabilities of the two domains of the COMTESS both were 0.80, and 97.8% patients had reliabilities of ≥ 0.70 in both domains. These results indicate that the COMTESS had sufficient reliability. The correlation between the scores of the COMTESS and the PSP was 0.41, which indicates good convergent validity. Significant (p < 0.001) and large (d = 0.91~0.92) differences in the COMTESS scores were found between the groups with and without significant cognitive

impairments, which indicate good known-group validity. The administration time of the COMTESS was about 9.9 minutes, which indicate that the COMTESS is an efficient test.

(7)

Conclusion: The COMTESS may be the first computerized multistage role-play testing

of employment social skills for patients with schizophrenia. The COMTESS

comprehensively contains two domains of “personal social skills” and “task-related social skills”. Our results show that the COMTESS has sufficient reliability, convergent validity, and known-group validity. Moreover, the administration time of the COMTESS is only around 10 minutes. These findings imply that the COMTESS is able to

comprehensively assess employment social skills in a timely and precise fashion and to discriminate the levels of employment social skills among patients. Besides,

computerized testing can largely reduce the training time and burden of the administrators and increase the feasibility.

Keywords: schizophrenia, employment social skills, computerized multistage testing, role play, psychometrics

(8)

圖目錄

圖一、Salzberg 之「職業能力模型 (vocational competence)」 ... 61

圖二、Tsang 之「三階層工作相關社交技巧模型 (three-tier model of work-related social skills) 」 ... 62

圖三、工作社交技巧之架構圖 ... 63

圖四、電腦化多階段測驗施測流程 ... 64

圖五、發展與驗證COMTESS 之流程圖 ... 65

圖六、工作社交技巧行為與指標之文獻檢索結果 ... 66

圖七、COMTESS 題目範例 ... 67

圖八、「個人社交技巧」向度題目難度與患者能力之對應圖 ... 68

圖九、「職務相關社交技巧」向度題目難度與患者能力之對應圖 ... 69

圖十、COMTESS 二向度之個別信度與患者能力值的分佈 ... 70

(11)

表目錄

表一、常用工作社交技巧評估方法之比較 ... 71

表二、常用之工作社交技巧角色扮演測驗 ... 73

表三、思覺失調症患者工作社交技巧之MEDLINE 檢索策略 ... 74

表四、初版題庫與專家審核後之修訂版題庫 ... 76

表五、初版題庫之評分標準 ... 98

表六、專家人口學資料 (N=28) ... 100

表七、思覺失調症患者之人口學與病情資料 ... 101

表八、單向度題庫驗證之指標與多向度題庫分析之參數 ... 103

表九、COMTESS 之題目內容與題目難度 ... 107

(12)

第一章工作社交技巧 (employment social skills) 簡介第一節工作社交技巧之定義

工作社交技巧意指個人於擔任工作角色與從事職業活動之過程中，所須具備的人際互動或處理人際關係的能力 (Salzberg, Likins, McConaughy, &

Lignugaris\Kraft, 1986)。即個人於工作情境中，有效地與他人互動，並表現出他人可接納的適當口語及非口語行為之能力。

工作社交技巧為一般社交技巧之進階能力 (Tsang & Pearson, 1996)。職場情境較一般日常生活情境為複雜，職場內所須扮演的角色以及人際關係之應對亦較為特殊且多元，例如：主雇關係、同事關係、客戶關係等角色，以及競爭、合作、妥協、順應等人際應對方式。因此，個人須先具備基礎的一般社交技巧，掌握日常生活情境中建立人際關係與人際溝通之能力，方可進一步學習與精通工作社交技巧，並於職場中較適切地處理複雜的社交情境。

第二節工作社交技巧之理論

目前文獻中關於工作社交技巧之概念模型有二：Salzberg 等學者於 1986 年提出之職業能力 (vocational competence) 模型 (Salzberg et al., 1986)，以及 Tsang 等學者於1996 年提出之三階層工作相關社交技巧模型 (three-tier model of work- related social skills) (Tsang & Pearson, 1996)。

1. Salzberg 之「職業能力模型」

Salzberg 之職業能力模型指出：職業能力由三個交互影響之層面所組成，包括：「工作責任 (job responsibility)」、「工作技能 (task production competence) 」與「社交職業能力 (social-vocational competence)」（圖一）(Salzberg et al., 1986)。

「工作責任」為擔任工作者所須履行的義務，例如：準時出勤、積極的工作態

(13)

作效率等，例如：搬運能力、專注力、自我偵測與修正錯誤等。「社交職業能力」為職場上所需的社交互動能力，即本文之「工作社交技巧」。社交職業能力依據社交技巧與職務之關聯性可分為二類：(1)「職務相關社交技巧 (task-related social competence)」：執行與完成職務過程中所需的社交技巧，例如：遵從職場的要求與指令、遇到疑惑能主動求助、適度的回應主管、與同事維持互助或合作的關係、接受他人的批評與建議等。(2)「個人社交技巧 (personal-social

competence)」：與完成職務無直接關係，但足以影響職場中人際關係的技巧，例如：社交禮儀、服裝儀容、個人衛生、言談時機、言談內容、與行為舉止等。

2. Tsang 之「三階層工作相關社交技巧模型」

「三階層工作相關社交技巧模型」將工作社交技巧依據技巧之複雜程度區分為三個階層（圖二），由基礎至進階依序為 (Tsang & Pearson, 1996)：(1) 基礎技巧：包含「基礎社交技巧 (basic social skills)」與「基礎社會生存技巧 (basic social survival skills)」。「基礎社交技巧」為人際溝通所需之基礎技能，例如：個人接收、處理與表達訊息的技巧。「基礎社會生存技巧」為足以影響人際關係的個人自理能力與個人行為表現，例如：服裝儀容、個人衛生、與社交禮儀等。(2) 核心技巧：為工作情境所需的社交技巧，其可依據工作情境細分為二：「一般性工作社交技巧」與「職業特定工作社交技巧」。「一般性工作社交技巧」為多數工作情境所需的工作社交技巧，與職業之種類或特性無關，例如：與上司、同事及下屬間之的互動技巧。「職業特定工作社交技巧」則依據職業屬性之不同，個人所須具備的工作社交技巧有所差異，例如：銷售員須具備與顧客應對之技巧。(3) 實現職業生涯目標：即藉由基礎與核心社交技巧以求得適合的工作、維持工作，

並從工作中獲得成就感與心靈上的滿足。

綜觀前述二個工作社交技巧相關之模型可知，工作社交技巧可依據工作情境區分為二類：「一般性工作社交技巧」與「職業特定工作社交技巧」。各工作情境

(14)

下所需的工作社交技巧，可再依據社交技巧與職務之關聯性分為二類，即「職務相關社交技巧」與「個人社交技巧」。研究者依據上述二模型之概念，將工作社交技巧彙整為三階層之架構，其架構圖呈現於圖三。

圖三所述之工作社交技巧中，「一般性工作社交技巧」較適用於思覺失調症患者之復健與職業重建領域。「一般性工作社交技巧」可適用之職業類別廣泛，

涵蓋各類型職業皆須處理之職場社交情境。故「一般性工作社交技巧」為精神復健與職業重建專業人員，於協助思覺失調症患者就業前，評估與訓練之重點目標。反之，「職業特定工作社交技巧」之適用範圍僅限特定職業類別之職場社交情境，難以類化至其它職業類別所需之工作社交技巧。再者，多數「職業特定工作社交技巧」皆須於患者進入特定職場後，藉由員工訓練之過程習得，較難於復健期間預先練習各式各樣的「職業特定工作社交技巧」。因此「一般性工作社交技巧」評估工具之發展與驗證宜優先於「職業特定工作社交技巧」評估工具。

第三節工作社交技巧之能力與表現面向的介紹與評析

世界衛生組織 (World Health Organization) 於 2001 年提出之國際健康功能與身心障礙分類系統 (International Classification of Functioning, Disability, and Health, ICF) (World Health Organization, 2001) 指出：個人之活動參與可區分為二面向：

能力 (capacity) 與表現 (performance)。能力面向用於描述個人在標準化環境（無環境之促進或阻礙因素）下可達成的功能程度，此為僅受個人因素/能力影響之結果。表現面向則是個人在實際生活情境下之功能程度與參與情況，此為同時受到環境因素與個人因素綜合影響之結果。

對於工作社交技巧之評估而言，亦可分為能力與表現面向之評估，此二面向各具有獨特的臨床價值。工作社交技巧之「能力面向」代表患者於標準化之職場社交情境下的工作社交技巧。「能力面向」之評估結果具有三項優勢：(1) 結果較為客觀：於標準化職場社交情境施測，評估結果較不受特定職場或工作屬性之環

(15)

境要求而影響計分 (Lee et al., 2014)。(2) 結果易於比較：由於各受試者社交技巧皆是基於標準化職場社交情境，故評估結果有利於比較患者本身或患者之間的程度差異。(3) 利於擬訂患者能力之訓練目標與方案：由於「能力面向」之評估結果僅受個人因素影響，故臨床人員較能客觀掌握患者之能力程度，並據此擬訂工作社交技巧訓練計畫，或協助患者媒合適當工作社交技巧要求之工作。

工作社交技巧之「表現面向」代表患者於實際職場情境之工作社交技巧，

「表現面向」之評估結果具有三個實務價值：(1) 代表患者之真實表現：由於評估之情境為患者實際生活的職場情境，故評估結果可反映患者於實際生活之表現、遭遇到的困難與所需協助程度 (Lee et al., 2014)。(2) 可作為職業復健之成效指標：追蹤患者於實際職場之社交表現與適應情況，為職業復健與職業媒合之首要且長期的成效指標。(3) 利於擬訂環境調整建議：藉由評估實際表現，臨床人員可瞭解患者於該職場社交環境下所遭遇到的促進或限制因素，進而提供環境或職務調整之建議。

綜上所述，工作社交技巧之能力與表現為二種不同的概念與評估面向，二者之評估結果各具其臨床意義與價值。由於「能力面向」之評估結果較能客觀比較，且較適用於思覺失調症患者就業前之精神復健與職業重建的評估以及治療方案擬訂，而「表現面向」之評估結果較適用於治療/職業復健後之長期成效追蹤。

故從臨床介入之角度與順序而言，「能力面向」之評估工具發展宜優先於「表現面向」評估工具。

(16)

第二章工作社交技巧對於思覺失調症患者就業之重要性第一節思覺失調症之流行病學資料與病徵

思覺失調症為一種常見的心理疾患，亦為十大致殘疾病之一 (Murray &

Lopez, 1996)。全球約有近 1.0%人口患有思覺失調症 (McGrath, Saha, Chant, &

Welham, 2008)，而臺灣則約有 0.6%人口確診為思覺失調症 (Chien et al., 2004)。

思覺失調症好發於青少年至成年期階段，男性與女性之發生率一致，但男性平均發病年齡較女性早，男性好發於18~25 歲，女性好發於 25~35 歲之間 (Ochoa, Usall, Cobo, Labad, & Kulkarni, 2012)。

依據精神疾病診斷及統計手冊第五版 (Diagnostic and Statistical Manual of Mental Disorders, fifth edition, DSM-5) (American Psychiatric Association, 2013)，思覺失調症之診斷標準有三項：(1) 核心症狀：一個月內有多數時間出現以下五類症狀中之兩類，包括：妄想 (delusions)、幻覺 (hallucinations)、胡言亂語 (disorganized speech)、紊亂 (disorganized) 或緊張 (catatonia) 的行為、負性症狀

（情感淡漠或缺乏動機），其中至少有一類為妄想、幻覺或胡言亂語。(2) 日常功能低落：發病後多層面之日常功能明顯低於發病前，如：成人發病後，人際關係、職業、自我照顧功能顯著低於未發病前；兒童及青少年發作後，無法達到預期的人際、學業或職業功能。(3) 病徵持續時間：病徵至少持續出現 6 個月，且期間至少有一個月之症狀與第 (1) 項診斷標準相符。

由上述診斷標準可知，思覺失調症為嚴重的腦部疾病，其病徵對於患者之影響層面廣泛，如工作、社交互動等各重要生活層面，且病徵之影響時間長遠。長期追蹤研究顯示：首次發病之思覺失調症患者中，僅9.7%的患者於發病 3 年後可康復；發病5 年後有高達 86.3% 的患者仍有精神症狀，且病程慢性化，須長期服藥與接受復健治療 (Robinson, Woerner, McMeniman, Mendelowitz, & Bilder,

2004)。故思覺失調症患者為目前精神與復健醫學領域常服務之族群之一。

(17)

第二節思覺失調症患者之工作社交技巧障礙

工作不僅是精神復健的主要目標，也是復健治療整體成效的具體指標，以及成功社區安置之關鍵 (Henry & Lucca, 2004; Lehman et al., 2002)。工作為思覺失調症患者參與社會的重要活動之一，工作角色不僅決定患者在社會中的地位與價值，也影響其自我認同感與安適感 (Burns et al., 2009; Melle, Friis, Hauff, &

Vaglum, 2000)。此外，工作環境提可供思覺失調症患者與他人互動的機會以及穩定的生活狀態，讓患者能夠融入社會，並維持規律的生活步調。因此，協助思覺失調症患者就業，不僅能提升其社會適應能力、自我肯定，亦能減少家庭與社會的負擔。

然而，目前國內慢性精神病患者的就業率偏低。根據衛生福利部之身心障礙者人數統計：105 年慢性精神疾病患者中，86.5%為勞動力年齡層（15~64 歲），

位居身心障礙者總勞動年齡人口比例之第二位（衛生福利部統計處，2018）。而勞動部105 年身心障礙者勞動狀況摘要分析顯示：慢性精神疾病患者勞動人口中，就業率僅17.4%（勞動部統計處，2018）。此外，慢性精神障礙患者之更換工作率為所有身心障礙類別患者之冠，且多數患者之工作經驗為短期（半年內）就業經驗（勞動部統計處，2018）。由上述統計資料可知，思覺失調症患者之年齡多集中於適宜就業的中壯年齡層，然而其就業比率卻很低且工作較不穩定。限制思覺失調症患者就業之主要內在因素包括負性症狀、社交技巧障礙、認知功能缺損等，這些因素嚴重影響患者之求職、工作適應與學習 (Bevan et al., 2013;

Marwaha & Johnson, 2004)。

工作社交技巧為思覺失調症患者工作所需的關鍵能力之一，亦為預測患者是否成功就業之重要因素 (J. A. Cook & Razzano, 2000; Mueser, Salyers, & Mueser, 2001; Tsang, Lam, & Ng, 2000; Tsang, Ng, Chiu, & Mann, 2000)。思覺失調症患者之工作社交技巧影響其能否建立與維持適當的職場人際關係，包括與雇主之應對進退及與同事間之合作等，進而影響患者之求職成功率，以及患者於職場中勝任各

(18)

種工作角色（如：下屬、同儕）與完成職務的能力。勞動部105 年之調查指出：

在工作期間曾遭遇困難的慢性精神障礙患者中，約四分之一的患者主要為遭遇與主管或同事人際關係問題（勞動部統計處，2018）。此外，工作社交技巧障礙為造成思覺失調症患者離職的主因之一 (Tsang, Lam, et al., 2000; Tsang, Ng, et al., 2000)，亦為影響患者職場表現之要素 (Dickinson, Bellack, & Gold, 2007)。思覺失調症患者常因缺乏適當的工作社交能力，難以適切表達自己的想法、與他人有效地溝通、以及掌握人我分際，因而於求職與工作過程中容易與他人產生衝突，影響患者與他人之合作及職場表現。

目前尚無針對思覺失調症患者之工作社交技巧障礙的流行病學調查研究。然而，關於一般社交技巧（工作社交技巧之基礎）之文獻指出：一般社交技巧障礙為思覺失調症患者的首要臨床表徵之一 (Mueser, Bellack, Douglas, & Morrison, 1991)。多數思覺失調症患者常因下列四因素而容易出現社交技巧及人際互動之障礙：(1) 病前即有人際關係退縮與社交隔離的情形 (Mueser, Bellack, Morrison, &

Wixted, 1990)。(2) 長期受嚴重的精神症狀影響，造成認知功能損傷與社會認知功能欠佳，使社交技巧出現障礙 (Pinkham & Penn, 2006)。(3) 長期機構化及重複住院，使得患者缺乏練習社交技巧的環境 (Harvey, Reichenberg, Bowie, Patterson, &

Heaton, 2010)。(4) 社會對於思覺失調症患者之污名化，使得患者無法肯定自我，

使其更加退縮與隔離 (Perlick et al., 2001)。過去長期追蹤調查研究指出：超過半數的思覺失調症患者有一般社交技巧障礙，且其技巧於一年內未改變；僅約10%

患者之一般社交技巧良好，且一年內未退步 (Mueser et al., 1991)。故一般社交技巧障礙為思覺失調症患者普遍存在的問題，嚴重影響患者之工作社交技巧。

總體而言，就業為思覺失調症患者復健之主要目標以及社區安置之關鍵，然而目前思覺失調症患者之就業率低，主要障礙之一為患者缺乏適當的工作社交能力。工作社交技巧障礙為思覺失調症患者常見的問題，影響患者之工作表現甚鉅。專業人員若未能及早掌握患者之工作社交技巧，將嚴重影響後續復健之進行

(19)

與成效。因此，精確、有效且快速易使用的工作社交技巧評估工具是協助專業人員掌握問題、擬訂治療計畫、追蹤患者變化及驗證療效的重要利器。

(20)

第三章工作社交技巧常用之評估方法與評估工具第一節工作社交技巧之評估方法與優缺點比較

目前臨床與研究上常使用之工作社交技巧評估工具，依據評估方法可分為三類（表一）：「自評問卷」、「職場行為觀察評量」與「角色扮演測驗」(Meier &

Hope, 1998)。「自評問卷」是由患者對自身社交行為進行觀察並記錄或計分之評估方法。「職場行為觀察評量」是施測者在真實的工作情境中對患者的社交行為表現進行直接觀察，並加以記錄或計分的評估方法。「角色扮演測驗」則是一種模擬情境測驗，透過賦予患者一個假定的角色與任務，要求患者按照角色及任務要求與施測者互動（施測者須依據標準化的劇本扮演互動角色），計分者則在旁觀察施測過程或於施測後觀看錄影帶，記錄或評價受試者角色扮演的行為 (Mathews & Fawcett, 1979)。

自評問卷主要優點有三：(1) 可行性高：自評問卷多為紙本設計，其方便執行、可同時大量施測、不需額外之硬體設備、成本較低、施測者負擔小。(2) 施測者無法實地觀察時，仍可大略瞭解患者在真實工作環境中的社交表現（表現面向），如：參與程度。(3) 呈現患者之主觀感受：透過患者之自陳，施測者可瞭解患者之自覺困難與自我效能（能力面向）等主觀感受的資訊。然而自評問卷易受思覺失調症患者的病識感影響其主觀能力之判定，常造成高估患者之工作社交技巧 (Schaub, Brune, Bierhoff, & Juckel, 2012)。此外，自評問卷亦受患者之認知能力影響，可能無法進行評量，或因記憶力損傷影響其回憶先前的社交表現，而獲得不真實之分數 (Dunning, Johnson, Ehrlinger, & Kruger, 2003)。因此使用自評問卷評量思覺失調症患者之工作社交技巧時，使用者可能較難以掌握患者的真實能力。

職場行為觀察評量可克服自評問卷受患者病識感與認知功能影響之限制，大幅增加評估結果之可信程度，使用者亦較能掌握患者的真實社交表現（表現面

(21)

場行為觀察常須耗費長時間的觀察，方能清楚掌握患者的實際表現。(2) 可觀察的行為較侷限：職場行為觀察易受特定職場情境、職務特性或觀察時機限制，施測者未必能於評估期間完整觀察到所有欲評估的社交行為表現。(3) 難以客觀比較患者間能力之高低：患者的行為表現易受職場環境之促進或阻礙因素影響，其行為表現未必能客觀呈現患者之真實工作社交技巧能力程度。且施測者對於患者行為表現之計分易受特定職務要求影響，未必能類推至其它職務或工作場域之表現，亦難以客觀比較患者間之能力程度。故職場行為觀察評量之施測效率較低，

且未必能完整觀察思覺失調症患者之工作社交技巧表現，評估結果亦難以客觀比較與類化至其他患者、職務或職場。

角色扮演測驗不但可克服自評問卷受限於患者病識感不足或記憶力損傷而無法獲得準確的能力評估，亦可提升職場行為觀察評量之施測效率、觀察行為之廣度以及評估結果之客觀比較性。角色扮演測驗透過模擬職場社交情境之設計，計分者可於有限的評估時間內，觀察到多種欲觀察之工作社交技巧。再者，計分者於過程中所觀察到的是工作社交技巧之能力面向，即患者基於標準化施測情境之社交表現，此資訊有利於臨床人員客觀比較患者之能力高低 (Bellack, Brown, &

Thomas-Lohrman, 2006)。

然而，角色扮演測驗尚有以下二項限制須克服：(1) 施測者負擔大：評估角色扮演測驗至少需要二位評估人員，包括施測者與計分者。且施測者須熟悉劇本中各情境所需的對話內容與肢體動作。因此，角色扮演測驗需大量的施測者訓練，且評估過程對於施測者之負擔大 (Bellack, Sayers, Mueser, & Bennett, 1994)。

(2) 難以達成施測者間角色扮演之一致性：角色扮演測驗之劇本僅將施測情境、

施測者的對話內容與肢體動作標準化。然而人際互動所涉及之元素複雜，如：語調、音量、表情等，各元素皆可能影響患者於模擬情境之社交表現。故不同施測者之評估過程恐難一致 (Donohue, Hasselt, Hersen, & Perrin, 1999)。

上述三種常用之工作社交技巧評估方法中，「角色扮演測驗」最具潛力應用

(22)

於評估思覺失調症患者之工作社交技巧能力面向。藉由標準化的模擬職場社交情境，使用者可較有效率地直接觀察到患者的多種工作社交能力，並可客觀比較患者間能力之差異，以協助預測患者適合的職務或於職場之社交表現，並擬訂合適的工作社交技巧與職業重建訓練方案。

第二節工作社交技巧角色扮演測驗應具備之特性

一個良好的工作社交技巧評估工具須具備以下二項特點：(1) 良好的心理計量特性；(2) 可行性佳。

1. 心理計量特性：

心理計量特性為評斷評估工具品質之指標，亦為選擇適當評估工具之重要依據。具備良好心理計量特性之評估工具是達成客觀與科學評量之基礎。重要的心理計量特性包括信度與效度。

信度是指評估工具所測得的觀察分數與患者的真實分數之相近程度，即評估工具能準確反映患者真實能力的程度 (Milanzi, Molenberghs, Alonso, Verbeke, &

Boeck, 2015)。良好的信度為評估工具具備效度之必要條件 (D. A. Cook &

Beckman, 2006; Feldt & Brennan, 1989)，評估工具必須先能準確地呈現患者的能力，方能確認此能力是否為理論上欲評量的特質。

效度是指評估結果的正確性，即評估工具能測量所欲評估特質的程度。效度依其特性可分為內容效度 (content validity)、建構效度 (construct validity)、與已知族群效度 (known-group validity) 等。「內容效度」為由專家檢驗評估工具內容的適當程度，如：是否涵蓋欲評量特質的各種面向，及評量各面向之題目比例分配是否合宜 (D. A. Cook & Beckman, 2006; Mokkink et al., 2010)。「建構效度」指評估工具能評量到欲評量特質之理論概念的程度，包括題目與理論之契合度、評量概念之完整性、與相關概念之指標或評估工具達理論上應具備的關聯程度［即收斂效度 (convergent validity)］(D. A. Cook & Beckman, 2006; Mokkink et al.,

(23)

2010)。「已知族群效度」代表評估結果可根據其理論區辨病人與健康對照組能力差異的程度或區辨不同嚴重程度病人能力差異的程度 (Guyatt, Feeny, & Patrick, 1993; Mancuso, Peterson, & Charlson, 2001)。

臨床人員須使用具備良好心理計量特性之評估工具，方能有效且精確地掌握患者之功能程度，並據此擬訂適當之治療計畫與評估治療成效 (Wade, 1992)；而研究人員亦須使用具備良好心理計量特性之評估工具，才能有效地評量欲探究之概念，以提供精準與有效的調查或療效驗證結果 (Jongbloed & Morgan, 1991)。因此，一個良好的工作社交技巧評估工具必須完整地驗證其心理計量特性，呈現此工具之優缺點與特點，提供未來臨床與研究人員使用之參考。

2. 可行性

可行性為將評估工具應用於臨床實務之必要條件。可行性良好的評估工具必須具備以下特點：施測快速、對於施測者或受試者負擔小、容易施測與計分、施測成本低等。由於臨床評估之人力及時間有限，常需精簡、有效率的評量方式，

因此可行性為臨床人員選擇評估工具之主要考量因素。

第三節工作社交技巧角色扮演測驗之介紹與評析

現有工作社交技巧角色扮演測驗之介紹

目前常用於評量工作社交技巧之角色扮演測驗有三（表二）：職業社交技巧評量表 (Vocational Social Skills Assessment Scale, VSSAS) (Tsang & Pearson, 2000)、職業技巧評估工具 (Occupational Skills Assessment Instrument, OSAI) (Mathews, Whang, & Fawcett, 1980) 與馬里蘭社交功能評估 (Maryland Assessment of Social Competence, MASC) (Bellack et al., 1994)。各評估工具之介紹與評論分述如下：

1. 職業社交技巧評量表 (VSSAS)

(24)

VSSAS 為 Tsang 等學者依據其「三階層工作相關社交技巧模型」所發展之工作社交技巧評估工具 (Tsang & Pearson, 2000)。VSSAS 為針對思覺失調症患者設計，評量內容為「一般性工作社交技巧」，涵蓋求職與工作上所需的「個人社交技巧」與「職務相關社交技巧」。VSSAS 分為二部分：第一部分為自評問卷，由思覺失調症患者以6 點量尺自評其於 10 項求職、職務相關社交活動與個人社交活動之自覺困難程度。第二部分為角色扮演測驗，測驗包含二模擬情境分別評量患者於「求職面試」與「臨時向上司請假」之社交技巧，測驗過程中由施測者扮演面試官與上司，並適時回應與引導患者繼續談話。VSSAS 評估過程錄影，並由獨立的計分者依據受試者的儀容、禮貌、口語接收/表達、言談適切性等表現，以 5 點量尺分別計分患者之「個人社交技巧」與「職務相關社交技巧」。平均須花費 30 分鐘完成 VSSAS 之角色扮演評估。

VSSAS 之自評問卷部分，應用於思覺失調症患者具有良好的內在一致性 (Cronbach’s alpha = 0.80)，然而其各題目之再測信度 (Pearson’s r = 0.35~0.78) 與 已知族群效度皆不佳，半數題目無法區辨思覺失調症患者與一般成人之工作社交技巧程度。VSSAS 之角色扮演測驗部分，應用於思覺失調症患者具有良好的內在一致性 (Cronbach’s alpha = 0.96) 與計分者間信度 (Pearson’s r = 0.77~0.90) (Tsang

& Pearson, 2000)。

2. 職業技巧評估工具 (OSAI)

OSAI 為針對工作適齡之一般成人所設計，用以評量求職與工作情境中所需的「職務相關社交技巧」，以及完成職務所需之工作技能 (Mathews et al., 1980)。

OSAI 包含 13 個模擬情境，其中 9 個情境與工作社交技巧有關，包括：參加求職面試、接受雇主的建議/譴責、給予/接受同事建設性的批評/讚美、向主管說明問題等。施測過程中由施測者依據腳本扮演與受試者互動之角色。評估過程錄影並由獨立的計分者依據各情境題之9 項目標行為檢核表，記錄受試者各項目標行為

(25)

之出現次數。OSAI 之評估時間平均約 40 分鐘。

OSAI 於一般成人具有良好的計分者間信度（各題之計分者間一致性為 90%~100%）與已知族群效度 (p < 0.001 ) (Mathews et al., 1980; Mathews, Whang,

& Fawcett, 1981)。OSAI 尚無應用於思覺失調症患者之心理計量特性實證文獻。

3. 馬里蘭社交功能評估 (MASC)

MASC 為針對思覺失調症患者所發展，用以評量其社交問題解決能力之角色扮演測驗 (Bellack et al., 1994)。MASC 包含 4 個職場角色扮演情境，分別評量

「個人社交技巧」與「職務相關社交技巧」，包括：職場中遇到新人、結交朋友、要求升遷、違反規定後請求雇主再提供一次機會等。每個情境皆為3 分鐘的模擬談話，施測者向受試者說明各情境設定與角色設定後，施測者依據腳本扮演與受試者互動之角色，並適時提供標準化的提示以引導受試者繼續對話。評估過程將錄影，並於評估後由獨立的計分者依據受試者的談話內容、非口語表現（表情、眼神接觸）與目標完成性等三面向，以5 點量尺進行計分。MASC 之評估時間平均約30 分鐘 (Harvey, Velligan, & Bellack, 2007)。

MASC 應用於思覺失調症患者之內在一致性可接受至良好 (Cronbach’s alpha

= 0.68~0.93)、評分者間信度差至良好［組內相關係數 (intraclass correlation coefficient) = 0.17~0.89)、已知族群效度良好（不同職業功能程度者之 MASC 分數具顯著差異）(Bellack et al., 2006)。

現有工作社交技巧角色扮演測驗之主要限制

綜言之，目前常用之工作社交技巧角色扮演測驗少，且其應用於思覺失調症患者時，易遭遇「內容」及「實務」二類限制而影響其適用性。內容限制有二：

(1) 評量之工作社交技巧情境代表性不足：VSSAS 與 MASC 僅有 2~4 個情境，難以較完整地觀察患者在各種職場中常見社交情境之表現，故此二工具涵蓋的模擬

(26)

情境代表性不足。(2) 評量向度過於狹隘：OSAI 並未涵蓋工作社交技巧之「個人社交技巧」向度。上述二項評量內容之不足，將造成使用者難以完整掌握思覺失調症患者之各向度工作社交技巧程度。

實務限制有二：(1) 角色扮演測驗之施測者負擔大，每次評估皆需要二位評估者（施測者與計分者），且需長時間的施測者訓練以熟悉劇本中各情境所需的對話內容與肢體動作。(2) 即使題目數量少，但仍須長時間的施測（30 分鐘以上），如此將難以於忙碌的臨床實務中例行評估使用。

除內容與實務之限制外，部份現有工作社交技巧角色扮演測驗應用於思覺失調症患者之心理計量特性不佳或未知。此問題嚴重影響思覺失調症患者評量結果之可信度及有效性，造成使用者於分數解釋欠缺實證依據，難以確實掌握患者工作社交技巧之狀態與改變情形。

故依據前述回顧，目前學術與臨床均缺乏內容完整、對於施測者負擔小、施測效率高且具備良好心理計量特性的工作社交技巧評估工具。此限制嚴重影響專業人員快速且精準地掌握患者工作社交技巧問題，使得社交技巧復健與職業重建的成效難以進一步提升。

(27)

第四章應用多向度羅序模型 (multidimensional Rasch

model) 與電腦化多階段測驗 (computerized multistage testing) 發展工作社交技巧角色扮演測驗之優勢第一節將角色扮演測驗電腦化之優勢

電腦化之角色扮演測驗具備以下三項優勢：(1) 大幅降低施測者訓練時間與施測負擔：透過電腦自動施測，施測者僅須觀察患者之表現進行計分。施測者將不再需要長時間接受施測者訓練與背劇本，亦不需要二位評估者分別進行施測與計分，將可大幅降低人力負擔。(2) 增加重複施測或施測者間角色扮演的一致性：電腦化測驗中，相同題目情境於不同次施測時的呈現方式皆一致（例如：一致的對話情境、內容、表情、語氣與肢體動作）。相較於傳統角色扮演測驗，施測者在不同次施測時或不同施測者間，可能表演、說話或引導方式不同，造成患者所體認到的題目情境有所差異，進而影響患者的社交表現。故電腦化角色扮演測驗可減少多次施測間，評估過程不一致之困境。(3) 提升施測可行性：透過電腦呈現模擬情境，施測者僅須準備電腦即可完成施測，將無須準備多種角色扮演情境相關的道具或在特定社交情境的空間中執行評估。故將角色扮演測驗電腦化可解決傳統角色扮演測驗之限制（如：施測者負擔大、難以達成施測者間之一致性），且可保有傳統角色扮演測驗之優勢（如：較不受患者病識感與記憶力影響、可於有限時間內觀察到多種工作社交技巧、標準化情境以客觀比較患者之能力程度）。

第二節多向度羅序模型之概念與特點

羅序模型為項目反應理論 (item response theory) 中，最廣為使用的單參數模型之一。羅序模型為Georg Rasch 於 1960 年所提出，其透過機率與對數勝算比

(28)

出受試者之能力與題目之難度 (Hays, Morales, & Reise, 2000; Wright & Linacre, 1989; Wright & Master, 1982; Wright & Mok, 2000)。羅序模型具有兩項基本假設：

(1) 單向度 (unidimensionality)，即評估工具中所有題目都是測量同一種能力或潛在特質 (Embretson & Reise, 2000)。(2) 局部獨立性 (local independency)，即當能力固定時，受試者在各項題目上的答題反應不會互相影響。

若評估工具中所有題目皆符合羅序模型之假設，則其將具備以下五項優勢：

(1) 單向度之建構 (Tesio, 2003; Wright & Linacre, 1989; Wright & Master, 1982;

Wright & Mok, 2000)：若評估工具中所有題目皆符合羅序模型之假設，即表示所有題目經驗證僅評量單一建構之概念（如：工作社交技巧），各題間分數可互相比較或加總，故此評估工具將具備建構效度。(2) 客觀性 (Wright & Linacre, 1989;

Wright & Mok, 2000)：受試者的能力估計和題目的難度估計彼此獨立，即受試者能力的估計不會受到題目難度的影響 (test-free)；另一方面，題目難度的估計也不會受到受試者能力高低的影響 (sample-free)。(3) 等距量尺分數 (interval score) (Wright & Linacre, 1989; Wright & Master, 1982; Wright & Mok, 2000)：羅序模型使用對數勝算比 (logit) 為單位以量化受試者之能力與題目之難度。此單位具備等距量尺之特性，即分數間差距可互相比較（如：同一患者之前後測分數變化、不同患者間之能力差異），且能有效運用母數 (parametric) 統計方法進行資料分析。(4) 受試者能力與題目難度可比較：羅序模型估計受試者能力與題目難度之單位皆為對數勝算比。二者單位相同可排列在同一量尺上比較，以檢視評估工具中題目難度之分佈是否涵蓋受試者能力之分佈，題目難易度是否平均分配。這些資訊有助研究者判斷是否須要增刪題目，以及作為針對受試者能力挑選適當難度題目之參考依據。(5) 個人層級之測量誤差：羅序模型能夠針對每個能力水準之受試者，提供個別的測量誤差指標，以推估每位受試者的能力與誤差。

由於羅序模型具備上述多項優勢，故其近年來廣受學界推崇以應用於發展評估工具，可克服過去以古典測驗理論所發展之評估工具的限制，例如：計分量尺

(29)

為次序量尺 (ordinal scale)、能力估計與難度估計互相依賴、所有受試者測量誤差皆相等。

羅序模型原僅適用於單向度二元計分之題型（如：對/錯、同意/不同意），此模型發展至今已衍伸為羅序家族模型 (Rasch family models)，以應用於較複雜的評估工具題型，包括：應用於多點計分題型之評等量尺模型 (rating scale model, RSM) (Andrich, 1978) 與部份計分模型 (partial credit model, PCM) (Masters, 1988)，及其多向度模型。RSM與PCM二者之差異在於評估工具內之題目是否使用同一套計分量尺（包括相同的量尺意涵、計分點個數與計分點的難度），RSM 適用於評估工具內所有多分題之計分量尺相同；而PCM則適用於評估工具內有多種計分量尺。

多向度羅序模型有助於提升評估精準度並提升施測效率。多向度羅序模型主要利用各向度間（如：「個人社交技巧」向度與「職務相關社交技巧」向度）之相關性，以相互預測各向度之分數，藉此精簡量表項目，且維持一定的評量精準度 (Briggs & Wilson, 2003; Wang, Chen, & Cheng, 2004)。即若各向度存在關聯性，當受試者作答其中一向度之題目，則可同時提供其它向度評量訊息，以快速推估受試者各向度的能力（例如：「個人社交技巧」不佳的患者，可預期其「職務相關社交技巧」相對亦較差），進而縮減各向度之評量項目。若多向度間彼此關聯性愈高，則可簡化的施測題數愈多，評量效率愈高，且仍可維持一定的施測精準度。故運用結合多個單向度之多向度羅序模型，可望完整、快速且精準地評估思覺失調症患者之各向度工作社交技巧。

第三節電腦化多階段測驗之概念與優點

電腦化多階段測驗為依據適性測驗 (adaptive test) 之概念所發展，受試者僅須作答難度與其能力相近之測驗組 (Haley, Andres, et al., 2004; Hou et al., 2011; Yu et al., 2011)。此施測方法可於同時兼顧評估內容完整性與施測精準度之條件下，

(30)

大量縮短評估題數與時間，提升施測效率。電腦化多階段測驗之施測步驟共分為二階段，如圖四：(1) 第一階段施測：由受試者填答或施測者施測少量（2~3 題）的分派題 (routing test)，以初步估計患者能力程度並分派至適合的能力組別

（如：高、低程度）。(2) 第二階段施測：依據前一階段的分派結果，施測者挑選適合患者能力組別之高難度測驗組 (hard module) 或低難度測驗組 (easy

module)，以進行較完整、深入之能力評估。由於受試者僅須接受特定難度測驗組之評估，且該套測驗組中之題目接近其能力水準，因此評估過程只要施測較少的題數便可達到與傳統測驗（完成題庫中所有題目）相當的測量精準度 (Haley, Coster, Andres, Kosinski, & Ni, 2004)。故電腦化多階段測驗使得評估較有效率且人性化，可依受試者不同的能力程度，施測難度適合之題目，而不須花費多餘時間施測對於受試者太困難或太容易之題目。

第四節角色扮演測驗結合多向度羅序模型與電腦化多階段測驗之優勢

完整的工作社交技巧評估須涵蓋「個人社交技巧」與「職務相關社交技巧」

二向度，然而若欲全面評估患者於各向度常見社交情境之能力，將耗費大量的施測時間、人力與資源，且難以應用於臨床之例行性評估。若結合多向度羅序模型與電腦化多階段測驗方法之特點發展工作社交技巧評估工具，將可大幅減少施測題數，兼具評估內容之完整性、建構效度、施測精準度以及效率。另外，透過電腦化施測，可大幅降低施測者負擔與人力資源，增加施測可行性，亦可提升重複施測或施測者間角色扮演的一致性。故工作社交技巧之角色扮演測驗若能結合多向度羅序模型與電腦化多階段測驗二者的優勢，將有助於完整評估患者於工作社交技巧各向度之能力，且施測快速又不失精準度，亦能降低施測者之負擔。

(31)

第五章研究目的

為改善目前既存工作社交技巧評估工具之諸多限制（如：評估向度狹隘、對於施測者負擔大、施測時間長），本研究目的有二：(1) 發展測驗：研究者欲運用多向度羅序模型與電腦化多階段測驗法，發展一套適用於思覺失調症患者之完整、快速暨精準的「工作社交技巧電腦化多階段角色扮演測驗」(COmputerized Multistage role-play Testing of Employment Social Skills, COMTESS)。COMTESS 包含一套分派題及二套工作社交技巧向度之測驗組（「個人社交技巧」與「職務相關社交技巧」），每套測驗組包含高難度測驗組與低難度測驗組。分派題可初步判斷患者之能力高低，以選擇難度與其能力對應之高難度或低難度測驗組，達到

「二階段施測」之目的。(2) 驗證測驗之心理計量特性及施測效率：研究者初步驗證COMTESS 之信度、效度（含收斂效度與已知族群效度）與施測時間。

(32)

第六章研究方法

本研究共分為二階段：第一階段為發展COMTESS，第二階段為初步驗證 COMTESS 之信度、效度與施測效率。研究流程如圖五所示。

第一節第一階段：發展 COMTESS

研究者將依據以下六步驟發展COMTESS：(1) 文獻回顧、(2) 編製初版題庫、(3) 專家審核初版題庫、(4) 建置施測介面、(5) 修訂版題庫驗證與 (6) 選題並建構COMTESS。

步驟1：文獻回顧

研究者檢索過去文獻中，用於評估思覺失調症患者工作社交技巧之工具，以及思覺失調症患者工作社交技巧相關之各類型研究。研究者於MEDLINE、

PsychINFO、CINAHL 等三資料庫，合併檢索與思覺失調症患者工作社交技巧相關主題之文獻。文獻檢索策略為合併思覺失調症、工作與社交技巧三者之相關醫學標題詞彙 (MeSH term) 或關鍵字 (keyword)，文獻檢索策略列於表三。研究者依據以下三項收錄標準挑選合適之文獻：(1) 研究對象包含成人思覺失調症患者。(2) 研究中包含工作社交技巧相關變項。(3) 英文文獻。若文章之出版類型為評論、信函、演說、社論或編者序則排除之。其後研究者歸納收錄文獻中所列之工作社交技巧相關行為與觀察指標，作為下一階段編製初版題庫與計分指標之依據。社交技巧相關行為是指人際互動過程中的目的或要素，例如：道歉、協商等。觀察指標為判斷社交技巧表現之變項，例如：肢體動作、語意等。

步驟2：編製初版題庫

研究者根據前一步驟文獻回顧之結果，針對各項常見的工作社交技巧相關行為，編寫相對應的題目。並依據文獻常見的觀察指標擬訂初版題庫之計分指標。

關於初版題庫之題目編製，研究者依據各項社交行為，以及「個人社交技

(33)

巧」與「職務相關社交技巧」二向度之概念，編寫相對應的模擬情境劇本。每一題目之內容僅評量某一向度之概念。題目為使用影片型式呈現，每題的內容包含三要素：(1) 社交情境：說明該模擬情境之背景資訊與人、時、地、物之設定。

(2) 社交任務：描述患者於該社交情境中須表達的社交意圖。(3) 社交短劇：呈現真實社交場景與角色間對話的影片，讓患者較容易瞭解與融入該社交情境，並以角色扮演方式產生社交互動行為。此外，考量患者對於不同性別、年齡與身份之社交對象的社交互動表現可能有所差異，研究者亦平均分配各題情境中互動角色的性別（男性與女性）、年齡層（青年與中年）及身份（主任與同事）之設定，

故初版題庫中共有8 種互動角色（2 種性別  2 種年齡層  2 種身份）。此步驟所發展的初版題庫，僅包含各題目之情境、任務與短劇劇本的文字敘述，研究者未製作影片。

關於初版題庫之計分指標編製，研究者參考文獻常見的社交行為觀察指標，

設計整份題庫皆適用的計分指標與計分量尺（即各題之計分量尺相同）。研究者亦依據各計分指標與量尺擬訂計分標準，以提供計分者計分之依據，並提升計分者間的計分一致性。

步驟3：專家審核初版題庫

研究者邀請精神復健領域與職業重建領域之臨床專家，審核初版題庫中各題目的重要性，並請專家提供修改建議，藉以從初版題庫中挑選重要的題目以組成修訂版題庫，並確認題庫之內容效度。

樣本

研究者使用方便取樣方式 (convenience sampling) 招募各領域之臨床專家。

專家之納入條件有二：(1) 專業背景為精神科醫師、職能治療師、社工師、就業服務員、職業輔導評量員或職業重建個案管理員。(2) 具有 3 年以上服務思覺失調症患者之臨床經驗者。

(34)

程序

專家審核方式採用記名式網路調查。研究者先將前一步驟所發展之初版題庫內容建置為網路調查表單，表單內容包含「工作社交技巧」、「個人社交技巧」與

「職務相關社交技巧」之定義、題庫中每一題的題目內容介紹、題目重要性計分量尺（1：非常不重要、2：有點不重要、3：有點重要、4：非常重要）、題目修改建議及人口學基本資料變項。各題目內容之介紹包括：該題所屬向度、欲評量的社交行為、社交情境、社交任務、短劇劇本。之後，研究者將網路調查表單之網址以電子郵件寄給願意參與本研究之專家，請專家依據其臨床經驗，判斷題庫中各題目對於思覺失調症患者之重要性，以及各題目所評量的概念及情境是否須調整，若須調整，則請專家提供修改建議。

研究者彙集所有專家之回覆後，即依據專家之建議進行挑題與修改題目。研究者僅保留專家平均認為該題重要性 ≥ 3.0 分（即有點重要至非常重要）的題目，接著依據各專家對於這些題目的建議修訂題目內容。保留的題目經修訂後組成修訂版題庫。最後，研究者依據修訂版題庫之劇本拍攝短劇、錄音與後製，各題目皆以一支影片呈現。

步驟4：建置施測介面

研究者使用投影片放映檔作為施測修訂版題庫之平台，其中包含測驗名稱、

施測指導語與題目等施測介面。研究者以隨機亂數產生4 種題目排序，共建立 4 種版本之投影片放映檔，以減少因題目施測順序而影響患者作答表現，例如患者可能因疲累而對於較晚出現之題目的表現較差。4 種版本之間僅題序不同，其餘施測介面皆相同。

步驟5：修訂版題庫驗證

研究者收集思覺失調症患者對於修訂版題庫之作答表現，以進行單向度羅序

(35)

分析，藉此檢驗修訂版題庫中，各向度中的題目是否符合羅序模型之假設，進而刪減不適合的題目。

樣本

研究者以方便取樣方式，於3 所社區職能工作坊、2 所精神專科醫院之慢性病房以及1 所醫學中心之精神科日間病房招募慢性期的思覺失調症患者進行題庫施測。僅招募慢性期患者之主因有二：(1) 此階段患者的精神症狀較為穩定，較能負擔長時間的題庫施測過程，且多次施測間，患者的能力較一致。(2) 此階段患者的主要治療目標為職業復健，可能為本測驗未來主要應用的族群。患者之納入條件有五：(1) 經精神科醫師依據 DSM-5 診斷為思覺失調症。(2) 20 歲以上。

(3) 於研究期間病情穩定，即第一次施測與最後一次施測時，患者之臨床整體印象嚴重性量表 (Clinical Global Impression-Severity, CGI-S) (Guy, 1976) 分數未改變，且未調整抗精神藥物與藥量。(4) 識字或可以中文溝通並清楚回答問題者。

(5) 可配合施測者之指令完成評估者。患者若有任何其它重大疾病（如：失智症、腦傷、智能障礙、重鬱症、物質濫用等）可能影響其作答，則予以排除。

程序

研究者請每位患者於2~3 週內，共分為 4~5 次施測時間，完成修訂版題庫所有題目之評估。每位患者僅須作答各題目1 次，研究者在每次施測過程皆記錄患者完成作答所需時間，以作為下一階段驗證施測效率之依據。研究者同時使用蒙特利爾認知評估 (Montreal Cognitive Assessment, MoCA) (Nasreddine et al., 2005) 評量患者的整體認知功能，以及使用個人與社會功能量表 (Personal and Social Performance Scale, PSP) (Morosini, Magliano, Brambilla, Ugolini, & Pioli, 2000;

Tianmei et al., 2011) 評量患者之整體社會表現，以作為下一階段驗證效度之依據。研究者亦查閱病歷或詢問患者以記錄其人口學與臨床特性資料，如：年齡、

教育程度、發病時間、工作經驗等。

工具

(36)

CGI-S 為常用於評量精神科患者之整體性精神症狀嚴重程度的量表 (Guy, 1976)。CGI-S 僅有 1 題，由臨床人員依據經驗判斷患者之疾病嚴重性。計分方式為將精神症狀嚴重程度由最輕微至最嚴重分為1-7 級（1：正常，沒有生病、2：

病況極輕、3：病況輕微、4：病況中等、5：病況明顯、6：病況嚴重、7：病況最為嚴重的一位）。過去文獻指出CGI-S ≤ 3 分表示患者為輕度障礙 (Pinna et al., 2015)。CGI-S 之再測信度可接受［組內相關係數 = 0.69~0.96］、已知族群效度良好，可顯著區辨緩解與未緩解患者間的症狀嚴重度差異 (Pinna et al., 2015)。CGI- S 雖僅有 1 題，然其驗證於思覺失調症患者之反應性與具有 24 題之簡明精神病評定量表 (Brief Psychiatric Rating Scale) 相仿 (Leucht & Engel, 2006)。本研究使用 CGI-S 作為檢視患者於研究期間精神症狀嚴重度是否明顯改變之參考。CGI-S 之內容詳見附錄一。

MoCA 為用以快速篩檢輕度認知障礙患者之量表 (Nasreddine et al., 2005)。

MoCA 評量整體認知功能，涵蓋以下 8 種認知向度：注意力、記憶力、語言、定向感、視覺空間建構、執行功能、抽象思考與計算等，施測時間約10~15 分鐘。

MoCA 總分為 30 分，一般以 26 分或以上代表認知功能正常。MoCA 之敏感性良好，於具輕度認知損傷 (mild cognitive impairment) 族群中，可正確篩檢出 90%為 MCI 者 (Nasreddine et al., 2005)。MoCA 應用於思覺失調症患者具有良好的內在一致性 (Cranbach’s alpha = 0.71)。且 MoCA 之收斂效度佳，與簡易智能狀態測驗 (Mini Mental State Examination) 具中高度相關 (Pearson’s r = 0.62) (Ramírez, Saracco-Álvarez, Escamilla-Orozco, & Orellana, 2014)。此外，多篇研究顯示：

MoCA 之敏感性較 MMSE 佳，較能偵測出患者之認知損傷 (Nasreddine et al., 2005; Ramírez et al., 2014)。本研究使用 MoCA 作為第二階段初步驗證 COMTESS 之已知族群效度的效標。MoCA 之內容詳見附錄二。

PSP 評估思覺失調症患者的整體社會表現，其為依據 DSM-IV 對思覺失調症之診斷標準發展而成。PSP 涵蓋四個面向：(1) 一般角色功能、(2) 人際與社交關

(37)

係、(3) 自我照顧能力與 (4) 干擾與攻擊行為。各面向依據患者需要協助的程度分為6 個等級，分數越高表示問題越嚴重。計分者可依據上述四面向之等級對應 PSP 之總分級距，再依據臨床經驗判斷該患者之總分分數值。PSP 具備良好的再測信度 (Juckel et al., 2008; Nasrallah, Morosini, & Gagnon, 2008; Patrick et al., 2009) 與可接受之施測者間信度 (Morosini et al., 2000; Patrick et al., 2009)，其建構效度與收斂效度可接受 (Juckel et al., 2008; Kawata & Revicki, 2008; Nasrallah et al., 2008; Patrick et al., 2009)。本研究使用 PSP 作為第二階段初步驗證 COMTESS 之收斂效度的效標。PSP 之內容詳見附錄三。

資料分析

研究者使用單向度羅序分析分別檢驗「個人社交技巧」與「職務相關社交技巧」二向度之題庫中，各題目是否符合羅序模型之二項主要假設：單向度與局部獨立性。違反羅序模型假設之題目則予以刪除，並於刪題後重新分析，直到所有題目皆符合羅序模型假設。

研究者先使用ConQuest 軟體分別以羅序家族模型中的 RSM 與 PCM 模型進行分析，接著，研究者以卡方差異檢定 (chi-square difference test) 比較 RSM 與 PCM 之模型離差值 (model deviance)，以決定後續羅序分析適用的分析模型。卡方差異檢定如公式 (1)：

χ_diff² = χ_RSM² - χ_PCM² ~ χ_df

diff = df_RSM - df_PCM

2 (1)

公式 (1) 中，χ_RSM² 為 RSM 之模型離差值，χ_PCM² 為 PCM 之模型離差值，χ_diff² 為兩模型之模型離差值的差異量。df_RSM 為 RSM 之估計自由度，df_PCM 為 PCM 之估計自由度，df_diff 為兩模型之自由度的差異量。若 p < 0.05 表示 PCM 為較好的分析模型。

之後，研究者使用較好的模型進行題目分析，以檢驗量尺適切性（若適用的模型為PCM 才進行此分析）以及題目與羅序模型之適配度。

(38)

合預期之順序。若階難度出現錯置的問題，則代表患者填答特定量尺的機率過低，意謂量尺項目過多須刪減計分點或合併鄰近計分點。調整計分量尺後須再重新進行羅序分析，並再次檢驗量尺適切性。

研究者使用以下三種指標檢驗各題目是否符合羅序模型之假設：(1) 題目合適度指標：研究者以合適度統計值作為判斷指標，用以排除與羅序模型預期落差過大之題目。合適度統計值分為近合適度 (infit mean square, infit MNSQ) 與遠合適度 (outfit mean square, outfit MNSQ) (Bond & Fox, 2001; Wright & Mok, 2000)。

本研究以Wright 和 Linacre 所建議之 MNSQ 介於 0.60~1.40 作為判定各題目是否符合羅序模型的合適度標準 (Wright & Linacre, 1994)。若題目之 infit MNSQ 與 outfit MNSQ 皆落在 0.60~1.40 之範圍外，研究者即刪除該題目，並重新進行羅序分析。(2) 各題殘差間之相關係數：研究者依據每位患者於每一題之得分與期望得分計算各題目之殘差。再檢驗各題殘差間之皮爾森相關係數 (Pearson's

correlation coefficient)，以驗證各向度內，題目之間是否符合局部獨立性，即當患者之能力不變時，該患者在不同題目間的答題反應不會互相影響。若相關係數 >

0.50，則表示明顯違反局部獨立性假設 (Escobar et al., 2015; Siemons, ten Klooster, van de Laar, van den Ende, & Hoogeboom, 2013)，應刪題並重新進行羅序分析。(3) 各題殘差間之主成份：研究者使用各題殘差進行主成份分析 (principal

components analysis, PCA)，以分別檢驗各向度之題庫是否皆符合單向度。若殘差的第一個主成份之特徵值 (eigenvalue) ≤ 3.0，則表示題庫符合單向度 (Linacre, 2009)。

逐次刪題重新進行羅序分析後，若保留之題目皆符合上述各項指標，則組成最終版題庫。

步驟6：選題並建構 COMTESS

研究者先將最終版題庫進行多向度羅序分析，以估計題目難度參數與患者能

(39)

力參數。之後依據題目難度與患者能力高低之對應，挑選分派題以作為 COMTESS 之第一階段能力分派的依據，並挑選不同難度之測驗組以作為

COMTESS 之第二階段依患者能力適性施測的測驗題。研究者預設每位患者僅須作答2 題分派題與 8 題測驗組，共 10 題。

首先，研究者使用前一步驟所得的最終版題庫進行多向度羅序分析。研究者以ConQuest 軟體，使用邊際最大概似法 (marginal maximum likelihood estimation) 進行題目參數之估計。之後再以MATLAB 軟體，使用最大後驗法 (maximum-a- posteriori estimation, MAP) 估計患者於「個人社交技巧」與「職務相關社交技巧」二向度之能力值。參數估計時，研究者限定各向度的題目平均難度為0.00。

完成參數估計後，研究者依據題目難度參數與患者能力參數繪製「題目難度與患者能力之對應圖 (item-person map)」，以檢視題目難易程度分佈與患者之工作社交技巧程度的對應關係。

之後，研究者計算患者於二向度各別的平均能力值，並以平均能力值作為將患者分組、挑選分派題與不同難度測驗組之依據。

能力分組部份，若患者的能力估計值高於平均值，則在該向度屬於高能力組；反之，若患者的能力估計值等於或低於平均值，則在該向度屬於低能力組。

即同一患者於二向度具個別所屬之能力組別，共計4 種分組之組合（「個人社交技巧」分為高、低2 組 「職務相關社交技巧」分為高、低 2 組）。

挑選分派題部份，研究者從二個向度的題庫中，各挑選1 題階難度最接近平均能力值之題目作為分派題，共挑選2 題作為 COMTESS 之分派題。因難度接近平均能力值之題目，可能提供最多有用的訊息以準確估計及區辨能力落在平均值附近之患者，有利於增加分派之正確性。之後，研究者使用分派題估計每位患者在二向度之分派能力值，並依據前述的平均能力值將患者的分派能力值分為高能力組與低能力組，以計算分派題之分派正確率。若患者在完成分派題後所得的能力分組，與原先所屬組別相同，則視為分派正確。

發展思覺失調症患者之工作社交技巧電腦化多階段角色扮演測驗

國立臺灣大學醫學院職能治療學系 博士論文

School of Occupational Therapy College of Medicine National Taiwan University

Doctoral Dissertation

發展思覺失調症患者之工作社交技巧 電腦化多階段角色扮演測驗

Development of a computerized multistage role-play testing of employment social skills in patients with schizophrenia

黃怡靜 Yi-Jing Huang

指導教授：謝清麟 教授

Advisor: Ching-Lin Hsieh, Professor

中華民國 107 年 5 月

May, 2018

口試委員會審定書

中文摘要

英文摘要

目 錄

圖目錄

表目錄

第一章 工作社交技巧 (employment social skills) 簡介 第一節 工作社交技巧之定義

第二節 工作社交技巧之理論

第三節 工作社交技巧之能力與表現面向的介紹與評析

第二章 工作社交技巧對於思覺失調症患者就業之重要性 第一節 思覺失調症之流行病學資料與病徵

第二節 思覺失調症患者之工作社交技巧障礙

第三章 工作社交技巧常用之評估方法與評估工具 第一節 工作社交技巧之評估方法與優缺點比較

第二節 工作社交技巧角色扮演測驗應具備之特性

第三節 工作社交技巧角色扮演測驗之介紹與評析

第四章 應用多向度羅序模型 (multidimensional Rasch

model) 與電腦化多階段測驗 (computerized multistage testing) 發展工作社交技巧角色扮演測驗之優勢 第一節 將角色扮演測驗電腦化之優勢

第二節 多向度羅序模型之概念與特點

第三節 電腦化多階段測驗之概念與優點

第四節 角色扮演測驗結合多向度羅序模型與電腦化多階段測驗之優 勢

第五章 研究目的

第六章 研究方法

第一節 第一階段：發展 COMTESS

國立臺灣大學醫學院職能治療學系博士論文

發展思覺失調症患者之工作社交技巧電腦化多階段角色扮演測驗

指導教授：謝清麟教授

目錄

第一章工作社交技巧 (employment social skills) 簡介第一節工作社交技巧之定義

第二節工作社交技巧之理論

第三節工作社交技巧之能力與表現面向的介紹與評析

第二章工作社交技巧對於思覺失調症患者就業之重要性第一節思覺失調症之流行病學資料與病徵

第二節思覺失調症患者之工作社交技巧障礙

第三章工作社交技巧常用之評估方法與評估工具第一節工作社交技巧之評估方法與優缺點比較

第二節工作社交技巧角色扮演測驗應具備之特性

第三節工作社交技巧角色扮演測驗之介紹與評析

第四章應用多向度羅序模型 (multidimensional Rasch

model) 與電腦化多階段測驗 (computerized multistage testing) 發展工作社交技巧角色扮演測驗之優勢第一節將角色扮演測驗電腦化之優勢

第二節多向度羅序模型之概念與特點

第三節電腦化多階段測驗之概念與優點

第四節角色扮演測驗結合多向度羅序模型與電腦化多階段測驗之優勢

第五章研究目的

第六章研究方法

第一節第一階段：發展 COMTESS