發展思覺失調症患者之電腦化多階段工作記憶測驗組

(1)

國立臺灣大學醫學院職能治療學系博士論文

School of Occupational Therapy College of Medicine National Taiwan University

Doctoral Dissertation

發展思覺失調症患者之電腦化多階段工作記憶測驗組 Development of a computerized multistage testing of

working memory in patients with schizophrenia

林恭宏 Gong-Hong Lin

指導教授：謝清麟教授

Advisor: Ching-Lin Hsieh, Professor

中華民國 107 年 5 月

May, 2018

(2)

口試委員會審定書

(3)

中文摘要

背景與目的：工作記憶 (working memory, WM) 為個體短暫儲存並操縱訊息之能力。WM 缺損為思覺失調症患者核心認知缺損之一，影響患者之思覺失調症狀、

功能性表現及生活品質。然而，目前常用於思覺失調症患者之WM 評量工具有三項限制：（一）未完整評量Baddeley「多系統 WM 模式」之所有 WM 系統；

（二）紙筆/桌上型測驗之施測者負擔較大；（三）心理計量特性 (psychometric properties) 驗證結果不佳或缺乏驗證。上述限制使得臨床及研究人員難全面地掌握思覺失調症患者之WM 狀態，嚴重影響 WM 之研究與臨床評估/治療效能。為解決上述WM 測驗之限制，本研究之目的為：依據 Baddeley 之「多系統 WM 模式」，以「多向度羅序模型」發展一套電腦化多階段WM 測驗：電腦化多階段工作記憶測驗組 (Computerized Multistage Testing of Working Memory, COWMEM)，

以完整地評量各WM 系統。此外研究者驗證 COWMEM 之心理計量特性，包含信度、同時效度、收斂效度及已知族群效度。

方法：本研究包含二個階段，第一階段為「發展COWMEM」，包含六個步驟：

（一）參考Baddeley 之多系統 WM 模式以設計 COWMEM 之 6 個向度題目，包含：視空間系統、語音系統、訊息整合系統、及中央執行系統之3 種注意力：集中性注意力、轉換性注意力及分配性注意力；（二）專家內容效度驗證；（三）電腦施測平台建構；（四）題庫測試於病情穩定之思覺失調症患者；（五）題庫驗證：以單向度羅序分析各WM 向度題庫，並刪除違反羅序模型假設之題目；及

（六）選題以建構COWMEM。本研究第二階段為「驗證 COWMEM 之信度與效度」，以本研究第一階段收集之患者資料進行分析。信度部分，研究者計算 COWMEM 之受測者個別信度及所有受測者平均信度。同時效度驗證上，研究者以 Pearson’s r 分別檢驗 COWMEM 之 6 個 WM 向度分數與 6 個一一對應之效標 測驗 [Spatial Span-backward, Digit Span-backward, California Verbal Learning Test- 10 minutes delayed recall, Test of Everyday Attention (TEA)-Elevator counting, TEA- Visual elevator, and TEA-Telephone search dual task] 分數之相關性。收斂效度以 Pearson’s r 檢驗 6 個 WM 向度分數間之相關程度。已知族群效度驗證上，研究者 依據整體認知功能量表 Montreal Cognitive Assessment 將受測者分為高、低認知

(4)

等二組 (分數 ≥ 26 or ≤ 25)，再計算效應值 (Cohen’s d) 以檢驗二組之 COWMEM 分數差異程度。

結果：本研究第一階段COWMEM 題庫經 3 回合之專家內容效度驗證，149 位思覺失調症患者之臨床測試，題庫驗證刪除5 題不符合羅序模型或研究者假設之題目，於最後階段挑選6 題篩檢題，並於 6 個 WM 向度題庫中分別挑選高及低難度測驗組之題目各15 題，以組成最終版 COWMEM（共 186 題），每位受測者作答 COWMEM 時須完成 6 題篩檢題及各 WM 系統之 1 組高或低難度測驗組（共 96 題）。本研究第二階段驗證COWMEM 信度之結果發現，6 個 WM 向度平均信度為0.70~0.86，此結果顯示團體層級信度可接受。個別信度驗證結果顯示

52.0%~100.0%之受測者個別信度 ≥ 0.70，表示個別信度可接受。同時效度驗證結果發現COWMEM 之中央執行系統 3 種注意力分數與效標測驗分數之 |Pearson’s rs| 為 0.21~0.22，此結果顯示 COWMEM 中 3 種注意力分數之同時效度不佳。

COWMEM 其它 3 個 WM 向度（視空間系統、語音系統及訊息整合系統）與效標測驗分數之 Pearson’s rs 為 0.50~0.52，此結果顯示上述三個系統之同時效度中 等。COWMEM 之收斂效度發現 6 個 WM 向度分數間之 Pearson’s rs 為

0.33~0.87，此結果顯示 COWMEM 之收斂效度良好。COWMEM 之已知族群效度驗證結果顯示，高、低認知功能組別之受測者於6 個 WM 向度之 Cohen’s d 為 0.72~1.06，此結果顯示 COWMEM 具中等至良好之已知族群效度。

結論：COWMEM 可能為第一個依據 Baddeley 多系統 WM 模式發展之電腦化 WM 測驗組，可完整評量 6 個 WM 向度。本研究初步驗證 COWMEM 於思覺失調症患者之心理計量特性，結果發現COWMEM 中 6 個 WM 向度分數之信度可接受、收斂效度良好、已知族群效度中等至良好。同時效度驗證結果發現，

COWMEM 之視空間系統、語音系統及訊息整合系統分數具可接受之同時效度，

但中央執行系統中3 種注意力分數之同時效度尚不明確。COWMEM 適用於思覺失調症患者團體層級之各WM 系統能力比較，例如：研究中實驗組及對照組於各 WM 向度能力比較，或臨床上不同嚴重程度或病程之患者族群於各 WM 向度能力比較。

關鍵詞：思覺失調症，工作記憶，電腦化多階段測驗，心理計量特性

(5)

英文摘要

Background and purposes: Working memory (WM) can be defined as an individual’s ability to maintain and manipulate information temporarily. WM deficit is a core syndrome of cognitive deficits for patients with schizophrenia. WM deficit may affect other syndromes of schizophrenia, functional outcomes, and quality of life. However, current frequently used WM tests have 3 limitations, including: (1) incomprehensive assessment of the WM components of the Baddeley’s multiple-component model; (2) heavy administration burden of the paper-and-pencil tests for assessors; and (3) unsound / less-examined psychometric properties. Due to these 4 limitations, researchers and clinicians cannot efficiently and accurately measure the WM deficits in patients, which hampers the efficiency and efficacy in the research and treatment on WM.

To deal with the limitations of the WM tests, the first aim of this study was to develop a Computerized Multistage Testing of Working Memory (COWMEM) in patients with schizophrenia based on the Baddeley’s multiple-component model. The second aim of this study was to examine the preliminary psychometric properties of the COWMEM in patients with schizophrenia, including reliability and validity (concurrent validity, convergent validity, and known-groups validity).

Methods: This study is comprised of 2 phases. Phase 1 contained 6 steps to develop the COWMEM: (1) designing the items of the COWMEM’s 6 item banks (domains):

phonological loop, visuospatial sketchpad, episodic buffer, and central executive’s 3 types of attentional controls (focused attention, switching attention, and divided attention); (2) examining the content validity; (3) establishing the administration platform of the item banks; (4) administering the item banks in patients with

schizophrenia; (5) validating the item banks: deleting the items which did not fit the unidimenal Rasch model in each item bank; and (6) selecting items from the item banks to establich the COWMEM. In Phase 2, the data collected in Phase 1 were used to validate the psychometric properties of the COWMEM. To examine the reliability of the COWMEM, individual patient’s Rasch reliability and the average Rasch reliability of the patients were calculated. To validate the concurrent validity, Pearson’s r was calculated to examine the correlations between the 6 domain scores of the COWMEM and the scores of the corresponding external criteria [Spatial Span-backward, Digit Span-backward, California Verbal Learning Test-10 minutes delayed recall, Test of

(6)

Everyday Attention (TEA)-Elevator counting, TEA-Visual elevator, and TEA-

Telephone search dual task]. To validate the convergent validity, the correlations among the COWMEM’s 6 domain scores were examined using Pearson’s r. To validate the known-groups validity, the patients were divided into 2 groups (good or poor cognition) according to the patients’ scores of the Montreal Cognitive Assessment (≥ 26 or ≤ 25).

Next, in each domain of the COWMEM, the extent of difference of the mean domain scores between the 2 groups was examined using effect size (Cohen’s d).

Results: In Phase 1, the item banks of the COWMEM were validated through 3 rounds of examination for content validity, administered on 149 patients with schizophrenia, and 5 items which did not fit the Rasch model were deleted. Finally, the COWMEM contained 6 routing items and 2 item sets (difficult or easy; 15 items in each item set) in each of the 6 domains (a total of 186 items). In the administration of the COWMEM, each patient had to complete the 6 routing items and 1 item set (which are chosen according to the patient’s performance on the routing items) in each of the 6 domains (a total of 96 items). In Phase 2, the results of the reliability indicate that the COWMEM has acceptable individual reliability (52.0%~100.0% of patients had Rasch reliability ≥ 0.70) and average reliability (0.70~0.86 across the 6 domains). The results of the concurrent validity indicate that the COWMEM has acceptable concurrent validity in the 3 domains (phonological loop, visuospatial sketchpad, and episodic buffer;

Pearson’s rs = 0.50~0.52) but poor concurrent valditiy in the other 3 domains (central executive’s 3 types of attentional controls; Pearson’s rs = 0.21~0.22). The results of the convergent validity indicate that the COWMEM has good convergent validity

(Pearson’s rs = 0.33~0.87). The results of the known-groups validity indicate that the COWMEM has moderate-to-good known-groups validity (Cohen’s ds = 0.72~1.06).

Conclusion: The COWMEM may be the first computerized WM test for comprehensively assessing 6 domains of WM. The preliminary examination of psychometric properties indicate that the COWMEM has acceptable reliability, good convergent validity, moderate-to-good known-groups validity. Regarding the concurrent validity, the 3 domain scores (phonological loop, visuospatial sketchpad, and episodic buffer) of the COWMEM have acceptable concurrent validity, but the concurrent validity of the other 3 domain scores (central executive’s 3 types of attentional controls) are unclear. The COWMEM can be used to compare the scores of the 6 WM domains among groups of patients with schizophrenia (e.g., control vs. treatment group in

(7)

research or comparisons between groups of patients with different severities or stages in clinical settings).

Keywords: schizophrenia, working memory, computerized multistage testing, psychometric property

(8)

圖目錄

圖一：Baddeley 之「多系統 WM 模式」 ... 61

圖二：Cowan 之「階層性訊息處理模式」 ... 62

圖三：Ericsson 之「長期工作記憶模式」 ... 63

圖四：電腦化多階段測驗流程 ... 64

圖五：COWMEM 測驗架構 ... 65

圖六：語音系統題目施測流程 ... 66

圖七：視空間系統題目施測流程 ... 67

圖八：訊息整合系統題目施測流程 ... 68

圖九：中央執行系統-集中性注意力題目施測流程 ... 69

圖十：中央執行系統-轉換性注意力題目施測流程 ... 70

圖十一：中央執行系統-分配性注意力題目施測流程 ... 71

圖十二：語音系統之受測者能力與題目難度對應圖 ... 72

圖十三：視空間系統之受測者能力與題目難度對應圖 ... 73

圖十四：訊息整合系統之受測者能力與題目難度對應圖 ... 74

圖十五：中央執行系統-集中性注意力之受測者能力與題目難度對應圖 ... 75

圖十六：中央執行系統-轉換性注意力之受測者能力與題目難度對應圖 ... 76

圖十七：中央執行系統-分配性注意力之受測者能力與題目難度對應圖 ... 77

圖十八：COWMEM 語音系統之個別信度及能力散佈圖 ... 78

圖十九：COWMEM 視空間系統之個別信度及能力散佈圖 ... 79

圖二十：COWMEM 訊息整合系統之個別信度及能力散佈圖 ... 80

圖二十一：COWMEM 中央執行系統-集中性注意力之個別信度及能力散佈圖 ... 81

圖二十二：COWMEM 中央執行系統-轉換性注意力之個別信度及能力散佈圖 ... 82

圖二十三：COWMEM 中央執行系統-分配性注意力之個別信度及能力散佈圖 ... 83

(11)

表目錄

表一：三種常用WM 模式之重點整理 ... 84

表二：專家內容效度之專家建議及修改內容 ... 85

表三：受測者人口學基本資料 ... 87

表四：COWMEM 各向度題庫經多向度羅序分析之受測者能力及題目難度 ... 89

表五：COWMEM 篩檢題及高/低難度測驗組之羅序模型適配度指標及題目難度 90 表六：COWMEM 語音系統篩檢題及高/低難度測驗組之題目 ... 91

表七：COWMEM 視空間系統篩檢題及高/低難度測驗組之題目 ... 92

表八：COWMEM 訊息整合系統篩檢題及高/低難度測驗組之題目 ... 96

表九：COWMEM 中央執行系統-集中性注意力篩檢題及高/低難度測驗組之題目 ... 100

表十：COWMEM 中央執行系統-轉換性注意力篩檢題及高/低難度測驗組之題目 ... 101

表十一：COWMEM 中央執行系統-分配性注意力篩檢題及高/低難度測驗組之題目 ... 102

表十二：COWMEM 篩檢題、電腦化多階段測驗及題庫之信度 (n = 102) ... 103

表十三：COWMEM 之同時效度 (n = 102) ... 105

表十四：COWMEM 之收斂效度 (n = 102; Pearson’s r) ... 106

表十五：COWMEM 之已知族群效度 (n = 102) ... 107

(12)

第一章工作記憶 (working memory, WM) 簡介第一節記憶力之分類

記憶力 (memory) 是個體的一種認知能力，使個體得以將外界訊息編碼

（encode，即個體將外界訊息轉成可記憶之形式）、儲存（store，儲存編碼後之訊息）、及提取（retrieve，提取已儲存之訊息）(Atkinson & Shiffrin, 1968; Wegner, 1987)。依據記憶力儲存訊息之時間長短，可將記憶力分為三種：感覺記憶 (sensory memory)、短期記憶 (short-term memory, STM)、及長期記憶 (long-term memory, LTM) (Atkinson & Shiffrin, 1968)。然而，個體除可儲存訊息外，尚具備操縱及控制（如訊息合併、分類或比較等）訊息之能力。因此Baddeley 及 Hitch (Baddeley & Hitch, 1974) 提出工作記憶 (working memory, WM)，以結合 STM 及訊息操縱之能力。

感覺記憶

感覺記憶又稱感覺登錄器 (sensory register)，指個體能夠短暫保存各種感官訊息（如視覺及聽覺等）之能力。感覺記憶保存訊息之時間約0.3 秒 (Cowan, 1984; Rensink, 2014)。當個體藉由注意力發現儲存於感覺記憶之訊息，則該訊息可被進一步儲存於STM 或 LTM，以供後續提取使用。

短期記憶

STM 指個體可將少量訊息保留一段短暫時間的能力，成人的 STM 約可儲存 5~9 個記憶材料（如數字），而 STM 的資訊約可保存 15~30 秒 (Cowan, 1984;

Rensink, 2014)。

長期記憶

LTM 指個體可將訊息保留一段較長時間的能力，LTM 可儲存的訊息量沒有限制，而LTM 訊息可保存的時間從數分鐘至一輩子 (Cowan, 1984; Rensink, 2014)。依據 LTM 訊息的內容分類，可分成二大類：外顯性記憶 (explicit

memory) 及內隱性記憶 (implicit memory) (Graf & Schacter, 1985)。外顯性記憶為

(13)

可用語言描述或說明的記憶（如知識或生活事件），外顯性記憶又可分為二類：

(1) 事件記憶 (episodic memory) (Graf & Schacter, 1985)：有關生活事件的記憶

（如昨天晚餐的內容）；(2) 語意記憶 (semantic memory) (Graf & Schacter, 1985)：

有關語意的記憶或知識（如知道「餐廳」一詞是指吃飯的場所）。內隱性記憶則為無法用語言描述之記憶，包含特定動作技巧（如游泳）或制約反應（如被蛇咬過的人看到蛇會產生害怕的反應）等。

工作記憶

Baddeley 及 Hitch (Baddeley & Hitch, 1974) 提出 WM 之概念：個體除可以短暫儲存訊息（即STM）外 (Baddeley, 2012)，尚可操縱及控制（如訊息合併、分類或比較等）暫存的訊息；換句話說，WM 包含 STM 及訊息操縱/控制之能力。

WM 之短期記憶約可儲存 5~9 個記憶材料（如數字），短期記憶之資訊保存時間約15~30 秒 (Atkinson & Shiffrin, 1968; Baddeley & Hitch, 1974)。然而 WM 具有訊息複述（rehearsal，詳第二節：WM 之理論）之能力，因而可增進訊息保存之時間或形成長期記憶。

第二節 WM 之理論

常被引用之WM 理論有三：(1) Baddeley 之多系統 WM 模式 (multiple- component model)；(2) Cowan 之階層性訊息處理模式 (embedded-processed model of working memory)；及 (3) Ericsson 之長期工作記憶模式 (long-term working memory model)。

(1) Baddeley 之多系統 WM 模式 (multiple-component model)

Baddeley 之「多系統 WM 模式」(Baddeley, 2012; Baddeley & Hitch, 1974) 指出WM 代表個體儲存資訊並操縱 (manipulate) 資訊的能力，使個體能夠學習新事物及解決問題等。Baddeley 之 WM 模式包含四個系統（圖一），分別為「語音系統 (phonological loop)」、「視空間系統 (visuospatial sketchpad)」、「訊息整合系統 (episodic buffer)」及「中央執行系統 (central executive)」。「語音系統」負責處理語音訊息，語音訊息可能來自環境之語音刺激，或提取LTM 中的語音相關記

(14)

憶（如國字的讀音）。語音系統可再細分為二部分：「語音訊息儲存 (phonological store)」及「語音訊息默述 (articulatory rehearsal)」。「語音訊息儲存」可暫存語音資訊，但這些資訊會在短時間內消退，而「語音訊息默述」則透過在心裡默默覆誦，以延長語音訊息留存於「語音訊息儲存」之時間。例如：當個體要記住他所聽到一組電話號碼（語音訊息）時，個體需藉由在心裡不斷地默念（即「語音訊息默述」）他所聽到並記得的號碼以幫助記憶（即「語音訊息儲存」）。

「視空間系統」(Baddeley, 2012; Baddeley & Hitch, 1974) 負責處理視空間訊息，視空間訊息可能來自環境之視空間刺激，或提取LTM 中的視空間相關記憶

（如特定之圖案）。視空間系統可再細分為二部分：「視空間訊息儲存 (visual cache)」及「視空間訊息回憶 (inner scribe)」。「視空間訊息儲存」可暫存視空間資訊，但這些資訊會在短時間內消退，而「視空間訊息回憶」則透過在心裡回想，以延長視空間訊息留存於「視空間訊息儲存」之時間。例如：當個體要記住他所看到一張圖片之內容（視空間訊息）時，個體需藉由在心裡不斷地回憶（即

「視空間訊息回憶」）他所看到且記得的圖片內容以幫助記憶（即「視空間訊息儲存」）。

「訊息整合系統」(Baddeley, 2012; Baddeley & Hitch, 1974) 可整合來自其它系統之訊息並暫存，訊息來源包括：提取LTM 中的事件記憶（episodic

memory，個體對於特定人事時地物的記憶，如對於今天早餐食物內容的記憶），

與來自語音及視空間系統之訊息，例如：當個體看到一組電話號碼時，個體會不斷地回想他所看到的數字（視空間系統中的內在描述），同時在心中默念看到的這組電話號碼（語音系統中的語音默述），此時個體記憶電話號碼的形式為結合視覺訊息及語音訊息，而非單純之視覺或語音訊息。

「中央執行系統」則是訊息處理中心 (Baddeley, 2012; Baddeley & Hitch, 1974)，使得個體之 WM 可操弄暫存於「訊息整合系統」之訊息，以利個體解決問題或執行任務。例如：當個體欲倒著背誦一組電話號碼時，除須先記住該組電話號碼（提取訊息整合系統中資訊），還需要重新排列電話號碼之順序，以正確地倒著背誦電話號碼；而重新排列電話號碼順序之任務即由中央執行系統負責處理。

(15)

Baddeley 認為個體之「中央執行系統」能完成 WM 中訊息操弄之任務，中央執行系統需具備3 種控制個體注意力 (attention) 之能力 (Baddeley, 1996, 2012;

Baddeley & Hitch, 1974)。3 種注意力控制能力分別為：集中性注意力 (focused attention)、分配性注意力 (divided attention) 及轉換性注意力 ( switching

attention)。「集中性注意力」使個體可將注意力集中於正在執行之任務，而不被與任務較不相關之訊息干擾 (Baddeley, 1996)。例如：當個體專注地倒著背誦一組電話號碼時，則容易忽略其周遭環境之聲音。「分配性注意力」之能力使個體可將注意力同時分配於多個（二個或以上）正在執行之任務 (Baddeley, 1996)。例如：

個體可一邊聽廣播一邊開車。「轉換性注意力」之能力使個體可將注意力從一項正在執行之任務中，轉換到另一項不同之任務；或從一種感覺訊息（如視覺訊息）轉換到另一種感覺訊息（如聽覺訊息）(Baddeley, 1996)。例如：當個體正閱讀書報時，突然有電話響起。個體之注意力可迅速地從閱讀書報之任務，轉換至電話溝通之任務。

(2) Cowan 之階層性訊息處理模式 (embedded-processed model of working memory) Cowan 之「階層性訊息處理模式」(Cowan, 1993; Jeon & Han, 2012) 認為 WM 為一種訊息處理的認知歷程，使個體可保留並使用特定訊息，以應付個體需處理之任務（如語言理解、問題解決或制定決策等）。「階層性訊息處理模式」包含三個訊息處理之階層（圖二），依據其處理訊息的先後順序為：「長期記憶 (long-term memory, LTM)」、「活化的記憶 (activated memory)」及「集中性注意力 (focused attention)」。WM 則包含「活化的記憶」及「集中性注意力」。

LTM 為訊息處理的第一階層，當個體接收到外界刺激（圖二之刺激 A、B 及 C；如個體看到一串電話號碼）時，會依據刺激的特徵（如數字的顏色、電話號碼由那些數字組成及數字的語音訊息等）活化LTM 中與這些刺激特徵相關的訊息（圖二之訊息a、b 及 c；如 a 為顏色辨認、b 為數字辨識及 c 為數字怎麼唸等相關訊息）。LTM 中儲存之訊息相當龐雜，僅其中一部分與外界特定刺激相關的訊息會被活化。

「活化的記憶」為訊息處理的第二階層，由LTM 中被活化的訊息所組成，

個體可輕易地提取或操縱「活化的記憶」中的訊息。部分「活化的記憶」之訊息

(16)

可受到個體「集中性注意力」之注意（圖二之b 及 c），尤其是與個體欲處理之任務相關或重要之訊息（如數字辨識及數字怎麼唸對於「記住電話號碼」此一任務而言為重要之訊息）。而部分未受到個體「集中性注意力」注意之訊息（圖二之 a；如數字的顏色相關訊息）則被個體忽略，而沒有意識到這些訊息。

決定訊息最終能否受到個體「集中性注意力」注意之機制有二：(1) 自主性的機制：藉由中央執行系統 (central executive) 調節，使得個體自主想得到的訊息能夠受到個體「集中性注意力」之注意。中央執行系統可直接活化儲存於LTM 中之訊息（圖二中D 到 d 之路徑；如個體可背誦出儲存於 LTM 中的電話號碼）、

或促進「活化的記憶」的訊息得以受到個體「集中性注意力」之關注（圖二中D 到c 之路徑，促進訊息 c 之活化；如個體欲從電話簿中尋找某一組儲存於 LTM 中的電話號碼時，個體較容易注意到電話簿中的電話號碼，而對於人的名字則較容易忽略）；(2) 非自主性的機制：有些刺激毋須透過個體自主之意識控制便可受到個體「集中性注意力」之關注，這些刺激通常為：突然改變的刺激（如光線突然閃爍）、強度較高的刺激（如較大的聲響或強光）或跟個體較相關的刺激（如個體突然聽到自己的名字）等。

「集中性注意力」為訊息處理的第三階層，亦為WM 之核心。受到個體「集中性注意力」關注之訊息將可被個體覺察及應用。例如：「集中性注意力」中的多個訊息彼此可合成而產生新的訊息（圖二之訊息e；如個體可結合 b 數字辨識、c 數字怎麼唸等訊息及 d 儲存於 LTM 中的電話號碼，判斷個體看到的電話號碼與其儲存於LTM 中的電話號碼是否相同），以利個體找到因應其任務所需之特定訊息。

Cowan 之「階層性訊息處理模式」較著重於 WM 中的訊息如何由外界刺激或直接從LTM 中取得之歷程。此模式認為 WM 取得訊息之歷程具有階層性，所有 WM 之訊息都來自於 LTM 之訊息活化。換句話說，Cowan 之階層性訊息處理模式認為WM 對於不同感官刺激型態的訊息，具相同之訊息處理歷程。然而此模式並未細分WM 處理不同感官刺激型態的訊息之差異，因此較難以解釋思覺失調症患者於不同感官訊息相關WM 之表現差異 (Forbes, Carrick, McIntosh, & Lawrie, 2009; Pukrop et al., 2003; Salamé, Danion, Peretti, & Cuervo, 1998)。

(17)

(3) Ericsson 之長期工作記憶模式 (long-term working memory model)

Ericsson 提出「長期工作記憶模式」(Ericsson & Kintsch, 1995) 認為 WM 是一種訊息調控的技能 (memory skill)，使個體可取得、選擇並使用特定訊息（來自環境之感官訊息或LTM），以處理個體所面臨之任務或問題。

當個體接收到環境的刺激時（圖三之刺激A 及 B），部分刺激會經由訊息處理之歷程而進入WM（圖三之訊息 a），此訊息處理歷程包含透過篩選並辨識外界刺激訊息。此外LTM 亦會促進個體之訊息處理歷程（圖三中 LTM 訊息 c 之箭頭），如個體可借助過去之經驗及知識等LTM 訊息，以增進篩選並暫存外界刺激訊息之效能。例如：當個體欲背誦一串電話號碼時，個體可依據其過去背誦的經驗（LTM 中的訊息），選擇較有效的背誦策略（如把數字轉成諧音）以利個體成功完成背誦一串電話號碼之任務。

個體除接收外界環境的刺激外，也可從LTM 中提取與其當前任務相關的訊息進入WM（圖三之訊息 d）。例如：當個體欲計算一道數學題目，則個體須從 LTM 中提取數學運算法則（如加減乘除的算法）至 WM，使得個體得以在計算數學題目的過程中，有效地使用加減乘除等基礎的數學運算法則。

WM 中來自外界刺激及 LTM 的訊息彼此可結合，進而形成新的訊息（圖三之訊息e，如個體可結合其看到的四則運算題目及 LTM 中的四則運算法則，進而心算出該題目之答案），此新的訊息有助於個體回應外界刺激，或做出適當之反應以解決個體面對之任務。

此外，WM 中之訊息可儲存至 LTM（圖三長期記憶中的虛線圓圈，包含外界刺激之訊息、原本提取自LTM 之訊息及 WM 產生之新訊息）。LTM 會依據訊息相關程度儲存訊息，常一起被個體提取之訊息或彼此相似之訊息間形成連結。因此當個體因應任務需求而提取某一訊息時，與這一訊息具有連結（相關）之訊息也會同時被提取，如此一來個體可有效率地應用大量與任務相關之訊息。

Ericsson 之「長期工作記憶模式」較著重於：LTM 於 WM 取得訊息歷程中之角色，包含LTM 可促進外界刺激進入 WM，及 LTM 依據訊息相關性儲存訊息以利WM 廣泛提取相關訊息。然而此模式認為 WM 為一個單一系統，而未深入探討個體覺察或應用WM 訊息之機轉。

(18)

WM 模式之選擇

上述三個常被使用之WM 模式各有其優點及實證依據（三種常用之 WM 模式簡述及比較整理於表一），然而近年來研究支持思覺失調症患者之WM 為一多向度之能力 (Forbes et al., 2009; Pukrop et al., 2003; Salamé et al., 1998)。例如：

Salame 等學者之研究發現閱讀速度較快之思覺失調症患者，其「語音訊息」WM 表現與常人相近，但「視空間訊息」WM 表現卻比常人差 (Salamé et al., 1998)。

這些研究結果支持Baddeley 之「多系統 WM 模式」是一個較合適之參考模式，

可用以全面地評量思覺失調症患者之WM，且可瞭解患者於不同 WM 向度之表現。

(19)

第二章思覺失調症之 WM 第一節思覺失調症簡介

思覺失調症為常見且對於患者影響深遠之疾病。依據精神疾病診斷及統計手冊第五版 (Diagnostic and Statistical Manual of Mental Disorders, fifth edition, DSM- 5) (American Psychiatric Association, 2013)，思覺失調症之臨床診斷標準包含三項：(1) 關鍵特質 (key feature)：關鍵特質包括妄想 (delusions)、幻覺

(hallucinations)、胡言亂語 (disorganized speech)、紊亂或緊張之行為表現 (grossly disorganized or catatonia behavior)、負性症狀 (negative symptoms)。患者須出現上述五種特質中的二種以上，且必須包含妄想、幻覺或胡言亂語；(2) 日常功能低落：病後多項之日常功能明顯低於病前，日常功能面向包含：人際關係、職業、

自我照顧功能、及學業表現等；(3) 病徵持續時間：至少持續出現 6 個月，且期間至少有一個月出現上述之關鍵特質。

思覺失調症之發生率為0.08~2.16‰ (Jablensky, Kirkbride, & Jones, 2011)，且好發於15~54 歲之間，男性與女性之發生率一致。然而過去研究發現都市人口之發生率高於鄉村人口約二至三倍 (Jablensky et al., 2011)。

首次發病之思覺失調症患者中，不到一成的患者於發病3 年後可康復；高達八成以上的患者於發病5 年後仍有思覺失調之症狀 (Robinson, Woerner,

McMeniman, Mendelowitz, & Bilder, 2004)；高達七成之患者於發病 20 年後仍須接受醫療照護（藥物或復健治療） (Harrow, Jobe, & Faull, 2012)。由於思覺失調症患者需要長期接受精神復健治療，其照護者及社會皆需負擔龐大之人力及經濟支出 (Rössler, Salize, van Os, & Riecher-Rössler, 2005)。

第二節思覺失調症患者之 WM 缺損

高比例之思覺失調症患者具有認知障礙，過去研究指出，高達55~85%之思覺失調症患者具認知損傷 (Vingerhoets, Bloemen, Bakker, & van Amelsvoort,

2013)。思覺失調症患者認知損傷之種類眾多，包含注意力、記憶力及執行功能等 (Green et al., 2004)，其中 WM 為核心之認知功能缺損之一 (Forbes et al., 2009)。

(20)

思覺失調症患者WM 缺損之比例高達 35~55% (Piskulic, Olver, Norman, & Maruff, 2007; Saperstein et al., 2006)，病後 10 年以上之患者仍高達半數具 WM 缺損 (Shrivastava, Johnston, Shah, Thakar, & Stitt, 2011)。思覺失調症患者之 WM 隨著病後時間增加而有改善之趨勢，但仍較年齡相仿之正常人差 (Faget-Agius et al., 2013; Heeramun-Aubeeluck et al., 2015; Rund, 1989)。

思覺失調症患者之WM 缺損可能是造成患者多項臨床表徵［思考障礙 (thought disorder)、紊亂行為、及負性症狀等］之重要因素 (Bowie & Harvey, 2005)。因 WM 缺損導致患者對於訊息（來自環境之感官訊息或長期記憶之訊息）之處理及調控效能較差，進而可能造成患者之思考障礙 (thought disorder)、

紊亂行為、及負性症狀［如淡漠 (apathy)］ (Bowie & Harvey, 2005; Raffard et al., 2016)。此外，WM 缺損亦影響思覺失調症患者之功能性預後 (Brekke, Kay, Lee,

& Green, 2005; Jaeger, Czobor, & Berns, 2003)。WM 缺損之患者因 WM 缺損導致患者之訊息處理效能較差，使其難以從事工作、社交活動、及日常生活活動 (Brekke et al., 2005; Jaeger et al., 2003)，最終將影響患者之生活品質 (Fujii, Wylie,

& Nathan, 2004)。

臨床和研究上，評量WM 對於思覺失調症患者的重要性有三：(1) WM 為患者之核心認知功能缺損 (Forbes et al., 2009)：評量 WM 有助於醫療相關人員判斷患者是否需接受WM 介入治療，及擬定 WM 治療目標與計畫；(2) WM 為患者之療效指標 (Burton et al., 2013; Vingerhoets et al., 2013)：完整地評量思覺失調症患者的WM，可以瞭解患者接受治療及藥物的成效，並追蹤預後的情形；(3) WM 為患者未來安置之參考指標 (Greenberger & Serper, 2010)：評量思覺失調症患者的WM，可協助醫療相關人員預測患者未來復原程度，並建議患者適當之安置機構（如安養院或社區復健機構等）。

(21)

第三章 WM 測驗之介紹與評析第一節良好 WM 測驗之主要特性

良好且實用之WM 測驗需具備三項主要特性：(1) 完整且明確之 WM 評量面向（概念）；(2) 優良的心理計量特性 (psychometric property)；(3) 便利/快速評量。

(1) 完整且明確之 WM 評量面向（概念）

依據Baddeley 之「多系統 WM 模式」，完整之 WM 評量須包含四個 WM 系統：語音系統、視空間系統、訊息整合系統、及中央執行系統。中央執行系統之評量須包含3 種注意力控制能力：集中性注意力、轉換性注意力、及分配性注意力。臨床人員須完整地評量思覺失調症患者之四個WM 系統，方能釐清患者 WM 最主要之缺損系統，進而針對患者之問題制定個別化之治療目標及計畫。對於研究人員而言，完整地評量WM 各系統有助於深入探討 WM 之相關機制，如特定治療或藥物對於各WM 系統之療效。

(2) 優良的心理計量特性

心理計量特性是判斷評估工具之評估結果是否正確可靠之指標 (Kirshner &

Guyatt, 1985; Mokkink, Prinsen, Bouter, Vet, & Terwee, 2016)。臨床人員須使用具備良好心理計量特性之評量工具，才可精確且有效地掌握患者之能力程度，並可預測患者之預後 (Kirshner & Guyatt, 1985; Mokkink et al., 2016)。進而臨床人員可依據這些評量結果擬定個別化且適當之治療計畫；而研究人員亦須使用具備良好心理計量特性之工具，才能有效地評量研究者欲探討之概念/能力、或作為其它評量工具發展時之效標 (Kirshner & Guyatt, 1985; Mokkink et al., 2016)。因此，一個新發展的評量工具必須完整地驗證其心理計量特性，呈現此工具之優缺點與特點，

提供未來臨床與研究人員使用之參考。

一個良好的測驗需具備下列二種心理計量特性 (Kirshner & Guyatt, 1985;

Mokkink et al., 2010)：信度 (reliability) 及效度 (validity)。「信度」代表受測者之評估分數與真實分數相近的程度，若信度越高表示測驗分數較不會受到隨機地測

(22)

量誤差影響，而偏離真實分數太多 (Milanzi, Molenberghs, Alonso, Verbeke, & De Boeck, 2015)。

「效度」指評量工具的評量結果可達到使用者評量目的（例如評量所欲測量之建構或區辨個體能力/表現）之程度 (Kline, 1998)。重要之效度驗證概念包含內容效度 (content validity)、同時效度 (concurrent validity)、收斂效度 (convergent validity) 及已知族群效度 (known-groups validity)。「內容效度」指測驗內容適當的程度，如測驗題目是否涵蓋各種欲測量的特質 (Kline, 1998)。一般研究中，可聘請相關專家檢驗量表之內容效度。「同時效度」指測驗結果與欲測量特質之公認測量方法（或稱黃金標準）所得結果的關聯程度 (Hobart, Lamping, &

Thompson, 1996)。「收斂效度」驗證測驗結果與理論上相關特質之測驗（外在效標）結果的關聯程度 (Portney & Watkins, 2000)。「同時效度」及「收斂效度」皆有助於確認評量工具所評量之特質是否與欲評量之特質相同。「已知族群效度」

指測驗結果可根據評估工具之背景理論，以區辨不同屬性族群（如不同嚴重程度之患者）之能力 (McCarthy et al., 2002)。

(3) 便利/快速評量

由於臨床評估之人力及時間有限，常需精簡、有效的評量方式。施測時間若過長（如超過30 分鐘），可行性隨之而降。

第二節常用於思覺失調症患者之 WM 測驗

研究者查詢PubMed 及 PsycINFO 資料庫所收錄的文獻中，最常被用於思覺失調症醫療結果評量 (outcome measure) 的 WM 評量工具主要有五（三項非電腦化測驗及二項電腦化測驗），非電腦化WM 測驗包含：數字記憶廣度測驗 (Digit Span Test)、空間記憶廣度測驗 (Spatial Span Test)、及數-字序列測驗 (Letter- Number Sequencing Test)；電腦化 WM 測驗包含：N-back 作業 (N-back Task) 及空間工作記憶測驗 (Spatial Working Memory Test)。

非電腦化WM 測驗 數字記憶廣度測驗

(23)

「數字記憶廣度測驗」為第三版魏氏成人智力測驗量表 (Wechsler Adult Intelligence Scale-III, WAIS-III) 主要分測驗之一 (Tulsky, Zhu, & Ledbetter, 1997)，

亦為第三版魏氏記憶量表 (Wechsler Memory Scale-III, WMS-III) 選擇性施測項目之一 (Tulsky et al., 1997)。「數字記憶廣度測驗」為語音系統相關之 WM 評量工具，包含二種獨立之作業：順序 (digit span forward) 與逆序 (digit span backward)

「數字記憶廣度測驗」。順序及逆序「數字記憶廣度測驗」作業中，受測者需按照相同順序或相反的順序覆誦其聽到的一串阿拉伯數字序列。受測者完成順序及逆序「數字記憶廣度測驗」約需5 分鐘，具施測快速且測驗內容無語言隔閡等優點。

「數字記憶廣度測驗」應用於思覺失調症患者之已知族群效度良好（可區辨患者及正常人） (Haatveit et al., 2010)，但建構效度 (construct validity) 不佳 (Noh et al., 2010)，顯示「數字記憶廣度測驗」除評量受測者之 WM 外，可能還受到其它認知功能影響 (Noh et al., 2010)。

「數字記憶廣度測驗」之主要缺點有三：(1) 僅評量語音系統相關之 WM，

未能全面評量WM 之各個次系統；(2) 施測者之負擔大，施測者須出題、記錄測驗結果並計算分數；(3) 建構效度不佳，且心理計量特性驗證不足。

空間記憶廣度測驗

「空間記憶廣度測驗」為WMS-III 主要分測驗之一 (Tulsky et al., 1997)。「空間記憶廣度測驗」為視空間系統相關之WM 評量工具，包含二種獨立之作業：順序 (spatial span forward) 與逆序 (spatial span backward)「空間記憶廣度測驗」。順序/逆序作業中，受測者需按照與施測者相同/相反的順序點擊散亂分佈的積木。

受測者完成全部測驗（順序及逆序「空間記憶廣度測驗」）約需5 分鐘，具施測快速且測驗內容無語言隔閡等優點。

「空間記憶廣度測驗」應用於思覺失調症患者之建構效度 (Burton et al., 2013)、收斂效度 (Fonseca et al., 2017)、生態效度 (Lees et al., 2015) 及再測信度 (Fonseca et al., 2017; Georgiades et al., 2017; Lees et al., 2015; Silverstein et al., 2010) 良好，然而其它之心理計量特性尚未驗證。

「空間記憶廣度測驗」之主要缺點有三：(1) 僅評量視空間系統相關之 WM，未能全面評量 WM 之各個次系統；(2) 施測者之負擔大，施測者須出題、

(24)

記錄測驗結果並計算分數；(3) 心理計量特性驗證不足。

數-字序列測驗

「數-字序列測驗」為 WAIS-III 及 WMS-III 主要分測驗之一 (Tulsky et al., 1997)。「數-字序列測驗」為語音系統相關之 WM 評量工具。受測者於測驗中需先聽一串由英文字母與數字交替排列所組成的序列，接著先按照數字由小到大背誦序列中的數字，再依照英文字母的順序 (A~Z) 背誦序列中的英文字母。受測者完成此測驗約需3 分鐘。

「數-字序列測驗」應用於思覺失調症患者具良好之收斂效度 (Fonseca et al., 2017)、已知族群效度（可區辨患者及正常人）(Haatveit et al., 2010) 及再測信度 (Fonseca et al., 2017; Georgiades et al., 2017; Lees et al., 2015; Silverstein et al., 2010)，及可接受之建構效度 (Burton et al., 2013) 與生態效度 (Lees et al., 2015)。

其它之心理計量特性尚未被驗證。

「數-字序列測驗」之主要缺點有四：(1) 僅評量語音系統相關之 WM，未能全面評量WM 之各個次系統；(2) 施測者之負擔大，施測者須出題、記錄測驗結果並計算分數；(3) 心理計量特性驗證不足；(4) 測驗內容具語言/文化隔閡，「數 -字序列測驗」題目中含英文字母。即使中文版之「數-字序列測驗」以十二生肖替代英文字母，然而對於十二生肖不熟悉的人可能有較差之測驗表現，甚至無法操作此測驗。

電腦化WM 測驗 N-back 作業

N-back 目前具多種版本，可為語音系統或視空間系統相關之 WM 評量工具，端看N-back 測驗內容之設計 (Owen, McMillan, Laird, & Bullmore, 2005)。測驗中受測者須專注看/聽每一個個別呈現之測驗刺激物（如數字或顏色色塊），若受測者發現當下呈現的測驗刺激物與前N 個（N 通常為 1-3）呈現的刺激物相同時，則受測者須按反應鍵。受測者完成全部測驗約5 分鐘，具施測者負擔較小、

施測快速且測驗內容無語言隔閡等優點。

N-back 應用於思覺失調症患者具可接受之建構效度 (Noh et al., 2010) 及良好之已知族群效度（可區辨患者及正常人） (Haatveit et al., 2010)，然而生態效度

(25)

(Lees et al., 2015) 及再測信度 (Lees et al., 2015; Silverstein et al., 2010) 之驗證結果不佳，其它之心理計量特性尚未驗證。

N-back 之主要缺點有二：(1) 僅評量語音系統或視空間系統相關之 WM，未能全面評量WM 之各個次系統；(2) 生態效度及再測信度不佳，其它心理計量特性驗證不足。

空間工作記憶測驗

「空間工作記憶測驗」為視空間系統相關之WM 評量工具 (Owen, Doyon, Petrides, & Evans, 1996)。「空間工作記憶測驗」要求受測者以最少的次數點擊方塊，以找出該題中所有藏在方塊背後的標記 (token)。由於出現過標記的方塊將不會再出現標記，因此受測者須記住曾出現過標記的方塊，以免重複點擊而增加點擊方塊之次數。受測者完成全部測驗約8 分鐘，具備之優點包含施測者負擔較小、施測快速且測驗內容無語言隔閡等。

「空間工作記憶測驗」應用於思覺失調症患者之收斂效度及已知族群效度皆不佳 (Kim, An, Kwon, & Shin, 2014)，其它心理計量特性缺乏驗證。

「空間工作記憶測驗」之主要缺點有二：(1) 僅評量視空間系統相關之 WM，未能全面評量 WM 之各個次系統；(2) 收斂效度及已知族群效度不佳，其它心理計量特性驗證不足。

第三節常用 WM 測驗之缺點

綜言之，目前常用之WM 評量工具應用於思覺失調症患者時易遭遇之限制有三：(1) 未完整評量 WM 之四個系統：缺乏完整評量 WM 各系統之評量工具，大多數WM 評量工具所評量之 WM 系統過於狹隘；(2) 施測者負擔較大：施測非電腦化測驗時，施測者之負擔較大，包含說明指導語、出題、計分並記錄施測結果等；(3) 心理計量特性驗證結果不佳或缺乏驗證：此問題嚴重影響思覺失調症患者評量結果之可信度及有效性，造成使用者於分數解釋之困難。以上限制導致這些常用之WM 評量工具無法完整評量或不適用於評量思覺失調症患者之 WM。

此外臨床或研究人員若欲使用國外發展之WM 評量工具，須支付可觀的費用

（包含購買施測手冊、計分紙、答案卷及常模等），例如紙筆測驗：「數字記憶廣度測驗」評量一次約需新台幣210 元（美金 7 元）；電腦化測驗：「空間工作記憶

(26)

測驗」評量一次約需新台幣90 元（美金 3 元）。

依據前述回顧，目前學術與臨床上仍缺乏可完整評估WM 各系統之評量工具。此限制對於臨床治療及學術研究皆有嚴重之影響。臨床治療上，醫療人員無法掌握思覺失調症患者各WM 系統之缺損程度，將難以針對患者特定之 WM 問題進行治療，使得思覺失調症患者之復健成效難以進一步提升；學術研究上，研究者無法掌握思覺失調症患者各WM 系統之缺損程度，則難以深入探討 WM 之相關機制，如特定治療或藥物對於各WM 系統之療效。因此，依據多系統 WM 模式建構一套可完整評估各WM 系統之測驗，將可提升臨床及學術上對於思覺失調症患者WM 之掌握及治療成效。

(27)

第四章電腦化 WM 測驗結合「多向度羅序模型

(multidimensional Rasch model)」與「電腦化多階段測驗 (computerized multistage testing)」

第一節多向度羅序模型

羅序模型介紹

羅序模型 (Rasch model) 為透過受測者於測驗中之作答反應（如答對或答錯），以機率模型分別估計「受測者之能力」及「題目之難度」 (Hays, Morales,

& Reise, 2000)。羅序模型具三項基本之假設 (Tesio, 2003; Wright & Linacre, 1989)：(1) 單向度 (unidimensionality)：測驗中的各題都評量同一特質或建構（例如WM 之「語音系統」）；(2) 受測者之作答反應只受到「受測者能力」及「題目難度」影響：受測者答對或答錯某一題之機率僅受到「受測者能力」及「題目難度」影響。換句話說，當得知受測者之答題反應，即可估計「受測者能力」及

「題目難度」；(3) 局部獨立 (local independence)：當「受測者能力」固定時，受測者在不同題目上的作答反應間沒有任何關係。換句話說，同一位受測者作答某一題之結果（如答對或答錯）並不影響他作答下一題之表現。

由於羅序模型具有上述三項基本假設，因此若施測題目符合羅序模型假設

（羅序分析之驗證結果顯示：受測者之答題反應符合羅序模型之預期）將具備下列三項優點：(1) 單向度：測驗中所有題目皆評量同一建構（如 WM 之「語音系統」），表示題目之建構效度良好。此優點有助於研究者發展測驗時，作為修改或刪除題目之依據；(2) 個別估計「受測者能力」及「題目難度」：羅序分析結果分別估計每位「受測者能力」及每題「題目難度」，且「受測者能力」與「題目難度」之單位相同［皆以對數勝算比 (logit) 為單位］(Tesio, 2003; Wright & Linacre, 1989)。此優點有助於研究者由高到低排序「受測者能力」及「題目難度」、對照題目之難度分佈是否涵蓋受測者之能力分佈（即題目是否太難、太簡單或適中）、及「題目難度」分佈是否均勻等。這些資訊可作為研究者修改及挑選題目之依據。(3) 個別「受測者能力」之測量誤差（或信度）：由於羅序分析結果可個別估計每位受測者之能力與標準誤 (standard error)，因此可提供每位受測者能力

(28)

之測量誤差。此特性有助於研究者檢視測驗題目（整體或個別）應用於受測者之測量誤差（或信度），作為研究者修改或挑選題目之依據。

多向度羅序模型介紹

多向度羅序模型為羅序模型之延伸 (Briggs & Wilson, 2003; Wang, Chen, &

Cheng, 2004)，羅序模型適用於一組單向度之題目，而多向度羅序模型則適用於多組（不同向度或概念）題目，且各組題目內皆為單向度，各組題目間之建構不同但彼此相關。例如：WM 包含 4 個系統，而各系統有各自獨立之評量題目。因此多系統之WM 評量題目將適合以多向度羅序模型分析之。

使用多向度羅序模型同時驗證多個向度題目之優點為：提升評量之效率且兼具評量之信度 (Briggs & Wilson, 2003; Wang et al., 2004)。多向度羅序模型藉由各向度間之相關，使得受測者於某一向度之表現（如語音系統），可提供其它向度

（如視空間系統、訊息整合系統、及中央執行系統）評量訊息，亦即預測受測者於其它向度之表現。換句話說，當受測者回答某一向度（如語音系統）之題目時，其作答結果除可用以估計受測者於該向度之能力，亦可同時估計受測者其它向度之能力。因多向度羅序模型可利用各向度題目之評量結果，互相估計受測者於各向度之能力，故此模型可兼具多向度評量之效能及信度。

第二節電腦化多階段測驗

電腦化多階段測驗之目的為：僅施測題目難度與受測者能力相近之測驗組，

以減少施測題目數量 (Haley et al., 2004; Hou et al., 2011; Yu et al., 2012)。電腦化多階段測驗之施測流程有二階段（圖四）：(1) 篩檢受測者之能力程度：使用篩檢題 (routing item) 以快速且粗略地評量受測者之能力程度（如能力高或低）；(2) 適性地選用適當難度之測驗組：依據受測者之能力程度高或低，選用對應之高或低難度測驗組，以更精準地評量受測者之能力。

相較於傳統之測驗型態（施測測驗之所有題目），電腦化多階段測驗僅施測部分（約三分之一至一半）之題目，因此施測效率將大幅提升 (Haley et al., 2004;

Hou et al., 2011; Yu et al., 2012)。此外，由於電腦化多階段測驗無須施測對於受測者太難或太容易之題目，故省略這些題目不會影響受測者能力估計之精準度。電

(29)

腦化多階段測驗將兼具評估精準度及效率等優點，因此電腦化多階段測驗將有助於提升評估之效能。

第三節電腦化 WM 測驗結合「多向度羅序模型」與「電腦化多階段測驗」之優勢

結合「多向度羅序模型」與「電腦化多階段測驗」以發展電腦化WM 測驗具三項優勢：(1) 提升施測效能：由於 WM 具多個向度（共 6 個向度，包含視空間系統、語音系統、訊息整合系統及中央執行系統之3 種注意力控制能力：集中性注意力、轉換性注意力及分配性注意力），故若施測所有WM 系統之所有題目，

將耗費大量之施測時間，對於施測者與受測者皆是沉重之負擔。因此藉由「電腦化多階段測驗」將可大幅減少施測題數，以兼具評量之WM 向度完整及施測效能高等優點。(2) 同時估計多 WM 系統之能力：透過「多向度羅序模型」可同時估計個別受測者於各WM 向度之能力程度，且不同 WM 向度間之能力程度具備相同之單位 (logit)，有助於研究者瞭解受測者不同 WM 向度能力之高低。(3) 各 WM 向度題目皆具備單向度之特性且具良好之評量精準度：「多向度羅序模型」

分析可驗證各WM 向度之題目是否符合單向度，及各 WM 系統能力估計之測量誤差。這些數值可作為「電腦化多階段測驗」選擇測驗題目之依據，有助於研究者發展具單向度及精準度之WM 測驗。

(30)

第五章研究目的

為解決目前WM 評量之各項限制，本研究之目的有二：（一）測驗發展：依據Baddeley 之多系統 WM 模式，並結合「多向度羅序模型」及「電腦化多階段測驗」，發展一套內容適用於思覺失調症患者之「電腦化多階段工作記憶測驗組 (Computerized Multistage Testing of Working Memory, COWMEM)。COWMEM 包含一套篩檢題及6 套 WM 向度測驗（視空間系統、語音系統、訊息整合系統及中央執行系統之3 種注意力控制能力：集中性注意力、轉換性注意力及分配性注意力）。篩檢題可初步判斷受測者之能力，以選擇難度與其能力對應之高、低難度測驗組，達到「二階段施測」之目的。6 套 WM 向度測驗分別評量 Baddeley 多系統WM 模式之 6 種 WM 向度，每套 WM 向度測驗包含難及易等二種難度之版本測驗（高難度測驗組及低難度測驗組），以對應篩檢題施測結果選擇適合受測者能力之高/低難度測驗組。

研究目的（二）心理計量特性驗證：驗證COWMEM 應用於思覺失調症患者之羅序信度、收斂效度、同時效度及已知族群效度。

(31)

第六章研究方法

本研究方法分為二階段：COWMEM 發展及心理計量特性驗證。

第一節階段一：發展 COWMEM

研究者藉由五步驟發展COWMEM：（一）題目設計以組成題庫、（二）專家內容效度驗證、（三）電腦施測平台建構、（四）題庫臨床測試、（五）題庫驗證及（六）選題以建構COWMEM。

步驟（一）：題目設計以組成題庫

研究者參考Baddeley 之多系統 WM 模式，於 COWMEM 之 6 題庫中各設計 35~50 題，以期最終版各題庫中保留約 30 題，以挑選各 WM 向度測驗題目。研究者設計題目之具體內容包含：(1) 測驗刺激物、(2) 題目呈現規則、(3) 題目難度分級、(4) 受測者作答的方式、及 (5) 測驗計分規則等。

(1) 測驗刺激物可分為語音（適用於語音系統及訊息整合系統之題目）及圖像（適用於語音系統之外的5 個 WM 向度之題目）等二類。所有測驗刺激物選用原則為無文化、教育程度及語言限制。

(2) 題目呈現規則包含測驗刺激物呈現的順序、時間、及每次出現的數量等。刺激物呈現的順序原則為：刺激物呈現前先出現凝視點，以提醒受測者留意刺激物，避免受測者因未注意到刺激物而影響測驗表現。刺激物呈現的時間原則為：3 個注意力向度測驗之刺激物呈現一段特定時間後自動消失，而其它 3 個 WM 向度測驗之刺激物呈現於畫面上直到受測者做出反應才消失。因注意力測驗常為計時測驗 (Robertson, Ward, Ridgeway, & Nimmo-Smith, 1996)，而 WM 測驗則無作答時間之要求 (Wechsler, 1997)。測驗刺激物呈現的數量原則為：每個畫面中只呈現一個刺激物，以避免受測者分心而影響作答表現。

(3) 題目難度分級之原則為：3 個注意力向度測驗以作答反應時間的長短為主要難度分級依據，其它3 個 WM 向度測驗以記憶目標物的多寡為主要難度分級依據。COWMEM 各向度測驗之難度分級原則同於研究上常用之注意力及 WM 測驗

(32)

(Robertson et al., 1996; Wechsler, 1997)。

(4) 測驗作答方式之原則為：COWMEM 所有測驗使用統一之作答方式，且盡量簡化作答介面，以降低測驗作答表現受到受測者的電腦使用經驗之影響。

(5) 測驗計分之原則為：每題獨立計分，計分方式為二點（如：對或錯等二個計分點）或多點（如：對、部分答對或全錯等三個計分點）計分。此外，測驗計分規則與測驗作答方式二者可能互相影響，故二者須一併考量設計。

步驟（二）：專家內容效度驗證

研究者一對一訪談二位專家［認知神經科學研究者1 位（專家 A）及認知測驗之心理計量研究者1 位（專家 B）］，請專家審核 COWMEM 題庫，以彙整專家意見並修改COWMEM 題目設計。研究者反覆訪談專家與修改題目，直到二位專家皆未再有修改建議，則完成COWMEM 題庫之專家內容效度驗證。

具體之專家訪談問題如下：「題目能否有效地評估該題預計評估之Baddeley 之多系統WM 模式」、「測驗刺激物是否合適（無文化、教育程度及語言限制）」、

「題目呈現規則及時間是否合宜（包括刺激物呈現速度、停留時間、大小、位置及顏色等）」、「測驗作答方式是否易於操作」、「計分方式是否適當」及「思覺失調症患者作答可能遭遇之問題」等。

步驟（三）：電腦施測平台建構

研究者將COWMEM 題目交由二位電腦程式工程師，撰寫成電腦化

COWMEM 題目，並建立電腦化施測平台。一位工程師協助建構集中性、轉換性及分配性等3 個注意力測驗之電腦化施測平台，另一位工程師建構視空間、語音及訊息整合等3 個系統測驗之電腦化施測平台。當工程師完成電腦化施測平台，

研究者即對照題目設計構想及施測平台之內容，若有出入則請工程師修改，直到施測平台內容與題目設計構想完全相同，則完成COWMEM 題目電腦化及施測平台建構。COWMEM 題目之施測平台為單機版之測驗軟體，所需之硬體設備包含：電腦主機、螢幕、鍵盤、及音響設備。

步驟（四）：題庫臨床測試

(33)

表現，作為題庫分析及COWMEM 選題（步驟五）之分析資料。

樣本

研究者於3 所職能治療工作坊及 2 所精神專科醫院慢性病房招募思覺失調症患者進行本研究。樣本之納入條件有5 項：患者須 (1) 經精神科醫師依據 DSM-5 診斷為思覺失調症；(2) 20 歲以上；(3) 於研究期間病情穩定，即第一次施測與最後一次施測時，患者之臨床整體印象嚴重度量表 (Clinical Global Impression- Severity, CGI-S) (Guy, 1976) 分數未改變，且未調整抗精神藥物與藥量；(4) 識字或可以中文溝通並清楚回答問題者；(5) 可配合施測者之指令完成評估者。患者若有任何其它重大疾病（如：失智症、腦傷、智能障礙、重鬱症、物質濫用等）

可能影響其作答者，則予以排除。

程序

符合納入條件之患者於安靜的環境中接受施測者一對一施測，每位患者須完成COWMEM 之 6 個題庫、1 項整體認知功能測驗［蒙特利爾認知評估

(Montreal Cognitive Assessment, MoCA)］、1 項整體精神症狀嚴重度量表 (CGI-S) 及6 項同時效度效標測驗。6 項同時效度效標測驗包含：(1) 數字記憶廣度測驗 (Digit Span Test, DS)、(2) 空間工作記憶測驗 (Spatial Span Test, SS)、(3) 語言學習測驗 (California Verbal Learning Test, Chinese version, CVLT)、及日常注意力測驗 (Test of Everyday Attention, TEA) 之 3 項子測驗：(4) 聽覺電梯樓層計算 (Elevator counting, TEA-EC)、(5) 視覺電梯樓層計算 (Visual elevator, TEA-VE) 及 (6) 電話搜尋雙重作業 (Telephone search dual task, TEA-TS)。

由於測驗內容眾多，受測者須於2~3 週內，共分為 4~5 次評估。每次評估受測者須完成2 個 COWMEM 之題庫測驗［1 個中央執行系統之注意力題庫及 1 個其它WM 系統（視空間系統、語音系統或訊息整合系統）之題庫］及 1~2 項同時效度效標測驗。此外，受測者於第1 次及最後一次測驗皆須完成 CGI-S。每次評估約45 分鐘。本研究共包含 5 位施測者，每位施測者排定各自負責之受測者，

故同一位受測者之所有資料由一位負責之施測者蒐集。

評估工具

MoCA 為整體認知功能量表（附錄二），評估之認知功能包含：專注力與集中力、執行功能、記憶力、語言能力、視覺空間建構、抽象概念以及計算與定位

(34)

等。MoCA 分數範圍為 0~30 分，26 分或以上代表認知功能正常。過去研究發現 MoCA 可敏感地偵測出思覺失調症患者之認知缺損 (Fisekovic, Memic, & Pasalic, 2012; Wu, Dagg, & Molgat, 2014)。本研究使用 MoCA 作為 COWMEM 初步心理計量特性驗證（第二階段）之已知族群效度效標。

CGI-S 為常用於評量精神科患者之整體性精神症狀嚴重程度的量表（附錄三）(Guy, 1976)。CGI-S 僅有 1 題，由評估者訪談患者近一週之精神症狀，並依據嚴重度給予1-7 分（1：正常，沒有生病、2：病況極輕、3：病況輕微、4：病況中等、5：病況明顯、6：病況嚴重、7：病況最為嚴重的一位）。CGI-S 應用於思覺失調症患者之再測信度可接受［組內相關係數 (intraclass correlation

coefficient) = 0.69~0.96］(Pinna et al., 2015)。本研究使用 CGI-S 作為檢視受測者於研究期間症狀是否改變之參考。

DS 包含二種獨立之作業（附錄四）：順序 (digit span forward) 與逆序 (digit span backward)。順序及逆序 DS 作業中，受測者需按照相同順序或相反順序覆誦其聽到的一串數字序列。由於DS 逆序作業除要求受測者記憶外，還須逆序逐一提取記憶之訊息，因此DS 順序作業被視為單純記憶測驗，而逆序作業被視為語音WM 測驗 (Conklin, Curtis, Katsanis, & Iacono, 2000)。DS 應用於思覺失調症患者具可接受之建構效度 (Yao, Chen, Jiang, & Tam, 2007)。本研究使用 DS 逆序作業作為COWMEM「語音系統」之同時效度效標（階段二）。

SS 包含二種獨立之作業（附錄五）：順序 (spatial span forward) 與逆序 (spatial span backward)。順序/逆序 SS 作業中，受測者需按照與施測者相同/相反的順序點擊散亂分佈的積木。SS 逆序作業被視為視空間系統相關之 WM 評量工具 (Luciana, Conklin, Hooper, & Yarger, 2005)。SS 應用於思覺失調症患者具良好之再測信度（統合分析結果顯示組內相關係數 = 0.76）(Georgiades et al., 2017)。

本研究使用SS 逆序作業作為 COWMEM「視空間系統」之同時效度效標（階段二）。

CVLT 評估流程具三個階段（附錄六）：立即回憶、短暫延遲回憶及長期延遲回憶。「立即回憶」階段包含4 個回合，每回合施測者需逐一唸出一份列表上的 9 個名詞（每秒一個字的速度），唸完之後受測者須立即背誦列表上的各名詞。「立即回憶」之分數為：四回合之正確回憶個數加總，分數範圍為0~36 分，分數越

(35)

高表示「立即回憶」越佳。「短暫延遲回憶」及「長期延遲回憶」回合則請受測者分別於「立即回憶」第4 回合結束後 30 秒及 10 分鐘，再次回憶列表上的 9 個名詞。「短暫延遲回憶」及「長期延遲回憶」回合之分數皆為正確回憶個數，分數範圍0~9 分，分數越高表示「短暫延遲回憶」及「長期延遲回憶」越佳。

CVLT 之「長期延遲回憶」分數為常用之訊息整合系統 WM 測驗 (Nobre et al., 2013)，應用於思覺失調症患者之已知族群效度良好 (Vlahou et al., 2013)。本研究使用CVLT「長期延遲回憶」分數作為外在效標，以分析 COWMEM「訊息整合系統分數」之同時效度（階段二）。

TEA-EC 為集中性注意力測驗。TEA-EC 共 7 題，每一題中受測者將聽到一串單音組成的聲音訊號，受測者須默數聲音訊號中單音的個數。TEA-EC 每題答對得1 分，答錯得 0 分，總分之範圍為 0~7 分，分數越高表示受測者之注意力越集中。TEA 應用於思覺失調症患者具良好之已知族群效度，可區辨患者與正常人之集中性注意力 (Kucharska-Pietura, Tylec, Czernikiewicz, & Mortimer, 2012)。本研究使用TEA-EC 分數作為外在效標，以分析 COWMEM「集中性注意力」之同時效度（階段二）。

TEA-VE 為轉換性注意力測驗（附錄七）。TEA-VE 共 10 題，每一題測驗紙上有畫「電梯門」及畫著向上或向下之「箭號」。受測者點數「電梯門」數量時，須依據向上或向下之「箭號」，遞增或遞減其點數之數量。TEA-VE 每題答對得1 分，答錯得 0 分，總分之範圍為 0~10 分，分數越高表示受測者之轉換性注意力越佳。本研究使用TEA-VE 分數作為外在效標，以分析 COWMEM「轉換性注意力」之同時效度（階段二）。

TEA-TS 為分配性注意力測驗（附錄八）。TEA-TS 分為二部分，第一部分為單純搜尋：施測者請受測者從測驗紙上搜尋特定之符號（共20 個），並記錄受測者「單位時間內找出符號之數量（找到之符號數量/完成測驗所需秒數）」。第二部分為雙重作業：受測者除須操作第一部分之測驗外（搜尋特定之符號），須同時操作TEA-EC（默數聲音訊號中單音的數量）。施測者記錄受測者之二項分數：

(1) 平均一秒可找出幾個符號及(2) 默數單音數量的正確率」。TEA-TS 雙重作業主要分數為上述二項分數的比值［即分數 (1) / (2)］，以得到雙重作業之綜合分數，雙重作業之綜合分數越低表示受測者之分配性注意力越佳。本研究使用

(36)

TEA-TS 之綜合分數作為外在效標，以分析 COWMEM「分配性注意力」之同時效度（階段二）。

步驟（五）：題庫驗證

研究者使用單向度羅序分析分別檢驗6 個 WM 向度題庫中，各題目是否符合羅序模型。違反羅序模型假設之題目則予以刪除，並於刪題後重新分析，直到所有題目皆符合羅序模型假設。研究者以ConQuest 軟體分析題目與羅序模型之適配度。題目與羅序模型之適配度指標為：近合適度 (infit mean square, infit MNSQ) 與遠合適度 (outfit MNSQ) (Bond & Fox, 2001; Wright & Mok, 2000)。infit MNSQ 及outfit MNSQ 之範圍介於 0~∞，當 MNSQ 小於 1，表示觀察數值過於吻合模式的預期值，而大於1 則表示觀察數值與模式的預期值有較大的誤差。本研究以 Wright 和 Linacre 所建議之 MNSQ 介於 0.60~1.40 作為判定各題目是否符合羅序模型的合適度標準 (Wright & Linacre, 1994)。若題目之近合適度與遠合適度指標皆落於0.60~1.40 之範圍外，研究者即刪除該題目，並重新進行羅序分析。

步驟（六）：選題以建構COWMEM

研究者先將6 個 WM 向度題庫進行多向度羅序分析，以估計題目難度參數與受測者能力參數，並繪製各WM 向度之「題目難度與受測者能力對應圖」，以瞭解題目難度與受測者能力之對應關係。

接著，研究者依據題目難度與受測者能力高低之對應，於各WM 向度題庫中挑選篩檢題以作為COWMEM 之第一階段能力篩檢的依據，並挑選高、低難度測驗組之題目以作為COWMEM 之第二階段依受測者能力適性施測的測驗題。最終版COWMEM 共 186 題，包含具 6 題篩檢題（6 個 WM 向度各 1 題）及各 WM 向度之2 種不同難度測驗組（高、低難度測驗組），每組測驗組之題數 15 題。每位受測者作答COWMEM 時須完成 6 題篩檢題及各 WM 向度之 1 組高或低難度測驗組，共96 題［（6 題篩檢題）+（6 個 WM 向度）*（1 個難度測驗組）*（15 題）］。

6 個 WM 向度題庫之多向度羅序分析以 ConQuest 軟體執行，使用邊際最大概似法 (marginal maximum likelihood estimation) 進行題目難度之估計，各 WM

(37)

向度題庫之平均題目難度設定為0.00。接著，再以 MATLAB 軟體，使用最大後驗法 (maximum-a-posteriori estimation) 估計受測者於 6 個 WM 向度之個別能力值。完成參數估計後，研究者計算受測者於各WM 向度之能力平均值，並以能力平均值作為將受測者分成2 組（高或低能力組）之依據，以及挑選篩檢題與挑選高/低難度測驗組之依據。

受測者依據能力分成2 組之方法為：若一位受測者於某一 WM 向度之能力值高於該WM 向度所有受測者之能力平均值，則此受測者於該 WM 向度屬於高能力組；反之，若一位受測者於某一WM 向度之能力值等於或低於平均值，則在該 WM 向度屬於低能力組。最終，每位受測者於各個 WM 向度具有個別之能力組別，共計12 種可能之能力分組情形［（6 個 WM 向度）*（2 種能力高、低分組）］。

挑選篩檢題部分，研究者從6 個 WM 向度題庫中，各挑選 1 題題目難度最接近受測者能力平均值之題目作為篩檢題，共挑選6 題組成 COWMEM 之篩檢題。

因6 題篩檢題之題目難度接近其對應 WM 向度之能力平均值，可提供最多有用的訊息以準確估計及區辨能力落在平均值附近之受測者，有利於增加篩檢後之分組正確性。接著，研究者使用篩檢題估計每位受測者於6 個 WM 向度之篩檢後能力值，並依據受測者之篩檢後各WM 向度能力值 > 或 ≤ 各 WM 向度之能力平均值，將受測者分為高能力組與低能力組，以計算篩檢題之正確分類率。若受測者在完成篩檢題後所得的能力分組，與原先所屬組別相同，則視為分類正確。

挑選高/低難度測驗組部分，研究者於 6 個 WM 向度題庫中，各挑選 2 種不同難度之測驗組（高、低難度測驗組），以分別適用於評估高能力組與低能力組之受測者。每種難度測驗組各有15 題，挑選題目之原則有二：(1) 高難度測驗組之題目難度須高於能力平均值；低難度測驗組之題目難度須低於能力平均值。(2) 高/低難度測驗組之題目難度盡量均勻分佈於高/低能力受測者之能力上下界之間。高/低難度測驗組所包含之題目不與篩檢題重複。

研究者結合6 題篩檢題及 6 個 WM 向度各 2 種不同難度之測驗組，完成最終版COWMEM 之編製（圖五）。

發展思覺失調症患者之電腦化多階段工作記憶測驗組

國立臺灣大學醫學院職能治療學系 博士論文

School of Occupational Therapy College of Medicine National Taiwan University

Doctoral Dissertation

發展思覺失調症患者之電腦化多階段工作記憶測驗組 Development of a computerized multistage testing of

working memory in patients with schizophrenia

林恭宏 Gong-Hong Lin

指導教授：謝清麟 教授

Advisor: Ching-Lin Hsieh, Professor

中華民國 107 年 5 月

May, 2018

口試委員會審定書

中文摘要

英文摘要

目 錄

圖目錄

表目錄

第一章 工作記憶 (working memory, WM) 簡介 第一節 記憶力之分類

第二節 WM 之理論

第二章 思覺失調症之 WM 第一節 思覺失調症簡介

第二節 思覺失調症患者之 WM 缺損

第三章 WM 測驗之介紹與評析 第一節 良好 WM 測驗之主要特性

第二節 常用於思覺失調症患者之 WM 測驗

第三節 常用 WM 測驗之缺點

第四章 電腦化 WM 測驗結合「多向度羅序模型