評估方法

第三章研究方法

第三節評估方法

本研究之系統評估分為兩個階段：專家評鑑與目標使用者可用性測試。兩個階段的評估方式皆是以「執行任務→操作系統→填寫問卷→半結構訪談」的程序進行。

研究者根據本次開發之新功能「個人筆記」、「教學教案」、「教師檢定」規劃不同任務，任務內容涵蓋使用者操作三項功能時將會遇到的步驟，操作任務時間約 25 分鐘，主要測試為行動版本，唯考量教學教案項目需輸入較多文字，故此項功能評估請受試者以網頁版 ASSIST 完成資料輸入，再以同步功能將資料傳輸至手機之行動版。另外教師檢定練習考題的題數較多，則請使用者點選同一選項，快速完成題目作答。為讓受試者能順利進行測試，研究者另有製作系統操作手冊，提供受試者瀏覽（請見附錄十四）。任務開始後，請受試者在執行任務過程中利用放聲思考法，

將當下的操作行為搭配口述，研究者同時觀察測試，並以檢核表記錄（請見附錄五和附錄九）。以此種「實際動作+口述動作」的方式，可讓研究者觀察到使用者在測試過程中哪個環節有操作困擾。以下詳細說明兩個評估階段的進行方式。

一、專家評鑑

第一階段邀請三位各自擁有行動學習、人機互動或者系統開發經驗之教授進行評鑑（請見表 3-3-1），施測地點在三位專家辦公室，所需時間約為一小時。首先向專家簡介 ASSIST 系統主要功能與基本操作方式，再由研究者示範放聲思考法。

完成上述兩步驟後，敦請專家開始評鑑系統。研究者將專家操作系統的過程錄影，

作為後續資料分析之用，同時研究者以檢核紀錄表記錄專家操作過程。當測試結束後，立即請專家填寫使用者互動滿意度（Questionnaire for User Interface Satisfaction, QUIS）問卷，待填寫完畢後再開始訪談。QUIS 問卷是由美國馬里蘭大學（University of Maryland）的「人─電腦互動實驗室（Human-Computer Interaction Lab，HCIL）」設計，為專門評估使用者介面的互動滿意度量表（ Preece, Rogers, & Sharp, 2002/2009），題項包含對系統的整體反應、畫面、用詞和系統訊息、學習、系統功

Usability Scale, SUS）和 QUIS 兩問卷編輯而成，SUS 問卷由Brooke（1986）所設計，為評估產品易用性之量表，包括使用者操作本系統頻率、使用狀況等題項，而 QUIS 問卷則擷取部分與目標使用者較相關之題目。兩量表原分別為 Likert 五點和七點式量表，為避免受試者填寫量表中間值而統一改為六點式量表（請見附錄十）。訪談採半結構式方式進行，事先設定的題目數為六題，再依使用者測試的實際情況進行調整（請見附錄十一）。最後同樣將所有受訪者的問卷、訪談和操作影片資料進行統合與歸納，彙整出 ASSIST 新版系統之使用者測試結果與系統修改建議。

表 3-3-2 目標使用者資料

受訪者性別實習學校任教科目行動載具系統載具使用經驗 1 男國中物理科 Android 1-2 年 2 男高中數學科 iOS 3-4 年 3 女高中資訊概論科 Android 未滿 1 年 4 女高中歷史科 Android 未滿 1 年 5 女高中英文科 Android 未滿 1 年 6 女高中國文科 Android 未滿 1 年 7 女高中公民科 Android 1-2 年 8 女高中數學科 Android 1-2 年 9 男高中國文科 Android 5 年以上 10 女高中美術科 Android 1-2 年 11 女高中體育科 Android 未滿 1 年

12 男高中英文科無無

三、資料分析方式

本研究蒐集資料的方式分為問卷、訪談、放聲思考影片、研究者觀察筆記等四項，其中以問卷及訪談內容為主要的資料分析目標，再輔以研究者觀察筆記和放聲思考內容作資料的補充與檢證。問卷的量表部分，是以 SPSS 統計軟體分析問卷填答狀況；問卷的開放式問題部分則與訪談內容採用質性編碼方式分析。

質性資料主要是利用歸納與比較方式進行（Merriam, 2009/2011），經過層層不

斷的重組與再演繹，萃取出當中的理論與核心價值。此外，經常為質性研究者採用的資料收集與分析方法的紮根理論，亦為本研究者分析質性資料的依據。紮根理論將編碼方式分為三個階段：開放編碼（open coding），仔細閱讀與思考文本，從眾多資料中辨識初步的類別；主軸編碼（axial coding），將類別重新調整、修正與歸類，試圖找出相互連結的關係；選擇編碼（selective coding），自所有類別裡，辨別出能涵蓋其他類別的一個核心類別，形成主要的敘事中心概念（Gibbs, 2007/2010）。

研究者將訪談內容編纂成逐字稿，重新檢視並在字句和段落間標記出與研究主題相關之敘述句或段落，依序將其加註編號，再來將性質類似的編碼重新分類與組合，歸類具有關聯性的主要類別，以完成編碼工作。編碼的方式為「受訪者-類型-流水號」，對象部分，專家以 expert 的字首 E 為代表，目標使用者則以實習教師 student teacher 的字首 S 為代表；類型分為問卷（questionnaire）、訪談（interview），取英文首兩個字母 qu 、in 為代表；流水號則是該類型編碼內容的次序。例如第一位專家在訪談時說的第三個修改重點，編碼為 E01-in-03，其他專家評鑑以及目標使用者可用性測試編碼方式以此類推。

為避免研究者個人偏見或其他因素影響研究結果的真實性，同時增進研究過程與結果之可信度，研究者採用常見的「三角驗證（triangulation）」與「同儕檢核

／審查（peer examination）」兩種策略。「三角驗證」企圖透過多方資料來源，交叉比較異同處，尋求多數相符以表示事件的真實性（Merriam, 2009/2011）。研究者為確保所蒐集的資料之可信度，規劃四項資料來源，包括紙本問卷、訪談錄音，使用者測試時的放聲思考影片、研究者觀察筆記等，主要以受訪者的問卷和訪談為主，

影片和筆記作為補充與驗證之用，希以蒐集多方資料交叉比對以增加研究的客觀性。「同儕檢核／審查」為請熟悉研究法與論文題目的同儕審查編碼，提出認同或質疑之回饋，藉此調整編碼與資料分類走向（Merriam, 2009/2011）。本研究針對質性資料展開分析工作前，邀請曾修習質性研究課程的國立大學教育所碩士生共同參與編碼，檢視與核對編碼表中的編碼是否與所設定的概念相符，為資料進行多次驗證與確認。在專家評鑑部分，研究者與共同編碼者分別檢視三份訪談內容並各自

編碼，再將兩份編碼表整合，合併概念相同的編碼，並針對兩份編碼表相異處進行討論。目標使用者可用性測試部分，考量到受試者人數較多，若沿用前一種做法，

可能會影響分析結果的時間。因此本階段調整驗證方式，由研究者先根據 12 份訪談內容進行編碼，初步完成目標使用者編碼表後，再交給共同編碼者以逐字稿對照編碼的方式檢驗，針對有疑義的編碼提出討論，最後須由研究者與共同編碼者雙方皆同意，始完成編碼工作。

在文檔中支援實習教師的行動系統之介面設計與評鑑 (頁 64-69)

第三章 研究方法

第三節 評估方法

一、 專家評鑑

三、 資料分析方式

第三章研究方法

第三節評估方法

一、專家評鑑

三、資料分析方式