第三章 研究方法
第五節 資料處理與分析
本節分為異讀資料和眼動異讀資料兩部分,分述如下。
一、異讀分析
本研究採用異讀分析中的深度程序,分為記錄異讀的種類以及為了能解析讀 者在閱讀歷程中所使用的語言系統和閱讀策略所需回答的六個問題。研究者並列 舉H 讀者的實際深度程序分析表,詳見附錄十。
(一)異讀種類:
包含替代、刪去(包含未修正的部分嘗試)、插入、顛倒、修正、發音錯誤、
重複和停頓等的標記方式參考 Y. Goodman 等人(2005)之建議,詳細內容見附錄 十一。雖然 Y. Goodman 等人(2005)在深度程序中將顛倒納入替代中,但研究者
認為「替代」類型在過去異讀研究中出現的比例最高,若再加入「顛倒」類型會 把替代的內涵變得過於龐雜而不單純,因此決定將替代和顛倒類型分別探討,甚 至更將替代進一步區分為「實字替代」和「非字替代」兩類分別探討,以便能更 清楚說明兩類在字詞和句子層面對文章理解造成的影響。另一方面,研究者在異 讀分析程序開始時曾請教洪月女教授意見(私人溝通,9 月 8 日,2009),並從 相關異讀研究中發現,台灣學生常會出現省略英語中動詞的變化形態,實屬 Y.
Goodman 等人(2005)曾提及方言變異(dialect variation)中的語法方言變異(he doesn’t 唸成 he don’t),為了讓未來研究者能了解該異讀類型的含意,研究者將 此類異讀定名為「語言遷移(language transfer)」,亦即將母語中的語用習慣帶入第 二語言的學習所造成的錯誤(戴煒華、戴煒棟,2000)。
(二)深度程序的六個問題
1. 問題一為「語法可接受性」(syntactic acceptability),研判異讀產生後,該句子 結構是否在語法上還是可被接受的,可分成語法可接受(Yes, Y)、語法部分接受 (Partial, P)和語法不接受(No, N)三種。若該異讀在當句中被視為語法可接受,但 對於整體文章來說語法並不適切時,則被標記為部分接受(P)的句子。
2. 問題二為「語意可接受性」(semantic acceptability),研判異讀產生後,該句子 結構是否在語意上還是可被接受的,可分成語意可接受(Yes, Y)、語意部分接受 (Partial, P)和語意不接受(No, N)三種。若該異讀在當句中被視為語意可接受,但 卻無法在整體文章脈絡上產生適切的語意時,會被標記為語意部分接受(P)的句 子。須特別注意的是,問題二(語意可接受性)的標記單位不能高於問題一(語 法可接受性),亦即只會有「YY」(第一個 Y 為語法可接受,第二個 Y 為語意可 接受)、「YP」、「YN」、「PP」、「PN」、「NN」六種可能類型。
3. 問題三為「意義改變」(meaning change),研判異讀產生的句子與原來的含意
相比後,其意義程度的改變,可分為無改變(No, N)、部分改變(Partial, P)和有改 變(Yes, Y)三種。當異讀句子和原本文意比較後在次要概念、特徵、事件、事實 產生些微改變時,便被標記為部分改變(P);當兩者在主要概念、特徵、事件、
事實產生極大的不一致時,則被標記為有改變(Y)。值得注意的是,唯有當問題 一(語法可接受性)和問題二(語意可接受性)的標記皆為 Y 時,才需探討問 題三的比較。根據上述規定,可能出現表3-2 不同的答案類型。
表3-2 問題一至問題三的可能類型
問題一:語法可接受性 問題二:語意可接受性 問題三:意義改變
Y Y N Y Y P Y Y Y Y P - Y N - P P - P N - N N -
*「-」表示無法探討
說明:由於第一至第三個問題間有階層性的關係,語言透過語法建構出骨架,並進一步創造意義。
因此討論順序一定是由第一個問題到第二個問題,最後才評估第三個問題。研究者計算問題中Y
和N 的個數並求其百分比,便可得到語法、語意被接受性的比例以及讀者理解的程度。
4. 問題四為「修正」(correction),記錄讀者對異讀字是否加以修正,可分為有修 正(Yes, Y)、部分修正(Partial, P)和未修正(No, N)三種類型。讀者對異讀字的修正 不成功或者是原本唸得正確但隨即將該字修正錯誤,都將被標記為部分修正(P)。
5. 問題五為「形似」(graphic similarity),研判異讀字和原字看起來的相似度多高。
可分成高形似(High, H)、部分形似(Some, S)和無形似(No, N)三種,將該單字分成
三個部分(前、中、後),若當中有兩個以上的部分看起來相似,則可稱為高形 似(H);若當中只有一個部分看起來相似,則稱為部分形似(S);若當中完全沒有 一個部分看起來相似,便稱為無形似(N)。值得注意的是,若當異讀字和原字無 法被分成三部分時,評判的標準將以出現相同的字母、字長、字形態為依據,分 為高相似(High, H)和部分相似(Some, S)兩種類型。前者代表異讀字包含在原字 中,或原字包含在異讀字中,然而字母所在的位置並不一定完全相同;後者則是 異讀字和原字間有一個或些許的字母相同,但可能字母出現的位置並不一定完全 相同,或者是異讀字和原字間有類似的字長和字形態。
6. 問題六為「音似」(sound similarity),研判異讀字和文章中的字聽起來的相似 度有多高。可分成高音似(High, H)、部分音似(Some, S)和無音似(No, N)三種,將 該單字分成三個部分(前、中、後),若當中有兩個以上的部分聽起來相似,則 可稱為高音似(H);若當中只有一個部分聽起來相似,則稱為部分音似(S);若當 中完全沒有一個部分聽起來相似,便稱為無音似(N)。值得注意的是,若當異讀 字和原字無法被切割成三部分時,評判的標準將以聽起來相同音素(phoneme)的 位置和唸起來音節長度相似為依據,有高相似(High, H)一種類型,表示異讀字聽 起來有50%與原字符合,或原字聽起來有 50%與異讀字符合。
關於問題五(形似)和問題六(音似),Brown、K. Goodman 和 Marek (1996) 從很多異讀分析的研究發現,形似的分數通常都高於音似的分數,這樣的現象顯 示出字的外型上所能提供給讀者的資訊比語音上的資訊來得重要(引自 Y.
Goodman et al, 2005)。除此之外,刪去、插入、重複異讀、音調改變、複雜異讀 以及標點符號皆不在形似和音似的評估範圍內。
而綜合問題二(語意可接受性)、問題三(意義改變)和問題四(修正)的 研判資料可得出一個「意義建構」(meaning construction)的分數,表示該異讀對
於讀者建構文本意義的影響性,可區分出意義正確(No loss, N)、意義部分正確 (Partial loss, P)或是意義不正確(Loss, L)三種。意義正確(N)意味著雖然有異讀,
但是異讀屬於高品質的類型,讀者所關心的是建構通篇文章的意義;意義部分正 (Partial Loss)
意義不正確 (Partial strength, P)、過度修正(Overcorrection, O)和弱(Weakness, W)四類。
文法關聯強者(S)表示讀者能將閱讀策略綜合使用;稍強者(P)代表讀者懂得 使用單一種語言線索,但卻無法總是成功地將這些策略融合使用以幫助意義建
構;過度修正者(O)表示讀者太過注重字的表面線索,而忽略了解文章意義本質 (Partial Strength)
文法關聯性
者。第2 評分者經訓練後,熟悉異讀分析技術。隨機從 13 位讀者中抽取三分之 一(4 位讀者)的閱讀資料進行評分者一致度的檢核,結果發現 2 位評分者深度 程序分析表的所有項目一致度為80 至 100%(語法可接受性:80%、語意可接受 性:84%、意義改變:100%、修正:100%、形似:96%、音似:98%、意義建 構:84%、文法關聯性:84%、異讀類型:97%),說明本研究深度程序的異讀分 析資料具有評分者間的穩定度,該資料適合進行後續相關分析。
二、眼動異讀資料分析
(一)眼動異讀資料管理系統
由於眼動資料量相當龐大,本研究建立了一套資訊管理系統以利於分析,將 字彙特性、異讀資料及眼動資料輸入,並按照本研究問題需求輸出各項表格。
圖3-2 眼動異讀資料管理系統流程圖
管理系統為EASYPHP 2.01 版,內含網頁伺服器軟體 APACHE 2.2.3,網頁 程式語言PHP 5.2.0,以及資料庫 MYSQL 5.0.27,其資料處理流程見圖 3-2。為 了避免程式撰寫的錯誤導致資料輸入或輸出的錯誤,在完成資料管理系統後,針 對每個輸入的資料建立人工檢核點,亦即將資料輸入後的訊息與人工抽樣的訊息
字彙特性
異讀資料 Excel 格式 資料庫 資料輸出
眼動資料
進行比對,以確保資料輸入與輸出之正確性。
眼動儀可輸出的原始資料相當的多,針對本研究的研究目的,讀取5 個原始 資料欄位訊息。5 個欄位名稱為時間戳記(Timestamp)、凝視時間(Fixation Duration Lenght)、興趣區編號(AOI Id),興趣區名稱(AOI Name),刺激物名稱(Stimuli Name),資料輸出範例如表 3-5 所示。
表3-5 眼動儀擷取資料輸出格式
時間戳記 凝視時間 興趣區編號 興趣區名稱 刺激物名稱
91345 824 427 d4 InstructOIn Element 91345 824 458 AOI21 InstructOIn Element 92302 241 328 d1 InstructOIn Element 92302 241 432 T1 InstructOIn Element 92552 3714 328 d1 InstructOIn Element 92552 3714 433 T2 InstructOIn Element 資料來源:本研究
將這5 個欄位的訊息組合後,產生 8 個本研究使用的眼動指標。包括凝視率、
首次凝視時間、首次連續凝視時間、首次連續凝視次數、重新閱讀總凝視時間、
回視率、全部凝視時間和全部凝視次數,之後利用此8 個指標與受測者錄音編碼 的資料進行比對分析,進行相關研究。
(二)眼動指標數據
比對不同類型的異讀(實字替代、非字替代、刪去、插入、顛倒)是否會與 凝視率、首次凝視時間、首次連續凝視時間、首次連續凝視次數、重新閱讀總凝 視時間、回視率、全部凝視時間和全部凝視次數之間產生關聯性。作者根據過去 相關研究(Chaffin et al., 2001; Juhasz & Rayner, 2003; William & Morris, 2004)將眼 動指標分為「初始處理」和「重新分析」兩階段,並參考Radach 和 Kennedy (2004)、
Rayner (2009)研究中指標定義來作為本研究眼動指標定義,說明如下。
1. 初始處理階段:
凝視率(Fixation Rate, FR):在所有單字中,有被凝視的單字所佔之比率。
首次凝視時間(First Fixation Duration, FFD):第一個凝視點落入某一單字的 凝視時間。
首次連續凝視時間(First Gaze Duration, FGD):凝視點落入單字到離開該單 字之前的所有凝視時間總和,不包含當中掃視之時間。
首次連續凝視次數(First Gaze Fixation Count, FGFC):凝視點落入某單字到離 開該單字之前的所有凝視次數總和。
2. 重新分析階段:
重新閱讀總凝視時間(Rereading Time, RT):離開某單字後,再重新回到該單 字的凝視時間之總和,不包含當中掃視之時間。
回視率(Regression Rate, RR):離開某單字後,又重新回視該單字的次數佔全 部凝視次數的比率。
全部凝視時間(Total Fixation Duration, TFD):凝視在某單字的所有凝視時間 總和,不包含當中掃視之時間。
全部凝視次數(Total Fixation Count, TFC):凝視在某單字上的所有凝視次數 總和。