第五章 研究四、建立適讀性的診斷系統
第二節 系統功能
本系統主要提供四項功能:預測文本適讀年級、分析文本屬性、提供屬性 與文本診斷,以及提供相似的文章。此四項功能皆可從系統的主要介面(圖
5.2)點選使用。本系統介面分為三大部份:左側和右側為訊息呈現視窗,分別
顯示文本適讀年級、和簡略的文本屬性診斷性提示。主要訊息則呈現在中央主 視窗。該視窗有4 項用途:(1)使用者輸入待分析的文本、(2)呈現文本的屬性與相對應的常模、(3)呈現屬性與文本的診斷訊息,與(4)提供相似文章。
當使用者輸入文本並按下分析之後,文本的適讀年級預測會自動出現在左 側視窗。所有與文本的相關訊息(屬性與診斷訊息等)亦會自動更新,文本屬 性及其對應的常模也會出現在中央主視窗的「文本屬性」視窗(圖5.3)。文本 屬性視窗共列出17 項文本屬性,分別是字數、詞數、字筆畫數、字頻的第 25 百分位數、詞頻的第25 百分位數、詞彙長度中數、子句長、句長、內容詞功能 詞比、詞義數的第三四分位數、內容詞的脈絡重複指標、語義脈絡重複指標、
句法數最大深度、罕見語式頻率、名詞修飾詞數、主要動詞前詞數、詞彙豐富 度。其中,字數、詞數兩個屬性僅是在系統中呈現予使用者參考的文本屬性,
該屬性未用在預測適讀年級的模式中。
為方便使用者判斷是哪些文本屬性影響了文本的適讀性,本系統在中央主 視窗中設計了「診斷」功能。點選診斷功能後,系統會首先呈現「難字診斷」, 亦即在「文本屬性模式」所預測的適讀年級下,有哪些字屬於較難的字。此系 統判斷難字的標準,是該字的字頻低於該年級字頻常模的第10 百分位數。這些
「難字」在診斷系統中將以紅點標示於文本上(圖5.4)。類似地,使用者可點 選右側視窗的「詞彙常用度」進入「難詞診斷」,難詞診斷會以橘色字體標示文 本中的「難詞」。難詞的判斷標準為一個詞的詞頻低於該年級詞頻常模的第10 百分位數(圖5.5)。在句子層次亦有同樣的診斷訊息,例如點選「名詞修飾詞 數」,則進入「難句診斷」,畫面會以橘色底線標示哪些句子含有有較多名詞修 飾詞。其判斷方式是以該句子的長度大於該年級常模的第90 百分位數(圖 5.6)。此診斷系統亦可幫助使用者編輯文本,以改變文本的難度。詳細例子請 見本章第三節。
針對輸入的文本,中央主視窗的「相似文章」功能會在社會科的課文中,
篩選和輸入文本主題相似的課文。此相似文章的建議來源,是用主題模式估計 一篇文本的主題分配,並在社會課文中尋找與之最相近的課文當作相似文章。
例如,當使用者輸入一篇有關鄭成功的文本時,「相似文章」功能會找出在社會 課文裡,與之相關的文章。這個分析的結果呈現於圖5.7。
圖
5.2:診斷式適讀性系統主要介面
註:畫面中關於鄭成功的展示用短文擷取自維基百科「鄭成功」條目(維基百 科編輯者,2018)。
圖
5.3:文本屬性畫面
圖
5.4:文本難字診斷
圖
5.5:文本難詞診斷
圖
5.6:文本難句診斷
圖