第四章 研究結果
第三節 以文字特徵測試語文難易度特徵之結果
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
37
表 4-2 依文字特徵歸類後與官方試題的各級篇數比較(k 值為 31) 文章篇數
文章難度 官方試題的各級篇數 依文字特徵歸類後的各
級篇數
初級 10 19
中級 19 8
中高級 14 16
第三節 以文字特徵測試語文難易度特徵之結果
這部分的結果是為了實驗是否利用文字特徵歸類就能與語文難易度特徵歸 類後的結果相似,在前面第一章說過,近代的研究當中,為了要提升準確度,因 而抽取了許多影響英文難易度的特徵做為分類的依據;第二章的第二節,第四個 部分(2.2.4)所說的都是近代研究中,包含影響英文文章難易度的因素,本論文將 以往適讀性公式中的因素拿來代表近代研究所提出的部分因素,原因是這些適讀 性公式裡的影響因素都是以往學者研究出來確實有助於將英文文章分類為哪一 個程度適合閱讀的指標,直到最近還是有許多的學校老師或是出版社等需要知道 英文文章適讀程度的人或單位使用適讀性公式來檢驗。因此,本研究利用語文難 易度特徵歸類後的結果來驗證文字特徵歸類結果的準確度如何。
本研究假設語文難易度特徵所歸類後的結果為正確答案,來計算文字特徵歸 類結果的準確度,是在圖 3-1 研究架構圖的右下半部,下方數字 3 的結果比較。
方法是利用語文難易度特徵以及文字特徵分別將 GEPT 官方試題的文章歸類後,
再將文字特徵的歸類結果來測試語文難易度的歸類結果。圖 4-5 是將各 k 值所比 較的結果前 37 筆最好的結果(參考附錄三),所整理出來的圖;水平軸代表的是 序號:使用 kNN 歸類方法時,文字特徵以及語文難易度特徵歸類時所使用的 k 值組合的序號(參考附錄三)。垂直軸代表比例以及 F-measure 值。由圖中可以知 道,當序號 7,文字特徵 k 值為 10、語文難易度特徵 k 值為 10 時,歸類為相同 類別的比例有 0.40;當序號 11,文字特徵 k 值為 21、語文難易度特徵 k 值為 1 時,歸類的準度 F-measure 有 0.54,當序號 12,文字特徵 k 值為 21、語文難易 度特徵 k 值為 2 時,一樣也有 0.54 的結果。圖 4-6 則是以不同的角度看準確度,
以 MicroF 來說,當序號為 8、11、12、14、30 與 37,文字特徵 k 值以及語文難 易度特徵 k 值的搭配分別為(19, 16)、(21, 1)、(21, 2)、(21, 16)、(27, 24)、(34, 16)
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
38
時,為 0.47;當序號 30,文字特徵 k 值為 27、語文難易度特徵 k 值為 24 時,
MacroF 為 0.45。
表 4-3 是以語文難易度特徵所歸類出來的類別為標準答案,文字特徵歸類結 果的準度 F-measure 最好為 0.54 時,將使用文字特徵歸類結果、語文難易度特徵 歸類結果的類別文章數以及官方試題各級篇數做比較。單看語文難易度特徵歸類 後各級篇數相較原先官方的類別篇數,大多集中在中高級裡;以文字特徵歸類後 各級篇數來看,大多集中在初級與中高級裡。
由於在 F-measure 最好的情況時,並不是語文難易度特徵歸類出來最為準確 的情況。因此,找到本章的第一節利用語文難易度歸類時,F-measure 最好結果 的 k 值為 10,在附錄三當中,找到序號 2,語文難易度特徵歸類的 k 值為 10,
文字特徵的歸類 k 值為 3 的時候,最好的 F-measure、MicroF 與 MacroF 分別為 0.51、0.44 與 0.44。表 4-4 是以語文難易度特徵所歸類出來的類別為標準答案,
且為 F-measure 結果為最好,文字特徵歸類結果 F-measure 為 0.51 時,將使用文 字特徵歸類結果、語文難易度特徵歸類結果的類別文章數以及官方試題各級篇數 做比較。單看語文難易度特徵歸類後各級篇數相較原先官方的類別篇數,大多集 中在中高級裡;以文字特徵歸類後各級篇數來看,大多集中在初級裡。
不管是整體搭配結果來看或是這邊以語文難易度特徵歸類最好的結果來看,
準確度介於五成到五成四。雖然僅有五成左右的準確度,但也表示文字特徵歸類 的結果能夠有一半左右的機率預測語文難易度特徵歸類結果,或說是兩個特徵歸 類後結果相似度有五成至五成四。