以關聯詞指標預測文本適讀年級

第四章研究結果與討論

第三節以關聯詞指標預測文本適讀年級

本研究擷取「兒童語料庫」中現行三大版本各領域教科書課文共 787 篇，用來計算指標分數以預測文本適讀年級。首先計算各指標在兒童與料庫中各篇文章的分數，再以皮爾森積差相關來探討文本年級與指標分數之間的相關程度，最後用多元迴歸分析來探討指標分數如何預測文本的適讀年級，並找出一個線性方程式來說明各指標之間與文本年級間的關係。

一、關聯詞指標對「兒童語料庫」教科書文本年級之迴歸預測分析

各指標分數的平均數及標準差如表 4-3-1 所示，平均數由高到低分別為：指標 10 整體關聯詞（23.81）、指標 1 並列關聯詞（9.48）、指標 4 承接關聯詞（4.49）、指標 2 遞進關聯詞（3.10）、指標 5 轉折關聯詞（1.97）、指標 8 條件關聯詞（1.58）、指標 9 目的關聯詞（1.06）、指標 7 因果關聯詞（1.15）、指標 6 假設關聯詞（0.91）、指標 3 選擇關聯詞（0.07）。

表 4-3-1 指標分數與文本年級描述性統計摘要表

指標分類平均數標準差

1 並列關聯詞 9.48 5.70 2 遞進關聯詞 3.10 3.10 3 選擇關聯詞 0.07 0.33 4 承接關聯詞 4.49 4.11 5 轉折關聯詞 1.97 2.55 6 假設關連詞 0.91 1.74 7 因果關聯詞 1.15 1.66 8 條件關連詞 1.58 1.93 9 目的關連詞 1.06 1.73 10 整體關聯詞 23.81 10.14

表 4-3-2 為指標分數與文本年級之間的相關係數摘要表，在十個指標當中，

與文本年級變項呈現正相關的指標有並列、遞進、轉折、假設、因果、條件、目的以及整體關聯詞共八個指標，相關係數在.090~.310 之間，屬於低度相關，但都 達到 p<.05 的顯著水準。承接關聯詞（r＝-.049）呈現的是極低度負相關，相關 係數未達顯著；選擇關聯詞（r＝.018）呈現的是極低度相關，未達顯著水準。綜 合上述結果顯示，若文本中並列、遞進、轉折、假設、因果、條件、目的以及全部這八類關聯詞的指標分數越高，則文本傾向是越高年級的文本，而承接關聯詞以及選擇關聯詞對於文本年級較無相關。

表 4-3-2 指標分數與文本年級之間的相關係數表

指標分類相關係數

1 並列關聯詞 .115**

2 遞進關聯詞 .090*

3 選擇關聯詞 .018 4 承接關聯詞 -.049 5 轉折關聯詞 .260***

6 假設關聯詞 .146***

7 因果關聯詞 .240***

8 條件關聯詞 .169***

9 目的關聯詞 .310***

10 整體關聯詞 .288***

根據表 4-3-3 的研究結果顯示，針對指標變項對於文本年級的預測度進行多元迴歸分析，將十個指標變數用強迫進入法來做多元迴歸分析，結果排除有共線性可能的指標 1 並列關聯詞後，R²值為.216，標準化係數之 β 分配達到顯著的指標有承接、轉折、因果、條件、以及目的關連詞，表示以此十個關聯詞指標來預測文本年級的預測能力可達 21.6%，其迴歸方程式如下：

迴歸方程式

Y＝2.969＋（0.010）×指標 2＋（-0.077）×指標 3＋（-0.035）×指標 4 ＋（0.118）×指標 5＋（0.029）×指標 6＋（ 0.125）×指標 7 ＋（0.065）×指標 8＋（0.228）×指標 9＋（0.016）×指標 10 Y＝文本年級

指標 2＝遞進關聯詞，指標 3＝選擇關聯詞，指標 4＝承接關聯詞指標 5＝轉折關聯詞，指標 6＝假設關連詞，指標 7＝因果關聯詞指標 8＝條件關連詞，指標 9＝目的關連詞，指標 10＝整體關聯詞 表 4-3-3 指標變項預測文本年級模式迴歸分析摘要表

未標準化係數標準化係數

預測變數 B 標準誤 β R²

(常數) 2.969 0.129

遞進關聯詞 2 0.010 0.020 0.020 選擇關聯詞 3 -0.077 0.152 -0.017 承接關聯詞 4 -0.035 0.014 -0.094*

轉折關聯詞 5 0.118 0.022 0.195***

假設關連詞 6 0.029 0.032 0.033 因果關聯詞 7 0.125 0.032 0.134***

條件關連詞 8 0.065 0.029 0.081*

目的關連詞 9 0.228 0.031 0.254***

整體關聯詞 10 0.016 0.009 0.104

0.216***

＊p＜.05 ＊＊p＜.01 ＊＊＊p＜.001

接下來再將十個指標變項用多元逐步迴歸分析的方式篩選出最具預測力的模式，其結果如表 4-3-4 所示，具預測力的變項為指標 9 目的關連詞、指標 5 轉折關聯詞、指標 7 因果關聯詞、指標 8 條件關連詞以及指標 1 並列關聯詞，此時整體解釋量達 20.9％，且選入之五個指標準化係數之 β 分配皆達到顯著，此模式與上述十個指標變項多元迴歸時的整體解釋量 21.6％，僅僅相差 0.7％，因此逐步迴歸最佳模式所選入的五個指標變數即可用來解釋文本年級預測的結果，逐步迴歸的最佳模式所得之迴歸方程式如下：

Y＝2.932＋（0.248）×指標 9＋（0.138）×指標 5＋（0.141）×指標 7 ＋（0.091）×指標 8＋（0.020）×指標 1

Y＝文本年級

指標 9＝目的關連詞，指標 5＝轉折關聯詞，指標 7＝因果關聯詞指標 8＝條件關連詞，指標 1＝並列關聯詞

表 4-3-4 指標變項預測文本年級模式逐步迴歸分析摘要表 未標準化係數標準化係數

預測變數 B 標準誤 β R² R²改變量 (常數) 2.932 0.111 0.277***

目的關連詞 9 0.248 0.029 0.228*** 0.096 0.096*

轉折關聯詞 5 0.138 0.020 0.151*** 0.165 0.069***

因果關聯詞 7 0.141 0.030 0.113*** 0.190 0.025***

條件關連詞 8 0.091 0.026 0.072*** 0.204 0.014***

並列關聯詞 1 0.020 0.009 0.277* 0.209 0.005***

＊p＜.05 ＊＊p＜.01 ＊＊＊p＜.001

以國編本四年級「文本 T」為例，表 4-3-4 為文本 T 各指標分數及迴歸及逐步迴歸方程式預測文本年級數值表。

表 4-3-5 「文本 T」各指標分數及預測文本年級數值表

迴歸預測逐步迴歸預測指標類別指標分數

文本年級文本年級

2 遞進關聯詞 6.09 3 選擇關聯詞 1.22 4 承接關聯詞 2.44 5 轉折關聯詞 2.44 6 假設關聯詞 2.44 7 因果關聯詞 1.22 8 條件關聯詞 1.22 9 目的關聯詞 2.44

10 整體關聯詞 25.58

二、與其他文本分析系統比較

（一）與 CRIE 系統比較

CRIE 系統內之連接詞指標分成正向連接詞、負向連接詞以及連接詞三類（宋曜廷等，2013），此分類方法套用 Louwerse(2001)英文連接詞之分類，其使用語料工具為 H、K、N 版國語教科書 386 篇文本，相關文獻中未詳列各類連接詞，故無法以本系統提取相關連接詞計算其連接詞之分數以比較預測文本年級之效果。

（二）與胡夢珂（2012）的研究比較

胡夢珂（2012）的研究目的在開發中文可讀性分析系統，其連接詞指標分類為參考 Coh-Metrix2.0 之連接詞分類，與 CRIE 系統同樣分成正向連接詞、負向連接詞以及連接詞三類，並事先定義各連接詞類別，但於研究中未提及其定義依據。在此以本研究相同方式重新計算其連接詞之分數，以求比較的一致性基準，

再以此三類連接詞指標對「兒童語料庫」教科書文本年級進行多元迴歸分析，其結果如表 4-3-6 所示，文本年級的預測力為 13.9%。而本研究以逐步迴歸分析結果顯示，使用三類指標模式之預測力可達 19％，五類指標模式之預測力可達 20.4

％（如表 4-3-4 所示），由此顯示本研究關聯詞指標之文本年級預測效果較佳。

表 4-3-6 胡夢珂（2012）連接詞指項預測文本年級迴歸分析摘要表

未標準化係數標準化係數

預測變數 B 標準誤 β R²

(常數) 3.176 0.113

負向連接詞 0.181 0.022 0.297

0.139***

連接詞數 0.025 0.007 0.134

茲就關聯詞指標分類依據、語料庫、指標數、以及對文本年級之預測力，將 CRIE 系統連接詞指標、胡夢珂（2012）與本研究欲建置之中文 Coh-Metrix 兒童文本關聯詞指標分析系統做一比較，結果如表 4-3-7。

表 4-3-7 CRIE 系統、胡夢珂（2012）研究與中文 Coh-Metrix 系統比較表 CRIE 系統胡夢珂（2012）中文 Coh-Metrix 系統關聯詞指

標分類依據

套用英文語法分類

套用

Coh-Metrix2.0 英文語法分類

以中文語法分類

語料工具 H、K、N 版國語教科書 386 篇

H、K、N 版國語教科書 386 篇

廖晨惠國科會計畫建置之兒童語料庫各領域教科書 787 篇

指標數 3 3 10

3 個指標 5 個指標 10 個指標文本年級

預測力欠缺相關資料 13.9％

19 ％ 20.4 ％ 21.6％

在文檔中兒童文本關聯詞指標分析系統建置與應用 (頁 59-65)

第四章 研究結果與討論

第三節 以關聯詞指標預測文本適讀年級

第四章研究結果與討論

第三節以關聯詞指標預測文本適讀年級