• 沒有找到結果。

兒童語料庫趨勢分析

第四章 研究結果與討論

第一節 兒童語料庫趨勢分析

本研究詞頻與詞彙指標分析,係根據兒童語料庫一至六年級國語科電子文本,

利用臺中教育大學教育測驗統計研究所發展之兒童文本分析系統,就文章內容分析 其「所有詞詞頻」、「實詞詞頻」、「每句詞頻最小值」及「平均詞彙數」四項,將各 年級指標分析結果歸納整理,並與 Coh-Metrix 3.0 版之數值結果做趨勢比較分析。

其中 Coh-Metrix 3.0 版中所採用數據資料,乃採 Coh-Metrix 所建置之指標,文章來 源選自 TASA ( Touchstone Applied Science Associates ) 語料庫中的 37651 篇文章,

含九種不同文體,可區分為語文藝術、社會研究與科學文本三大類。語料庫文章的 級別依 DRP ( Degrees of Reading Power ) 分成 13 個級別,簡化成六個等級,

Coh-Metrix 3.0 版從三大類 13 個級別文章中隨機取樣各 100 篇,每類共 300 篇做為 樣本(McNamara,Graesser,McCarthy, & Zhiqiang Cai, 2013)。

壹、 所有詞詞頻

從表 4-1-1、圖 4-1-1 和圖 4-1-2 中,可發現依據兒童語料庫所分析之「所有詞 詞頻」,會隨著年級的遞增,所有詞的詞頻會呈現往上的趨勢,且一至二年級的所有 詞詞頻變化幅度較大,二至六年級的變化並不是很明顯;此與 TASA 語料庫中 K1~13 級別中,隨著年級往上,所有詞詞頻會往下的整體趨勢相異。一年級所有詞詞頻偏 低的原因,推估可能其課文內容篇幅過短且疊字詞居多,中英語法、結構等文章特

徵不同,且中文的實詞和虛詞占所有詞彙的比重不同,也可能致使所有詞詞頻產生 不一樣的結果。

表4-1-1 所有詞詞頻趨勢分析表

有 詞 詞 頻

兒童 語料庫

年級 一年級 二年級 三年級 四年級 五年級 六年級 平均值 7.83 8.47 8.56 8.59 8.57 8.57 TASA

語料庫

年級 K-1 2-3 4-5 6-8 9-10 11-CCR 平均值 3.14 3.09 3.09 3.06 3.05 2.99

資料來源:McNamara,Graesser,McCarthy & Zhiqiang Cai(2013)

圖4-1-1 兒童語料庫所有詞詞頻趨勢

圖4-1-2 TASA語料庫所有詞詞頻趨勢

貳、 實詞詞頻

從表 4-1-2、圖 4-1-3 和圖 4-1-4 中,可發現依據兒童語料庫所分析之「實詞詞 頻」,除一年級外,二至六年級的實詞詞頻大致呈下降走勢,但在四、五、六年級間 差異不大,結果顯示隨著年級愈高,實詞出現的頻率愈低,一年級實詞詞頻偏低的 原因,推估可能其課文內容大部分偏向兒歌的形式,篇幅短且重疊詞彙居多,故產 生與整體趨勢不同的結果;而在 TASA 語料庫中,整體趨勢是隨著級別愈高,實詞 詞頻出現的頻率越小。此發現中文實詞詞頻的分布與 TASA 語料庫的走向大體上趨 於一致。

表4-1-2 實詞詞頻趨勢分析表

詞 詞 頻

兒童 語料庫

年級 一年級 二年級 三年級 四年級 五年級 六年級 平均值 7.07 7.42 7.31 7.13 7.15 7.14 TASA

語料庫

年級 K-1 2-3 4-5 6-8 9-10 11-CCR 平均值 2.52 2.40 2.34 2.24 2.21 2.11

資料來源:McNamara,Graesser,McCarthy & Zhiqiang Cai(2013)

圖4-1-3 兒童語料庫實詞詞頻趨勢

圖4-1-4 TASA語料庫實詞詞頻趨勢

參、 每句詞頻最小值

從表 4-1-3、圖 4-1-5 和圖 4-1-6 中,可發現依據兒童語料庫所分析之「每句詞 頻最小值」,除一年級外,可發現二至六年級會隨著年級增加,每句詞頻的最小值出 現下降的狀況,此也說明隨著年級愈高,出現的頻率愈小,詞彙相對會愈難,此結

果與 TASA 語料庫中的趨勢大體上具一致性,而國小一年級的每句詞頻最小值與整 體趨勢不一致的原因,推論應該與一年級內容以兒歌居多,且文章篇幅較其他年級 來得簡短,詞彙也以重疊詞為主,故產生與其他年級不一樣的趨勢。

表4-1-3 每句詞頻最小值趨勢分析表

句 詞 頻 最 小 值

兒童 語料庫

年級 一年級 二年級 三年級 四年級 五年級 六年級 平均值 4.11 4.44 4.15 3.74 3.65 3.53

TASA 語料庫

年級 K-1 2-3 4-5 6-8 9-10 11-CCR 平均值 1.711 1.536 1.415 1.13 1.076 0.93

資料來源:McNamara,Graesser,McCarthy & Zhiqiang Cai(2013)

圖4-1-5 兒童語料庫每句詞頻最小值趨勢

圖4-1-6 TASA語料庫每句詞頻最小值趨勢

肆、 平均詞彙數

從表 4-1-4、圖 4-1-7 和圖 4-1-8 中,可發現不論是中文抑或 TASA 語料庫中之

「平均詞彙數」,皆可看出隨著年級遞增,平均詞彙數會也會往上升的情形,這與 Otto(2006)、蔡宜芳(2009)及佘永吉(2006)的研究結果一致,證明兒童所掌 握到的詞彙數量及種類會隨著年齡的遞增而有增加的情形。

表4-1-4 平均詞彙數趨勢分析表

均 詞 彙 數

兒童 語料庫

年級 一年級 二年級 三年級 四年級 五年級 六年級 平均值 4.43 5.64 6 6.29 6.23 7.23 TASA

語料庫

年級 K-1 2-3 4-5 6-8 9-10 11-CCR 平均值 8.601 11.375 14.522 19.937 23.002 24.764

資料來源:McNamara,Graesser,McCarthy & Zhiqiang Cai(2013)

圖4-1-7 兒童語料庫平均詞彙數趨勢

圖4-1-8 TASA語料庫平均詞彙數趨勢

伍、綜合討論

本研究建置之指標,若不考慮一年級的分布情形,可發現在實詞詞頻、每句詞

頻最小值與平均詞彙數方面,兒童語料庫分析結果與 Coh-Metrix 3.0 版本所採用之 TASA 語料庫趨勢一致,而所有詞詞頻的趨勢則相異,推論可能為中英文文章的結 構、語法、詞類的分法等不同特徵所導致。一年級在所有詞詞頻、實詞詞頻及詞頻

最小值方面的分析結果,趨勢與其他年級不一致的主因,可能一年級扣除首冊,課 文內容偏短,文章內重複的疊字詞占多數,故導致與其他年級的結果迥異。

相關文件