第四章 研究結果與討論
第二節 兒童中文語意空間效度驗證結果
目前各國所建立的 LSA 語意空間,都是以詞彙為單位,由「詞彙─文件」
矩陣所建置。本研究依據眼動追蹤實驗(Bai, Yan, Liversedge, Zang, & Rayner, 2008)及國內諸多學者提出的見解(胡志偉,1989;彭瑞元、陳振宇,2004;鄭 昭明,1981),認為詞彙是主要的閱讀單位,並考量各國語意空間建置也是採用 詞彙為基本單位,故將針對以詞彙為單位所建立的兒童中文語意空間,能否有 效的反應中文情境的兒童內在知識語意表徵進行驗證。以下分別從「詞彙與詞 彙」的語意關聯性、「句子與句子」之語意關聯性,以及「LSA 造句自動化計 分評估」這三個層面來驗證。
壹、詞彙間語意關聯性之驗證結果
本研究從不同年級中各挑選 36 組詞彙進行詞彙語意效度驗證,其比較兒童 中文語意空間所計算的詞彙關聯度、成人語意空間的語意關聯度兩者與專家評 分之相關性,研究結果如表 4-3。由表 4-3 可以得知,在三、四、五以及六年級,
兒童中文語意空間計算得到的詞彙關聯度皆與專家有高度顯著相關(r = . 657,
r = . 601,r = . 635,r = . 645),且平均也達到高度顯著相關(r = .634);而藉 由成人語意空間所計算的語意關聯度與專家評分則呈現中度顯著相關(r = . 427,r = . 517,r = . 408,r = . 490),整體平均也為中度顯著相關。由此研究結 果顯示,兒童中文語意空間有良好之專家效度。
表 4-3
詞彙語意關聯性與專家評分之相關性
三年級 四年級 五年級 六年級 平均 兒童中文語意空間 .657 .601 .635 .645 .634
成人語意空間 .427 .517 .408 .490 .460
貳、句子語意關聯性之驗證結果
本研究進行句子語意關聯性的效度驗證,實驗針對三組不同句子呈現方式 進行 ANOVA 單因子變異數分析檢定。根據陳明蕾等人(2009)的研究中提到,
以一般常理推論,同一篇文章中的句子意涵,大致會依循此文章的主題發展,
因此句子之間的語意相似度會較為接近;不同篇文章間因為主題不同,所以不 同文章的句子之間彼此的意涵不同,其語意相似度當然應低於文章內之句子呈 現方式。
表 4-4 為三到六年級三組不同句子的呈現方式,其在兒童中文語意空間的 語意關聯值(cosine value)評估結果列表。表中的「句 1/句 2」,是指同一篇文 章內依句子順序排列,句 1 對句 2、句 2 對句 3…等兩兩呈現的方式;「文章內 隨機」指同一篇文章內隨機挑選兩兩句子所呈現的方式;「文章間隨機」指不同 篇文章的句子以隨機方式兩兩呈現。
表 4-4
表 4-5
均等 Robust 檢定
統計量 分子自由度 分母自由度 顯著性(p 值) 四年級 Welch 15.743 2 11.323 0.001 五年級 Welch 19.927 2 11.918 0.000 六年級 Welch 9.626 2 12.740 0.003
本研究進一步比較句子語意相似度與專家評分之成效,其研究結果如表 4-6。由表 4-6 結果得知,使用兒童中文語意空間計算句子語意相似度與專家評 分在中年級達到中度顯著相關(r = . 0.535,r = . 512),在高年級部分則達高度 顯著相關(r = . 608,r = . 640),而使用成人語意空間句子語意相似度與專家評 分則達中度顯著相關(r = . 370,r = . 477,r = . 440,r = . 335),根據上述結果,
顯示本研究建立之兒童中文語意空間在句子效度驗證有良好之成效。
表 4-6
句子語意關聯性與專家評分之相關性
三年級 四年級 五年級 六年級 平均 兒童中文語意空間 0.535 0.512 0.608 0.640 0.570 成人語意空間 0.370 0.477 0.440 0.335 0.406
參、LSA 造句自動化計分評估之成效
本研究建立的國小兒童中文語意空間,根據白鎧誌(2011)的研究方式,
進行不同語意空間(兒童中文語意空間、成人語意空間)在 LSA 自動化造句計 分與專家評分之相關性比較,並分析造句計分對於閱讀理解預測之成效。表 4-7 為專家評分與 LSA 造句自動化計分之相關性,其本研究資料使用白鎧誌(2011)
使用的成人語意空間所發展的 LSA 自動化造句計分,在以字造句與專家評分呈
現顯著高度相關(r = .825),而本研究建立的兒童中文語意空間所發展的 LSA
表 4-8