第三章 研究設計
第四節 資料處理
本研究資料處理分為二方面,一為教科書中詞彙「量」的分析,其二為
「質」的分析。「量」的分析以次數與計算難易度為主,「質」的分析方式為 根據量化所得數據結果加以分析說明其呈現的方式。資料分析處理主要步驟 如下:
一、確定主題、界定母群體
研究者本著自我興趣與職場需求,輔以參考相關文獻及書籍,並與專家 學者一番討論,確定研究方向,爾後朝此方向閱讀相關首冊及教科書詞彙的 論文與期刊,訂定研究主題,確定研究文本為 102 學年度經國家教育研究院 教科書審定通過之九年一貫語文領域本國語文首冊教科書,包括康軒版、翰 林版、南一版三種版本,並初步閱讀瀏覽所收集的書籍與文件。三個版本首 冊教科書源自於 2013 年 5 月出版社提供學校的參考樣書,在學校同仁確立下 學期的教科書版本後,研究者經學校設備組長同意後,獲得三個版本的樣書,
此樣書內容同等於正本內容。
本研究文本係指通過教育部審定合格正式出版並取得執照,且於 102 學 年度上學期仍然繼續發行者。符合上述條件之出版社有三家:1.康軒文教事業 股份有限公司(以下簡稱康軒版)、2.翰林出版事業股份有限公司(以下簡稱 翰林版)、3.南一書局企業股份有限公司(以下簡稱南一版)。有鑑於出版社常 常重新編修教科書,為防出現同一版本但內容不同的情形發生,因此本研究 是以 102 學年度上學期所使用的最新版國語首冊課本為研究樣本,並不溯及 既往。
康軒版教材內容為「ㄅㄆㄇ同學會」、三回單元情境介紹、三回聆聽故事、
十課課文內容、十課課後練習、三回統整活動、總複習及注音符號表;翰林
46
版教材內容為「給小朋友的話」、認識注音符號、三回單元情境介紹含聆聽故 事、十課課文內容、十課課後練習、三回統整活動及總複習;南一版教材內 容為「ㄅㄆㄇ動物園」、三回單元情境介紹、十回聽故事學說話、十課課文內 容、十課課後練習、三回複習及總複習。為求研究的統一性,保留十課課文 內容、十課課後練習、三回統整活動(南一稱複習)及一回總複習。
二、抽取樣本
取得樣書確定母群體後,研究者對樣書文本逐頁詳閱,經深思熟慮決定 排除樣書中的課文名稱、大小標題、圖片說明、問題討論等文字敘述,就教 科書各課的課文內容、課後練習、統整活動與總複習部分探討詞彙,因此,
在樣本抽取上,共計課文內容三十課、課後練習三十回、統整活動九回(南 一版稱複習 )以及總複習三回。
三、界定分析單位
分析單位是內容分析量化過程中,最小的單位(吳美賢,2009)。歐用生
(2003)指出內容分析法的測量單位有很多種,常見的有單字、主題、人物、
項目、時間及空間單位,通常分析教科書內容時,又會採取空間單位,如章、
節、單元、課、段、詞、句、字、頁等單位。本研究依據其研究目的,以「詞」
為基本分析單位,並為量化依循的標準。
研究者以康軒版第四課「笑嘻嘻」課文的前兩行為例子,試著說明「詞」
的概念,課文內容為 「一二一 手拉手」,「一二一」是標準的數詞,符合 詞的定義,不用切分;「手拉手」則是詞組或稱為短語,須再一次切分為「手」
和「拉手」兩個詞彙。
四、分詞工作
在第二階段抽取樣本後,建立文本電子檔,將所有欲分析的內容一一輸 入電腦,包含短文、句子、短語、詞組及詞彙,分詞工作緊接在後,先利用 中研院「CKIP 中文剖析系統」初步分詞,但詞的界定是抽象概念,偶爾分詞 會出現疑慮或不符合文本的原意,此時猶疑的詞彙會依據教育部《國小學童 常用字詞調查報告書》中基本原則與處理原則為主,將不確定者再調整與修 正,確保實際文本資料一致性,方能進行下一個步驟。
47
48 六、解釋與推論
依據各版本所得的數據結果,做分析與比較,逐一進行各種內容質的分 析,由出現次數的多寡、頻率的高低,可解釋該詞彙學童練習度是否足夠;
由難易度等級,可得知各詞彙的易讀性,可分析各課的差異性,可比較各版 本的難易度。研究者盡可能秉持客觀的態度,對結果加以解釋,並大膽做推 論,期能對教學現場的教師們與教科書編寫者有所幫助。
七、範例說明
以下就分詞與難易度等級資料量化分析過程說明之:
(一)分詞範例
研究者以南一版本第七課「粉筆」課文內容為分詞範例,其步驟如下。
1. 初步分詞
將樣本短文輸入「CKIP 中文剖析系統」(http://parser.iis.sinica.edu.tw/),系 統會立即輸出斷詞標記結果。標記後檢視分詞,對於灰階的詞彙產生疑慮,
與研究者的分詞先備知識相斥,於是進行第二次的調整與修正,下方為剖析 系統對於課文內容的斷詞結果。
粉 筆 愛 唱 歌 一 首 兩 首 三 首 歌 粉 筆 唱 一 唱
唱 出 快 樂 的 兒 歌 粉 筆 愛 畫 畫
一 朵 兩 朵 三 朵 花 粉 筆 畫 一 畫
畫 出 美 麗 的 圖 畫
2. 分詞調整修正
因電腦執行程序功能不足以轉化短文的複雜性,無法完全呈現原意,因 此必須搭配一些輔助工具來確定詞的切分與合併。此時運用《國小學童常用 字詞調查報告書》中條文來解釋與推論。
(1)一首兩首三首、一朵兩朵三朵:報告書處理原則(5)數字定語與量詞 的組合,予以切分。故研究者將其切分為一 首 兩 首 三 首、一 朵 兩 朵 三 朵。
(2)唱 一 唱 、 畫 一 畫 :報告書處理原則(3)鑲嵌重疊 A 一 A 式 之重疊詞,視為一分詞單位。故研究者將其合為唱 一 唱 、 畫 一 畫 。
49
粉 筆 愛 唱 歌
一 首 兩 首 三 首 歌 粉 筆 唱 一 唱
唱 出 快 樂 的 兒 歌 粉 筆 愛 畫 畫
一 朵 兩 朵 三 朵 花 粉 筆 畫 一 畫
畫 出 美 麗 的 圖 畫
3. 分詞確認並建立電子檔
經分詞微調修正後,呈現完整的分詞結果,研究者將分詞後的詞彙逐一 輸入電腦,待三版本樣本所有詞彙建立電子檔後,將運用電腦軟體 Excel 2007 進行詞彙的分析統計,並繪製相關圖表。
(二) 難易度分級範例 1. 難易度分級
研究者欲將難易度分五級,在難易度分等級前首要工作,將所有詞彙對 照《國小學童常用字詞調查報告書》的序號,一一填入表格中(見附錄一、
二、三),再求出各版本序號平均數。
(每一詞彙序號*出現次數)總和 (1)各版本序號平均數 =
(詞彙總出現次數 - N 詞彙總出現次數)
2750531 2750531
(2)康軒版序號平均數 = = = 4487 (638 - 25) 613
2741120 2741120
(3)翰林版序號平均數 = = = 4283 (671 - 31) 640
3076136 3076136
(4)南一版序號平均數 = = = 4718 (703 - 51) 652
康軒版的序號平均數是 4487;翰林版的序號平均數是 4283;南一版的序 號平均數是 4718,三者平均數是(4487
+
4283+
4718)/3=4497,研究者欲將 難易度分為五級,設 4500 為難易度等級中央 2.5 處,求取每一等級區塊的落 點,得知一個等級範圍是 1800。第一級序號 1~1800 是簡易詞彙,表詞彙常見、50
常用及常說;第二級序號 1801~3600 是易詞彙;第三級序號 3601~5400 是適 中詞彙;第四級序號 5401~7200 是難詞彙;第五級序號 7201 以上屬於困難詞 彙,表詞彙較少見於文本或口說語。若詞彙沒有收錄在《國小學童常用字詞 調查報告書》中,如數詞定詞「一」、「二」……「十」、「兩」等,研究者會標 示 N,並置於表格末端(見附錄一、二、三)。下圖是難易度分級線段圖,明 示五個等級的範圍,見下圖 3-4:
1 1800 3600 5400 7200 (序號)
1 2 3 4 5 (等級)
簡易 易 適中 難 困難 (難易別)
圖 3- 4
難易度分級線段圖
確立難易度等級範圍後,研究者會對照等級範圍,將所有詞彙一一輸入 其等級所在,完成此工作後,便可計算全冊詞彙難易度。
(每一詞彙等級*出現次數)總和 (1)各版本難易度等級 =
(詞彙總出現次數 - N 詞彙總出現次數)
1245 1245
(2)康軒版難易度等級 = = = 2.03 (638 - 25) 613
1243 1243
(3)翰林版難易度等級 = = = 1.94 (671 - 31) 640
1374 1374
(4)南一版難易度等級 = = = 2.11 (703 - 51) 652
以上可得知各版本全冊詞彙難易度等級,康軒版是 2.03,翰林版是 1.94,
南一版是 2.11。計算出全冊難易度後,便可針對課文內容、課後練習、統整活 動、總複習每一課及每一回合計算難易度。公式如下:
(該課詞彙等級*該課出現次數)總和 該課課文內容難易度等級=
(該課詞彙總出現次數 - 該課 N 詞彙總出現次數)
4500
51
52
53