資料處理

第三章研究設計

第四節資料處理

本研究資料處理分為二方面，一為教科書中詞彙「量」的分析，其二為

「質」的分析。「量」的分析以次數與計算難易度為主，「質」的分析方式為根據量化所得數據結果加以分析說明其呈現的方式。資料分析處理主要步驟如下：

一、確定主題、界定母群體

研究者本著自我興趣與職場需求，輔以參考相關文獻及書籍，並與專家學者一番討論，確定研究方向，爾後朝此方向閱讀相關首冊及教科書詞彙的論文與期刊，訂定研究主題，確定研究文本為 102 學年度經國家教育研究院教科書審定通過之九年一貫語文領域本國語文首冊教科書，包括康軒版、翰林版、南一版三種版本，並初步閱讀瀏覽所收集的書籍與文件。三個版本首冊教科書源自於 2013 年 5 月出版社提供學校的參考樣書，在學校同仁確立下學期的教科書版本後，研究者經學校設備組長同意後，獲得三個版本的樣書，

此樣書內容同等於正本內容。

本研究文本係指通過教育部審定合格正式出版並取得執照，且於 102 學年度上學期仍然繼續發行者。符合上述條件之出版社有三家：1.康軒文教事業股份有限公司（以下簡稱康軒版）、2.翰林出版事業股份有限公司（以下簡稱翰林版）、3.南一書局企業股份有限公司（以下簡稱南一版）。有鑑於出版社常常重新編修教科書，為防出現同一版本但內容不同的情形發生，因此本研究是以 102 學年度上學期所使用的最新版國語首冊課本為研究樣本，並不溯及既往。

康軒版教材內容為「ㄅㄆㄇ同學會」、三回單元情境介紹、三回聆聽故事、

十課課文內容、十課課後練習、三回統整活動、總複習及注音符號表；翰林

版教材內容為「給小朋友的話」、認識注音符號、三回單元情境介紹含聆聽故事、十課課文內容、十課課後練習、三回統整活動及總複習；南一版教材內容為「ㄅㄆㄇ動物園」、三回單元情境介紹、十回聽故事學說話、十課課文內容、十課課後練習、三回複習及總複習。為求研究的統一性，保留十課課文內容、十課課後練習、三回統整活動（南一稱複習）及一回總複習。

二、抽取樣本

取得樣書確定母群體後，研究者對樣書文本逐頁詳閱，經深思熟慮決定排除樣書中的課文名稱、大小標題、圖片說明、問題討論等文字敘述，就教科書各課的課文內容、課後練習、統整活動與總複習部分探討詞彙，因此，

在樣本抽取上，共計課文內容三十課、課後練習三十回、統整活動九回（南一版稱複習）以及總複習三回。

三、界定分析單位

分析單位是內容分析量化過程中，最小的單位（吳美賢，2009）。歐用生

（2003）指出內容分析法的測量單位有很多種，常見的有單字、主題、人物、

項目、時間及空間單位，通常分析教科書內容時，又會採取空間單位，如章、

節、單元、課、段、詞、句、字、頁等單位。本研究依據其研究目的，以「詞」

為基本分析單位，並為量化依循的標準。

研究者以康軒版第四課「笑嘻嘻」課文的前兩行為例子，試著說明「詞」

的概念，課文內容為「一二一手拉手」，「一二一」是標準的數詞，符合詞的定義，不用切分；「手拉手」則是詞組或稱為短語，須再一次切分為「手」

和「拉手」兩個詞彙。

四、分詞工作

在第二階段抽取樣本後，建立文本電子檔，將所有欲分析的內容一一輸入電腦，包含短文、句子、短語、詞組及詞彙，分詞工作緊接在後，先利用中研院「CKIP 中文剖析系統」初步分詞，但詞的界定是抽象概念，偶爾分詞會出現疑慮或不符合文本的原意，此時猶疑的詞彙會依據教育部《國小學童常用字詞調查報告書》中基本原則與處理原則為主，將不確定者再調整與修正，確保實際文本資料一致性，方能進行下一個步驟。

48 六、解釋與推論

依據各版本所得的數據結果，做分析與比較，逐一進行各種內容質的分析，由出現次數的多寡、頻率的高低，可解釋該詞彙學童練習度是否足夠；

由難易度等級，可得知各詞彙的易讀性，可分析各課的差異性，可比較各版本的難易度。研究者盡可能秉持客觀的態度，對結果加以解釋，並大膽做推論，期能對教學現場的教師們與教科書編寫者有所幫助。

七、範例說明

以下就分詞與難易度等級資料量化分析過程說明之：

(一)分詞範例

研究者以南一版本第七課「粉筆」課文內容為分詞範例，其步驟如下。

1. 初步分詞

將樣本短文輸入「CKIP 中文剖析系統」（http://parser.iis.sinica.edu.tw/），系統會立即輸出斷詞標記結果。標記後檢視分詞，對於灰階的詞彙產生疑慮，

與研究者的分詞先備知識相斥，於是進行第二次的調整與修正，下方為剖析系統對於課文內容的斷詞結果。

粉筆愛唱歌一首兩首三首歌粉筆唱一唱

唱出快樂的兒歌粉筆愛畫畫

一朵兩朵三朵花粉筆畫一畫

畫出美麗的圖畫

2. 分詞調整修正

因電腦執行程序功能不足以轉化短文的複雜性，無法完全呈現原意，因此必須搭配一些輔助工具來確定詞的切分與合併。此時運用《國小學童常用字詞調查報告書》中條文來解釋與推論。

（1）一首兩首三首、一朵兩朵三朵：報告書處理原則（5）數字定語與量詞的組合，予以切分。故研究者將其切分為一首兩首三首、一朵兩朵三朵。

（2）唱一唱、畫一畫：報告書處理原則（3）鑲嵌重疊 A 一 A 式之重疊詞，視為一分詞單位。故研究者將其合為唱一唱、畫一畫。

粉筆愛唱歌

一首兩首三首歌粉筆唱一唱

唱出快樂的兒歌粉筆愛畫畫

一朵兩朵三朵花粉筆畫一畫

畫出美麗的圖畫

3. 分詞確認並建立電子檔

經分詞微調修正後，呈現完整的分詞結果，研究者將分詞後的詞彙逐一輸入電腦，待三版本樣本所有詞彙建立電子檔後，將運用電腦軟體 Excel 2007 進行詞彙的分析統計，並繪製相關圖表。

(二) 難易度分級範例 1. 難易度分級

研究者欲將難易度分五級，在難易度分等級前首要工作，將所有詞彙對照《國小學童常用字詞調查報告書》的序號，一一填入表格中（見附錄一、

二、三），再求出各版本序號平均數。

（每一詞彙序號*出現次數）總和（1）各版本序號平均數 =

（詞彙總出現次數－ N 詞彙總出現次數）

2750531 2750531

（2）康軒版序號平均數 = = = 4487 （638 － 25） 613

2741120 2741120

（3）翰林版序號平均數 = = = 4283 （671 － 31） 640

3076136 3076136

（4）南一版序號平均數 = = = 4718 （703 － 51） 652

康軒版的序號平均數是 4487；翰林版的序號平均數是 4283；南一版的序號平均數是 4718，三者平均數是（4487

+

⁴²⁸³

+

4718）/3=4497，研究者欲將難易度分為五級，設 4500 為難易度等級中央 2.5 處，求取每一等級區塊的落點，得知一個等級範圍是 1800。第一級序號 1~1800 是簡易詞彙，表詞彙常見、

常用及常說；第二級序號 1801~3600 是易詞彙；第三級序號 3601~5400 是適中詞彙；第四級序號 5401~7200 是難詞彙；第五級序號 7201 以上屬於困難詞彙，表詞彙較少見於文本或口說語。若詞彙沒有收錄在《國小學童常用字詞調查報告書》中，如數詞定詞「一」、「二」……「十」、「兩」等，研究者會標示 N，並置於表格末端（見附錄一、二、三）。下圖是難易度分級線段圖，明示五個等級的範圍，見下圖 3-4：

1 1800 3600 5400 7200 (序號)

1 2 3 4 5 (等級)

簡易易適中難困難 (難易別)

圖 3- 4

難易度分級線段圖

確立難易度等級範圍後，研究者會對照等級範圍，將所有詞彙一一輸入其等級所在，完成此工作後，便可計算全冊詞彙難易度。

（每一詞彙等級*出現次數）總和（1）各版本難易度等級 =

（詞彙總出現次數－ N 詞彙總出現次數）

1245 1245

（2）康軒版難易度等級 = = = 2.03 （638 － 25） 613

1243 1243

（3）翰林版難易度等級 = = = 1.94 （671 － 31） 640

1374 1374

（4）南一版難易度等級 = = = 2.11 （703 － 51） 652

以上可得知各版本全冊詞彙難易度等級，康軒版是 2.03，翰林版是 1.94，

南一版是 2.11。計算出全冊難易度後，便可針對課文內容、課後練習、統整活動、總複習每一課及每一回合計算難易度。公式如下：

（該課詞彙等級*該課出現次數）總和該課課文內容難易度等級=

（該課詞彙總出現次數－該課 N 詞彙總出現次數）

4500

在文檔中國語首冊教科書三個主要版本詞彙之比較分析 (頁 61-69)

第三章 研究設計

第四節 資料處理

粉 筆 愛 唱 歌 一 首 兩 首 三 首 歌 粉 筆 唱 一 唱

唱 出 快 樂 的 兒 歌 粉 筆 愛 畫 畫

一 朵 兩 朵 三 朵 花 粉 筆 畫 一 畫

畫 出 美 麗 的 圖 畫

粉 筆 愛 唱 歌

一 首 兩 首 三 首 歌 粉 筆 唱 一 唱

唱 出 快 樂 的 兒 歌 粉 筆 愛 畫 畫

一 朵 兩 朵 三 朵 花 粉 筆 畫 一 畫

畫 出 美 麗 的 圖 畫

+

+

第三章研究設計

第四節資料處理

粉筆愛唱歌一首兩首三首歌粉筆唱一唱

唱出快樂的兒歌粉筆愛畫畫

一朵兩朵三朵花粉筆畫一畫

畫出美麗的圖畫

粉筆愛唱歌

一首兩首三首歌粉筆唱一唱

唱出快樂的兒歌粉筆愛畫畫

一朵兩朵三朵花粉筆畫一畫

畫出美麗的圖畫