資料處理

第三章研究設計與實施

第五節資料處理

本研究之資料處理須先進行教科書主題文章及課文蒐集並數位化為電子文字檔。資料包括 Houghton Mifflin Reading 2005 年版 12 冊，共計 186 篇的主題文章，以及審定版國小英語教科書（請參考表 1- 1）74 冊，全數 580 課的課文。美國小學英語教科書加上台灣審定版國小英語教科書共八十六冊書籍，字彙總數為四十萬四千三百四十個字，予以數位化並經過數次人工逐字逐句校對，而得研究所需之樣本資料。

再以電腦程式辨析、計算出本研究所需要的獨立變項數值，並以人工輸入於統計軟體 SPSS，利用此統計工具來進行結果的輸出，本研究所使用的統計方法如下：

一、因素分析：

本研究利用因素分析的結果獲知哪些相關的變數群聚在一起、哪些變數缺乏共同性（communality），以便了解哪些變數較沒有貢獻性，即利用因素分析的共同性及轉軸後成分矩陣來了解變項間的相關程度取得最具影響力的獨立變數，並據此來進行人工多元逐步迴歸分析法。

二、多元迴歸分析：

本研究分別以 SPSS 自動化多元逐步迴歸分析與人工多元逐步迴歸分析的方式進行資料的處理與分析。

（一）SPSS 自動化多元逐步迴歸分析

採行 SPSS 統計軟體內建的多元逐步迴歸分析方法，來建置適讀性公式。自動化多元逐步迴歸分析是以逐步分析的策略來決定具有解釋力的預測變項，投入

或是淘汰出局，最後得到一個以最少解釋變數解釋最多依變項變異量的最佳迴歸模型，即一次僅挑選一個最顯著或最有貢獻的變項來計算迴歸公式，直到沒有變項達到顯著為止。

（二）人工多元逐步迴歸分析

此多元迴歸變項的選擇公式是採行 SPSS 本身內建的強迫進入變數分析方法，將所有的獨立變項都丟入，再依據以下萃取變項要素：（1）因素分析的結果：

本研究利用因素分析的結果獲知哪些相關的變數群聚在一起、哪些變數缺乏共同性（communality），以便了解哪些變數較沒有貢獻性。（2）最容易被一般使用者操作。（3）共線性：利用共線性診斷將共線性嚴重的變數拿掉，共線性嚴重的變數可能與其他變數有極高度相關，將共線性嚴重的變數加入預測模型中，不但會浪費額外的力氣去進行模型的分析，在進行參數估計時，也會造成偏誤的情形發生。（4）顯著性：迴歸顯著性表示預測為有意義的預測，相較於隨機猜測，具有較佳的效果。故本研究以四個要素來淘汰已進入迴歸公式的變項，且解釋力（R²）不可相差大於 10％，來萃取達顯著性且最易於使用者取得的獨立變項，進而得到最佳的適讀性預測公式。

其中要加以解釋的為多元迴歸分析中的共線性診斷，對於某一個自變項共線性的檢驗，可以使用容忍值（Tolerance）或變異數膨脹因素（Variance Inflation Factor，VIF）來評估，VIF 的公式如下：

VIF = （27）

R 代表某一個自變項被其他自變項當作依變項來預測時，該自變項可以被_i² 解釋的比例，1-R （容忍值，Tolerance）為該自變項被其他自變項無法解釋的殘_i²

差比，R 比例越高，容忍值越小，代表預測變項不可解釋殘差比低，VIF 越大，_i²

1 2

1 Ri

−

即 VIF 越大表示越有共線性的問題，當 VIF 大於 2 的時候，通常表示此變項可能具共線性問題。

在文檔中 9 t t s k I 1 * E + & r * ) (頁 56-59)

第三章 研究設計與實施

第五節 資料處理

第三章研究設計與實施

第五節資料處理