多元逐步迴歸分析與預測公式

第四章研究結果統計與分析

第二節多元逐步迴歸分析與預測公式

本研究分別採用美國小學英語教科書主題文章及台灣審定版國小英語教科書的課文為樣本，將其數位化並經數次校對有無誤植之處後，再以電腦程式辨析、計算出本研究所需要的獨立變項數值。接著，再分別與 D 字庫、E 字庫、A 字庫、T 字庫等四個字庫之研究變數進行 SPSS 自動化多元逐步迴歸分析，進而建立八個迴歸公式，並將此結果彙整於表 4- 3 中。

一、美國小學英語教科書

美國小學英語教科書進行 SPSS 自動化多元逐步迴歸分析過程，四個字庫皆先選入最顯著或最有貢獻的每句平均字彙數來建立適讀性公式，接著選入的變項依序為每句出現於字庫的平均不同字彙數、每句平均不同字彙數、每句平均人稱代名詞數，而 E 字庫、A 字庫、T 字庫還另外選入每字平均音節數為預測適讀性程度之獨立變項（代稱請參見 P.12，表 1- 2）。

美國小學英語教科書針對此四個字庫之研究變數進行 SPSS 自動化多元逐步迴歸分析的結果為：（1）D 字庫的多元逐步適讀性公式之 R²＝.726＞.5，F＝

120.137，p＝.000＜.001 達顯著性；（2）E 字庫的 R²＝.746＞.5，F＝105.935，p

＝.000＜.001 達顯著性；（3）A 字庫的的適讀性公式之 R²＝.738＞.5，F＝101.509，

p＝.000＜.001 達顯著性；（4）T 字庫的 R²＝.744＞.5，F＝104.605，p＝.000＜.001 達顯著性。由上述分析結果所知，四個字庫的 R²皆大於.72，即可解釋變異量皆達在七成以上，且 F 皆大於 99，p 皆小於.001，表示迴歸預測線極具預測能力，

亦即美國小學英語教科書針對此四個字庫產生的適讀性公式皆達顯著性，且預測力佳。

美國小學英語教科書針對此四個字庫產生的適讀性公式，亦即美國小學英語教科書之適讀性公式，如下列所示：

（一）D字庫：

年級＝.221×每句平均字彙數－2.605×每句出現於D字庫之平均不同字 彙數＋1.345×每句平均不同字彙數＋.848×每句平均人稱代名詞數 ＋.946 （28）

（二）E字庫：

年級＝.171×每句平均字彙數－2.245×每句出現於E字庫之平均不同 字彙數＋.833 ×每句平均不同字彙數＋2.398×每字平均音節數

＋.949×每句平均人稱代名詞數－1.693 （29）

（三）A字庫：

年級＝.286×每句平均字彙數－2.142×每句出現於A字庫之平均不同字 彙數＋1.152×每句平均不同字彙數＋3.334×每字平均音節數＋.922

×每句平均人稱代名詞數－3.360 （30）

（四）T字庫：

年級＝.164×每句平均字彙數－1.910×每句字彙出現於T字庫之平均不 同字彙數＋.726×每句平均不同字彙數＋2.791×每字平均音節數

＋.956×每句平均人稱代名詞數－1.081 （31）

美國小學英語教科書之四個適讀性公式的依變項皆與每句出現於字庫的平均不同字彙數呈負相關，即每句出現於四字庫中的不同字彙數越多，則適讀年級越低，其餘獨立變數反之。這表示美國小學英語教科書是依據常用字字庫來編撰教科書，因此主題文章出現於字庫裡的字彙越多，表示越容易閱讀。

這四個公式的相同點，係皆選入因素分析結果的主成份1和主成份3的變數為

每句平均字彙數等兩個變數，而每句出現於字庫的平均不同字彙數、每句平均不同字彙數，這兩個變數屬於主成份3為認識之字彙量多寡。

而差異點在於D字庫沒有將主成份2字的長度之其中任一變數納入適讀性公式之影響變項中，而E字庫、A字庫、T字庫皆有將屬於主成份2的每字平均音節數選入其適讀性公式。

此四個適讀性公式雖然預測力佳，但有兩個問題存在，首先這四個預測公式裡的 VIF 有大於 10 之變項（可參見表 4- 3），VIF 越大表示變項間有共線性問題。

例如：D 字庫裡的每句平均不同字彙數之 VIF 為 11.889，E 字庫的每句平均不同字彙數之 VIF 為 12.112，A 字庫的每句平均不同字彙數之 VIF 為 18.377、每句出現於 A 字庫的平均不同字彙數 VIF 為 10.369，表示這些變項間有共線性的問題存在，即代表這些變數與其他變數有極高度相關，將共線性嚴重的變數加入預測模型中，不但會浪費額外的力氣去進行模型的分析，在進行參數估計時，也會造成偏誤的情形發生。

再者，對於使用者而言，這些適讀性公式的獨立變項在計算上有些許執行困難。例如：每字平均音節數，要計算每篇文章或課文的每字平均音節數，必須逐一查出每一單字的音節數為何，再取其平均數，對於一般使用者實屬負擔。

上述兩個問題是 SPSS 自動化多元逐步迴歸分析產生的適讀性公式之缺點所在，因此，研究者更進一步採用人工多元逐步迴歸分析來改善這些問題，挑選易於計算的變項，且變項間沒有共線性問題之適讀性公式。

二、台灣審定版國小英語教科書

台灣審定版國小英語教科書進行 SPSS 自動化多元逐步迴歸分析過程，四個字庫中除了 A 字庫不同外，其餘三個字庫皆先選入最顯著或最有貢獻的每句平均字彙數做為適讀性公式變數，接著選入的變項為每句平均介系詞片語數，最後選入的變項為每字平均字母數。

台灣審定版國小英語教科書針對此四個字庫之研究變數進行 SPSS 自動化多元逐步迴歸分析的結果為：（1）D 字庫的適讀性公式之 R²＝.403，F＝98.466，p

＝.000＜.001 達顯著性；（2）E 字庫的 R²＝.403，F＝98.466，p＝.000＜.001 達顯著性；（3）A 字庫的的適讀性公式之 R²＝.434，F＝89.393，p＝.000＜.001 達顯著性；（4）T 字庫的 R²＝.407，F＝99.882，p＝.000＜.001 達顯著性。

台灣審定版國小英語教科書對於這四字庫的SPSS自動化多元逐步迴歸分析，產生一個特殊現象，D字庫與E字庫的適讀性公式是一樣的，進行多元逐步迴歸分析時，逐一選擇最具顯著最有貢獻的變數時，將影響這兩個字庫之適讀性預測公式不同的關鍵變數：每句字彙出現於字庫之平均次數、每句出現於字庫之平均不同字彙給剔除了，而導致兩字庫的適讀性公式相同。

研究者認為SPSS自動化多元逐步迴歸分析會產生D字庫與E字庫的適讀性公式是一樣的可能因素是台灣審定版國小英語教科書沒有根據字庫來編撰，以致於這兩個字庫的獨立變項與適讀性程度預測完全沒影響。

台灣審定版國小英語教科書針對此四個字庫建置而成的適讀性公式如下列所示：

（一）D字庫：

冊別＝.728×每句平均字彙數＋.464×每句平均不同字彙數＋1.684×每句平 均介系詞片語數＋.372×每字平均字母數－1.081 （32）

（二）E字庫：

冊別＝.728×每句平均字彙數＋.464×每句平均不同字彙數＋1.684×每句平 均介系詞片語數＋.372×每字平均字母數－1.081 （33）

（三）A字庫：

冊別＝.915×每句字彙出現於A字庫之平均次數－1.068×每句平均人稱 代名詞數＋1.335×每句平均介系詞片語數＋.576×每句出現於A字 庫之平均不同字彙數＋.432×每字平均字母數－.785 （34）

（四）T字庫：

冊別＝.688×每句平均字彙數＋1.661×每句平均介系詞片語數＋.585×每句 出現於T字庫之平均不同字彙數＋.407×每字平均字母數－1.197 （35）

台灣審定版國小英語教科書之四個適讀性公式的共同點在於皆有選入因素分析結果的兩主要成份之一為預測適讀性程度的獨立變項，有主成份1常用字彙數的每句平均介系詞片語數，主成份2字的長度的每字平均字母數。

公式間的變數差異之處是台灣審定版國小英語教科書之A字庫的適讀性公式，重視每句出現於字庫的平均次數與每句出現於字庫的平均不同字彙數、每句平均人稱代名詞數，且認為每句平均人稱代名詞數值越高，就越簡單，其餘的四個獨立變項皆與適讀性程度呈正相關。

台灣審定版國小英語教科書的 SPSS 自動化多元逐步迴歸分析產生的適讀性公式亦有兩個問題。首先在於 D 字庫與 E 字庫的預測是完全正相關，兩者預測沒有差異。

再者以 A 字庫的適讀性公式對於使用者而言，其獨立變項在計算上有些許執行困難。例如：每句平均人稱代名詞數，要計算每篇主題文章或課文之人稱代名詞總數後，再除以每篇總句數，對於使用者實屬負擔。

上述兩個問題是 SPSS 自動化多元逐步迴歸分析產生的適讀性公式之缺點所在。因此，研究者更進一步採用人工多元逐步迴歸分析來改善這些問題，挑選易

表4- 1 SPSS 自動化多元逐步迴歸分析表

逐步迴歸

美國小學英語教科書台灣審定版國小英語教科書

D 字庫 E 字庫 A 字庫 T 字庫 D 字庫 E 字庫 A 字庫 T 字庫

β 標準化

β VIF β 標準化

β VIF β 標準化 β VIF 每句字彙出現於D 字庫之

平均次數

每句出現於D 字庫之

平均不同字彙數 -2.605 -.824 5.631 每句字彙出現於E 字庫之

平均次數

每句出現於E 字庫之

平均不同字彙數 -2.245 -.621 5.253 每句字彙出現於A 字庫之

平均次數 .915 .452 4.728

每句出現於A 字庫之

平均不同字彙數 -2.142 -.822 10.369 .576 .169 2.765 每句字彙出現於T 字庫之

平均次數

每句出現於T 字庫之

平均不同字彙數 -1.910 -.549 4.245 .585 .175 2.531 每句平均人稱代名詞數 .848 .166 1.847 .949 .185 1.868 .922 .180 1.867 .956 .187 1.874 -1.068 -.119 1.701

每字平均音節數 2.398 .135 2.752 3.334 .188 2.511 2.791 .157 2.639 每句平均介系詞片語數 1.684 .195 1.841 1.684 .195 1.841 1.335 .155 1.870 1.661 .192 1.837 每字平均字母數 .372 .085 1.065 .372 .085 1.065 .432 .099 1.177 .407 .093 1.023 每句平均不同字彙數 1.345 .742 11.889 .833 .460 12.112 1.152 .636 18.377 .624 .344 9.880 .464 .149 2.531 .464 .149 2.531

每句平均字彙數 .221 .350 6.603 .171 .272 7.057 .286 .453 5.403 .164 .260 7.310 .728 .364 3.467 .728 .364 3.467 .688 .344 3.434 常數 .946 × -1.693 × -3.360 × -2.102 × -1.081 × -1.081 × -.785 × -1.197 ×

R² .726 .746 .738 .744 .403 .403 .434 .407

F 120.137^＊＊＊ 105.935^＊＊＊ 101.509^＊＊＊ 104.605^＊＊＊ 98.466^＊＊＊ 98.466^＊＊＊ 89.393^＊＊＊ 99.882^＊＊＊

P .000 .000 .000 .000 .000 .000 .000 .000

＊p＜.05, ^＊＊p＜.01, ^＊＊＊p＜.001 註：表中代稱請參見P.12，表 1- 2。

在文檔中 9 t t s k I 1 * E + & r * ) (頁 65-71)

第四章 研究結果統計與分析

第二節 多元逐步迴歸分析與預測公式

第四章研究結果統計與分析

第二節多元逐步迴歸分析與預測公式