• 沒有找到結果。

不同學習表現學生之決策樹分析

本研究欲探討學生不同學習表現之特性,因此使用分類迴歸樹(Classification and Regression Tree,簡稱 CART)來進行資料分析,以建立不同學習表現之學生,

分別為高度學習表現之學生、中度學習表現之學生及低度學習表現之學生之三個 分類模型,並探討影響學習表現之相關因素。以下分別說明此研究所使用的被預 測變項及預測變項,如下:

(一)被預測變項:

本研究以「高度學習表現之學生」、「中度學習表現之學生」、「低 度學習表現之學生」為被預測變項,各變項皆為二元變項,變項內容 分別為是/否為「高度學習表現之學生」、是/否為「中度學習表現之學 生」、是/否為「低度學習表現之學生」,共三個被預測變數。

(二)預測變項:

本研究以經過前節所提卡方獨立性檢定後之三面向「行為學習投 入」、「情緒學習投入」、「認知學習投入」之因素構面與人口統計變數 為預測變數,以探討不同學習表現之學生之特性,如表4-20 所示:

表4- 20 分類決策樹之預測變項 分類決策樹之預測變項

行為學習投入

運動時數(週) 課外閱讀時數(週)

社團時數(週) 是否參加校內競賽

情緒學習投入 對學校課程感興趣程度

學校師資或學習條件滿意度

認知學習投入 是否擔任班級幹部

自我期許

人口統計變數 性別

一、高度學習表現學生之決策樹分析

因為在此資料中,高度學習表現之學生與非高度學習表現者之樣本數差距較 大,為了避免由樣本數差異懸殊而影響分類結果之準確性,因此,將樣本數以高 度學習表現之學生為標準,平衡高度學習表現之學生與非高度學習表現者之樣本 數,高度學習表現之學生樣本數分布如表4-21 所示。

表4- 21 高度學習表現之學生樣本數分布

未平衡之樣本數 平衡之樣本數

樣本數 百分比 樣本數 百分比

高度學習表現 1,648 30.9% 1,592 48.3%

接著,將平衡過後之 3,296 筆總樣本分別以 70%與 30%之比例分為訓練樣本 (Training Sample)及測試樣本(Testing Sample),以訓練樣本發展決策樹,而使用 測試樣本測試決策樹的正確率。本模型以「高度學習表現之學生」之二元變數母 節點,放入其他預測變項使用CART 方法進行決策樹分類。以 CART 分類結果(如 圖4-18)可知,重要性較大之變數成為分類的子節點。其中,將訓練樣本與測試 樣本交叉驗證下(如表 4-22),可以發現,隨著複雜參數(complexity parameter, CP) 愈來愈小,決策樹愈來愈複雜,在訓練樣本的正確率愈來愈高,且測試樣本的正 確率也大致增加,兩者正確率不算相差太大,交叉驗證結果是可接受的,表示此 樣本所得到的決策樹模型是可應用於其他樣本。

表4- 22 模型一分類正確性

CP 訓練樣本正確性 測試樣本正確性

0.0585 0.5745 0.5709

0.0110 0.5971 0.5688

0.0072 0.6005 0.5698

圖4- 18 高度學習表現學生之決策樹

由高度學習表現學生之決策樹分類規則(如表 4-23)可了解,高度學習表現學 生之特性與人數,本研究欲針對最終分類節點人數比例較多之規則整理於本節後 段,並加以做詳細之探討。

表4- 23 高度學習表現學生之決策樹分類規則

規則 分類變數 條件符合

1 IF 對課程感興趣程度 非常感興趣

THEN 高度學習表現之學生:1,094 人,佔總人數 47.4%

2

IF 對課程感興趣程度 感興趣、不感興趣、非常不感興趣

AND 社團時數(週) 1 小時以下、1~2 小時、4~6 小時

AND 是否參加校內競賽 是

AND 課外閱讀時數(週) 1~2 小時、6~8 小時、

8~14 小時、20 小時以上 THEN 高度學習表現之學生:282 人,佔總人數 12.2%

3

IF 對課程感興趣程度 感興趣、不感興趣、非常不感興趣

AND 社團時數(週) 1 小時以下、4~6 小時

AND 是否參加校內競賽 是

AND 課外閱讀時數(週) 沒有、1 小時以下、2~4 小時、

4~6 小時、14~20 小時 THEN 高度學習表現之學生:174 人,佔總人數 7.5%

二、中度學習表現學生之決策樹分析

因為在此資料中,中度學習表現之學生與非中度學習表現者之樣本數差距較 大,為了避免由樣本數差異懸殊而影響分類結果之準確性,因此,將樣本數以中 度學習表現之學生為標準,平衡中度學習表現之學生與非中度學習表現者之樣本 數。中度學習表現之學生樣本數分布如表4-24 所示。

表4- 24 中度學習表現之學生樣本數分布

未平衡之樣本數 平衡之樣本數

樣本數 百分比 樣本數 百分比

中度學習表現 之學生

2,311 43.4% 2,229 48.2%

非中度學習表 現之學生

3,017 56.6% 2,393 51.8%

總數 5,328 100% 4,622 100%

接著,將平衡過後之 4,622 筆總樣本分別以 70%與 30%之比例分為訓練樣本 (Training Sample)及測試樣本(Testing Sample),以訓練樣本發展決策樹,而使用 測試樣本測試決策樹的正確率。本模型以「中度學習表現之學生」之二元變數母 節點,放入其他預測變項使用CART 方法進行決策樹分類。以 CART 分類結果(如 圖4-19)可知,重要性較大之變數成為分類的子節點。其中,將訓練樣本與測試 樣本交叉驗證下(如表 4-25),可以發現,隨著複雜參數(complexity parameter, CP) 愈來愈小,決策樹愈來愈複雜,在訓練樣本的正確率愈來愈高,且測試樣本的正

表4- 25 模型二分類正確性

CP 訓練樣本正確性 測試樣本正確性

0.016 0.5590 0.5260

0.009 0.5714 0.5404

圖4- 19 中度學習表現學生之決策樹

由中度學習表現學生之決策樹分類規則(如表 4-26)可了解,中度學習表現學

三、低度學習表現學生之決策樹分析 (Training Sample)及測試樣本(Testing Sample),以訓練樣本發展決策樹,而使用 測試樣本測試決策樹的正確率。本模型以「低度學習表現之學生」之二元變數母 節點,放入其他預測變項使用CART 方法進行決策樹分類。以 CART 分類結果(如 圖4-20)可知,重要性較大之變數成為分類的子節點。其中,將訓練樣本與測試 樣本交叉驗證下(如表 4-28),可以發現,隨著複雜參數(complexity parameter, CP) 愈來愈小,決策樹愈來愈複雜,在訓練樣本的正確率愈來愈高,且測試樣本的正 確率也大致增加,兩者正確率不算相差太大,交叉驗證結果是可接受的,表示此 樣本所得到的決策樹模型是可應用於其他樣本。

表4- 28 模型三分類正確性

CP 訓練樣本正確性 測試樣本正確性

0.0547 0.5806 0.6236

0.0152 0.5884 0.6151

0.0128 0.6072 0.5871

0.0110 0.6239 0.5993

由低度學習表現之學生之決策樹分類規則(如表 4-29)可了解,中度學習表現

本研究欲針對三種不同學生學習表現人數比例較多的分類規則加以歸納比 較,如表4-30,以下詳述各學習表現之主要特性。

針對高度學習表現之學生,有47.4%對於學校課程是非常感興趣的;有 12.2%

對課程持非常不感興趣/不感興趣/感興趣者且每週參與社團時數為 1 小時以下 /1~2 小時/4~6 小時、有參加校內競賽、每週課外閱讀時數為 1~2 小時/6~8 小時 /8~14 小時/20 小時以上之學生。

針對中度學習表現之學生,有15.8%每週課外閱讀時數 1 小時以下/1~2 小時 /2~4 小時/4~6 小時/14~20 小時/20 小時以上、每週參與社團時數為 1 小時以下 /14~20 小時/沒有、每週運動時數為 1~2 小時/4~6 小時/6~8 小時/14~20 小時之學 生;有11.7%每週課外閱讀時數 1 小時以下/1~2 小時/2~4 小時/4~6 小時/14~20 小時/20 小時以上、每週參與社團時數為 1~2 小時、對學校師資及學習條件持不 滿意/非常滿意。

針對低度學習表現之學生,有14.7%對於學校課程是非常不感興趣/不感興趣、

自我期許為高中職/一般大學/科技大學或技術學院畢業、每週課外閱讀時數為 1~2 小時/8~14 小時/沒有之學生;有 10.3%對於學校課程是非常不感興趣/不感興 趣、自我期許為高中職/一般大學/科技大學或技術學院畢業、每週課外閱讀時數 為1 小時以下/2~4 小時/4~6 小時/6~8 小時/14~20 小時/20 小時以上、每週運動時 數為1~2 小時/2~4 小時/4~6 小時/6~8 小時/8~14 小時之學生。

表4- 30 不同學習表現學生之特性歸納比較

第伍章 結論與建議

本章節首先根據本研究之文獻回顧以及分析結果進行歸納,列出本研究主要 結論;第二節則說明研究限制,並對後續研究提出建議。

相關文件