第四章 實驗設計
第一節 資料描述
在實驗中,使用Indian Pines Site 和 Washington DC Mall 兩種不同的高光 譜遙測影像資料,以及「擴分、約分」和「扇形」兩個不同單元的教育測驗資 料。對於相關的資料集分別描述如下。
壹、高光譜影像資料
本研究使用遙測領域研究中常採用之高光譜遙測影像,此影像大多是可以免 費獲得,第一個資料集為農業用地影像「Indian Pines Site (IPS)資料集(Landgrebe, 2003)」,第二個為都市區域 影像「Washington DC Mall 資料集(Landgrebe, 2003) 」。 前 面 的 資 料 集 是 經 由 Airborne Visible/Infrared Imaging Spectrometer (AVIRIS) 感應器測得的資料,後面的資料集為Hyperspectral Digital Imagery Collection Experiment (HYDICE) airborne 高光譜資料。二個資料集的簡介如下。
Indian Pines Site 影像是由印第安那州西北部之農業用地中選取一百平方英 里範圍,並於1992年6月蒐集完成,為一混合森林和農業區域的AVIRIS空載高光 譜影像(Landgrebe, 2003),如圖4-1所示。此影像大小為
145 145
、解析度約為20 m
, 具有220個有效頻譜,包含9個類別,分別為:Corn-no till、Corn-min till、Grass/Pasture、Grass/Trees、Hay-windrowed、Soybean-no till、Soybean-min till、
Soybean-clean till和Woods。此影像中各類別所含有之圖素(pixels)如表4-1所示,本 研究欲進行之Indian Pines Site影像實驗,則是由各類別中的圖素隨機選取所需之
樣本數,形成訓練樣本和測試樣本。
圖4-1 Indian Pines Site 影像
圖4-2 Indian Pines Site 的 ground truth 影像
表4-1Indian Pines Site 影像各類別所含有圖素
類別數 類別名稱 圖素數
1
■ Corn – no till
14282
■ Corn – min till
8303
■ Grass / Pasture
483 4■ Grass / Trees
730 5■ Hay – windrowed
478 6■ Soybean – no till
972 7■ Soybean – min till
2455 8■ Soybean – clean till
5939
■ Woods
1265全部 9234
Washington DC Mall影像為一都市區域影像如圖4-3所示(Landgrebe, 2003),為 飛機搭載高光譜儀低空拍攝而成。此影像大小為
205 307
、解析度約為5 m
,具有 220個頻譜,但部份頻譜被水吸收必須排除,因此僅具有191個有效頻譜。此影像 包含7個類別,分別為:Buildings、Roads、Paths、Lawn、Trees、Water和Shadows,各類別所含有之圖素(pixels)如表4-2所示,本研究欲進行之Washington DC Mall影 像實驗,乃由各類別中的圖素隨機選取所需之樣本數,形成訓練樣本和測試樣本。
圖4-3 Washington DC Mall 影像
圖4-4 Washington DC Mall 人工定義類別 影像
表4-2 Washington DC Mall 影像 各類別所含有之圖素 類別數 類別名稱 圖素數
1
■
Buildings 38342
■Roads 680
3
■ Paths 616
4
■ Lawn
19285
■ Trees
9196
■ Water
1224 7 ■ Shadows 221全部 9422
貳、教育測驗資料
運用樣式辨識技術來建立測驗資料之辨識系統,作為補救教學分類之用,將 學生分為有利於補救教學的分群,可因材施教與縮短補救教學的時間。而教學診 斷的應用亦為小樣本及高維度的問題。數學本身因具有樹狀組織結構,教材內容 通常是依照各重點概念的層級而建構,利用知識結構分析法,參考教育部編列之 國民小學課程標準及相關官方資料,並參考各家教科書出版社的教學指引及課 本,最後交由學科專家開會分析,匯編成一份紙筆診斷評量(郭伯臣、吳慧珉、
楊晉民、柯立偉、白家豪, 2003;郭伯臣, 2006)。
本研究使用兩個不同單元的教育測驗資料集。第一個教育測驗資料為「行 政院國家委員會補助專題研究計畫-國小數學科電腦適性化診斷測驗」第一年施
測之紙筆測驗資料,施測單元為康軒文教事業主編之國小科第十一冊第二單元
「擴分、約分」。
施測時所使用的考卷記錄於附錄當中,根據紙筆測驗施測時所得資料,可 將學生的錯誤類型分成15 種類型,表 4-3 是類別所對應需要進行補救教學之概 念。所使用的教育測驗資料集中,有27 個維度,15 個類別(類別 1 到類別 15),
共有1192 個樣本,表 4-4 為「擴分、約分」單元資料集實驗設計。
表4-3「擴分、約分」單元的錯誤概念分類表 組別 人數 需進行補救教學之概念
1 89 「兩異分母比較大小」
2 31 「兩異分母比較大小」、「通分」
3 186 「最簡分數」
4 154 「最簡分數」、「兩異分母比較大小」
5 62 「最簡分數」、「兩異分母比較大小」、「通分」
6 41 「約分」
7 80 「最簡分數」、「約分」、「兩異分母比較大小」
8 59 「最簡分數」、「約分」、「兩異分母比較大小」、「通分」
9 63 「最簡分數」、「約分」、「公因數」、「等值分數」、「兩異分母 比較」、「通分」
10 59 需重新學習「最簡分數」、「約分」、「公因數」、「等值分數」、
「兩異分母比較」、「兩同分母比較」、「公倍數」
11 79 「最簡分數」、「約分」、「兩異分母比較」、「通分」、「兩同分母 比較」
12 77 「最簡分數」、「約分」、「兩異分母比較」、「兩同分母比較」、
「公倍數」、「擴分」
組別 人數 需進行補救教學之概念
13 35 「最簡分數」、「約分」、「公因數」、「等值分數」、「兩異分母 比較」、「兩同分母比較」、「公倍數」、「擴分」
14 150 所以概念都需重新學習 15 27 加強練習(粗心犯錯)
合計 1192
表4-4「擴分、約分」單元資料集實驗設計
第二個教育測驗資料集所採用的教材為康軒出版社所出版的國小數學第 十一冊「扇形」單元,其中,紙筆測驗共有21 題,有效樣本點數總共有 748 個 用以進行實驗。隨機選取出10 個資料集,對於每個類別共有 10 及 20 個訓練樣 本,其餘的樣本點皆為測試樣本。對這些資料集計算其各自的分類正確率,最 後將得到的結果取平均值後,作為最後比較的數據。其中各別錯誤類型以及人 數參照如表4-5,而表 4-6 為「扇形」單元資料集實驗設計。
表4-5「扇形」單元的錯誤概念分類表
組別 人數 需要進行補救教學之概念
1 50 加強練習(粗心犯錯) 2 36 「複合扇形面積」
3 47 「複合扇形面積」、「基本扇形面積」
類別數 15
維度數 27
訓練樣本數
(個別類別) 10 20
總訓練樣本 150 300
總測試樣本 1042 892
組別 人數 需要進行補救教學之概念
4 221 「扇形定義」、「複合扇形面積計算」、「基本扇形面積」
5 53 「圖形繪製」
6 30 「複合扇形面積」、「圖形繪製」
7 25 「複合扇形面積」、「圖形繪製」、「基本扇形面積」
8 286 所有概念都需重新學習
總計 748
表4-6「扇形」單元資料集實驗設計
類別數 8
維度數 21
訓練樣本數
(個別類別) 10 20
總訓練樣本 80 160
總測試樣本 668 588