• 沒有找到結果。

第四章 實驗設計

第一節 資料描述

在本研究中,使用了 UCI 資料庫的 Wine、Image Segmentation 和 Ionosphere 三個資料集(Bache & Lichman, 2013)以及教育測驗資料集微分四則運算(張偉 民 , 2012 ) 和 高 光 譜 影 像 資 料 集 Pavia University Scene 與 Indian Pine Site

(Benediktsson, Palmason & Sveinsson, 2005;Landgrebe, 2003)。對於各資料集的 完整描述於下。

壹、UCI 資料庫之資料集

本研究實驗採用 UCI 資料庫之 Wine、Image Segmentation 和 Ionosphere,資 料集摘要如下:

一、Wine 資料集

Wine 資料集是在意大利同一個區域所生產之三種不同品種的葡萄酒資料,

共有 178 個樣本數,包含 Alcohol、Malic acid、Ash、Alcalinity of ash、Magnesium、

Total phenols、Flavanoids、Nonflavanoid phenols、Proanthocyanins、Color intensity、

Hue、OD280/OD315 of diluted wines 和 Proline 13 種屬性。其中第一類有 59 個樣 本數,第二類有 71 個樣本數,第三類有 48 個樣本數。

二、Image Segmentation 資料集

Image Segmentation 資料集是由馬薩諸塞大學的 Vision Group 所創建,實例 數據是來自磚面、天空、樹葉、水泥、窗戶、小徑及草這 7 種戶外影像類別,每 個實例皆為 3 × 3 的區域,且影像皆用手勢分割為每個像素創建分類。樣本數共 2310 個,訓練樣本 210 個,與測試樣本 2100 個,包含 19 種屬性,分別為

region- centroid-col、region-centroid-row、region-pixel-count、short-line-density-5、short-line- density-2、vedge-mean、vegde-sd、hedge-mean、hedge-sd、intensity-mean、rawred-mean、rawblue-mean、rawgreen-mean、exred-mean、exblue-mean、exgreen-mean、

value-mean、saturatoin-mean 與 hue-mean。其中在訓練樣本中每個類別各有 30 個 實例,而在測試樣本中每個類別有 300 個實例。

三、Ionosphere 資料集

Ionosphere 資料集是來自 Johns Hopkins University 的電離層數據庫,此數據 是由 16 個高頻天線所組成的系統,在拉布拉多半島的 Goose Bay 所收集到的雷 達數據,並可依據電離層中自由電子的回饋將數據區分為好與壞兩種類別,此數 據共有 351 個樣本,包含 34 種屬性,其中被定義為好的樣本有 225 個,壞的樣 本有 126 個。

貳、教育測驗資料集

所使用的教育測驗資料集是「行政院國家科學委員會輔助研究專題計畫-以貝 氏網路為基礎之微積分適性診斷測驗暨學習系統研發」之技專院校微積分領域中 的「微分四則運算」單元。此單元共有 23 題,18 題為四選一的選擇題,5 題為建 構反應題型,本研究則以第九題當作此教育測驗資料,測驗試題內容如附件一。

依據施測後所得到的結果,將學生的錯誤概念分成 13 種類型,與需要進行 補救教學之概念,如表 4-1-1。

表 4-1-1

微積分單元之錯誤概念分類表

組別 人數 類型

1 36 錯用冪分配

2 0 受加法律影響

3 33 受乘法律影響

4 0 形式錯覺

5 0 缺乏正確的運算法則

6 3 忽略對稱性或交錯性

7 5 忽略必然性

8 67 失序〈或流程不完全〉

9 8 順序錯誤

10 0 公式混搭

11 55 無法歸納類別

12 58 未作答

13 91 正確答案

合計 356

此資料集有 19 個維度,13 個類別,樣本數共 356 個。但是其中「受加法律 影響」、「形式錯覺」、「缺乏正確的運算法則」與「公式混搭」4 個類型之人數為 0,因此刪除這幾種類型,只使用「錯用冪分配」、「受乘法律影響」、「忽略對稱性 或交錯性」、「忽略必然性」、「失序〈或流程不完全〉」、「順序錯誤」、「無法歸納類 別」、「未作答」與「正確答案」9 種類型進行實驗。

參、高光譜影像資料集

本 研 究 所 運 用 的 高 光 譜 影 像 為 「 Pavia University Scene 」( Benediktsson, Palmason & Sveinsson, 2005)資料集與「Indian Pine Site」資料集(Landgrebe, 2003), 這兩個影像資料集皆可以從網路上免費取得。

一、Pavia University Scene 影像資料集

Pavia University Scene 資料集(Benediktsson, Palmason & Sveinsson, 2005)是 利用 Reflective Optics System Imaging Spectrometer(ROSIS)感測器在義大利一所 學校附近區域所測得的影像資料。原始的影像大小為 610 × 610 像素,但因影像 中某些區域沒有資訊,所以用來分析的影像大小為 610 × 340 像素。

Pavia University Scene 具有 103 個波段的光譜資料,且包含 Shadows、Self-Blocking Bricks、Bitumen、Bare Soil、Painted metal sheets、Trees、Gravel、Meadows 和 Asphalt 九種類別。圖 4-1-1 為 Pavia University Scene 資料集之完整的影像(原 始大小),圖 4-1-2 為 Pavia University Scene 資料集地真資料分布圖,表 4-1-2 為 PAVIA 各類別之像素個數。

圖 4-1-1 Pavia University Scene 資料集之完整影像

圖 4-1-2 Pavia University Scene 資料集地真資料分布圖

表 4-1-2

Pavia University Scene 影像各類別所含有之樣本數

類別 類別名稱 樣本數

1 Shadows 947

2 Self-Blocking Bricks 3682

3 Bitumen 1330

4 Bare Soil 5029

5 Painted metal sheets 1345

6 Trees 3064

7 Gravel 2099

8 Meadows 18649

9 Asphalt 6631

全部 42776

Backgorund Asphalt Meadows Gravel Trees

Painted metal sheets Bare Soil Bitumen Self-Blocking Bricks Shadows

二、Indian Pine Site 影像資料集

Indian Pine Site 資料集(Landgrebe, 2003)是利用 Airborne Visible/Infrared Imaging Spectrometer(AVIRIS)感測器在美國的 Indiana 一個混合森林與農業區 域所測得的影像。影像大小為 145145 像素,具有 220 個波段的光譜資料,且包 含 16 種 Corn-notill、Grass-Pasture、Woods、Soybean-clean、Stone-Steel-Towers、

Wheat、Alfalfa、Corn-mintill、Grass-Pasture-mowed、Hay-windrowed、Soybean-mintill、

Corn、Grass-Trees、Buildings-Grass-Trees-Drives、Soybean-notill 和 Oats。

表 4-1-3

Indian Pine Site 影像各類別所含有之樣本數

類別 類別名稱 樣本數

1 Alfalfa 46

2 Corn-notill 1428

3 Corn-mintill 830

4 Corn 237

5 Grass-pasture 483

6 Grass-trees 730

7 Grass-pasture-mowed 28

8 Hay-windrowed 478

9 Oats 20

10 Soybean-notill 972

11 Soybean-mintill 2455

12 Soybean-clean 593

13 Wheat 205

14 Woods 1265

15 Buildings-Grass-Trees-Drives 386

16 Stone-Steel-Towers 93

全部 10249

圖 4-1-3 為 Indian Pine Site 資料集之完整的影像(原始大小),圖 4-1-4 為 Indian Pine Site 資料集地真資料分布圖。表 4-1-3 為 IPS 各類別之像素個數。

圖 4-1-3 Indian Pine Site 資料集之完整影像

圖 4-1-4 Indian Pine Site 資料集地真資料分布圖

但因為部分類別的個數過少無法達到本研究實驗設計之標準,故此資料集只 用了其中 12 個類別,分別為:Corn-notill、Grass-Pasture、Woods、Soybean-clean、

Wheat、Corn-mintill、Hay-windrowed、Soybean-mintill、Corn、Grass-Trees、Buildings-Grass-Trees-Drives 和 Soybean-notill,如圖 4-1-5。

圖 4-1-5 實驗用 Indian Pine Site 資料集地真資料分布圖

相關文件