• 沒有找到結果。

中心向量分類法的實驗變因設計

第三章 研究方法

3.5 實驗步驟

3.5.7 中心向量分類法的實驗變因設計

根據 3.4 節所描述的研究考量因素,包括了相關向量的正規化問題,以及 DS 矩 陣與 D 矩陣的取捨,本研究設計了多種控制變因的方式,以不同的組合進行分類的訓 練與測試,以便比較在各種不同變因下所的的分類結果。以下即說明以中心向量法作為 分類法時,與 LSI 搭配的各種變因組合。

(1) LSI 與中心向量法變因組合 1

‧ 執行 GTP 時對原始的 (未降階前的) 文件向量進行正規化處理。

‧ 以 DS 矩陣的列向量作為訓練文件的文件向量。

‧ 以 XTtestT 矩陣的列向量作為測試文件的文件向量。

‧ 對 DS 矩陣中的列向量進行正規化處理。

(2) LSI 與中心向量法變因組合 2

‧ 執行 GTP 時對原始的 (未降階前的) 文件向量進行正規化處理。

‧ 以 DS 矩陣的列向量作為訓練文件的文件向量。

‧ 以 XTtestT 矩陣的列向量作為測試文件的文件向量。

‧ 對 DS 矩陣中的列向量不進行正規化處理。

(3) LSI 與中心向量法變因組合 3

‧ 執行 GTP 時對原始的 (未降階前的) 文件向量不進行正規化處理。

‧ 以 DS 矩陣的列向量作為訓練文件的文件向量。

‧ 以 XTtestT 矩陣的列向量作為測試文件的文件向量。

‧ 對 DS 矩陣中的列向量進行正規化處理。

(4) LSI 與中心向量法變因組合 4

‧ 執行 GTP 時對原始的 (未降階前的) 文件向量不進行正規化處理。

‧ 以 DS 矩陣的列向量作為訓練文件的文件向量。

‧ 以 XTtestT 矩陣的列向量作為測試文件的文件向量。

‧ 對 DS 矩陣中的列向量不進行正規化處理。

(5) LSI 與中心向量法變因組合 5

‧ 執行 GTP 時對原始的 (未降階前的) 文件向量進行正規化處理。

‧ 以 D 矩陣的列向量作為訓練文件的文件向量。

‧ 以 XTtestT 矩陣的列向量作為測試文件的文件向量。

‧ 對 D 矩陣中的列向量進行正規化處理。

(6) LSI 與中心向量法變因組合 6

‧ 執行 GTP 時對原始的 (未降階前的) 文件向量進行正規化處理。

‧ 以 D 矩陣的列向量作為訓練文件的文件向量。

‧ 以 XTtestTS1 矩陣的列向量作為測試文件的文件向量。

‧ 對 DS 矩陣中的列向量進行正規化處理。

(7) LSI 與中心向量法變因組合 7

‧ 執行 GTP 時對原始的 (未降階前的) 文件向量進行正規化處理。

‧ 以 D 矩陣的列向量作為訓練文件的文件向量。

‧ 以 XTtestT 矩陣的列向量作為測試文件的文件向量。

‧ 對 D 矩陣中的列向量不進行正規化處理。

(8) LSI 與中心向量法變因組合 8

‧ 執行 GTP 時對原始的 (未降階前的) 文件向量進行正規化處理。

‧ 以 D 矩陣的列向量作為訓練文件的文件向量。

‧ 以 XTtestTS1 矩陣的列向量作為測試文件的文件向量。

‧ 對 D 矩陣中的列向量不進行正規化處理。

(9) LSI 與中心向量法變因組合 9

‧ 執行 GTP 時對原始的 (未降階前的) 文件向量不進行正規化處理。

‧ 以 D 矩陣的列向量作為訓練文件的文件向量。

‧ 以 XTtestT 矩陣的列向量作為測試文件的文件向量。

‧ 對 D 矩陣中的列向量進行正規化處理。

(10) LSI 與中心向量法變因組合 10

‧ 執行 GTP 時對原始的 (未降階前的) 文件向量不進行正規化處理。

‧ 以 D 矩陣的列向量作為訓練文件的文件向量。

‧ 以 XTtestTS1 矩陣的列向量作為測試文件的文件向量。

‧ 對 DS 矩陣中的列向量進行正規化處理。

(11) LSI 與中心向量法變因組合 11

‧ 執行 GTP 時對原始的 (未降階前的) 文件向量不進行正規化處理。

‧ 以 D 矩陣的列向量作為訓練文件的文件向量。

‧ 以 XTtestT 矩陣的列向量作為測試文件的文件向量。

‧ 對 D 矩陣中的列向量不進行正規化處理。

(12) LSI 與中心向量法變因組合 12

‧ 執行 GTP 時對原始的 (未降階前的) 文件向量不進行正規化處理。

‧ 以 D 矩陣的列向量作為訓練文件的文件向量。

‧ 以 XTtestTS1 矩陣的列向量作為測試文件的文件向量。

‧ 對 D 矩陣中的列向量不進行正規化處理。

上述 12 種變因組合可以表 3-3 簡要表示。

表 3-3 LSI 搭配中心向量法的實驗變因組合。

變因 組合 1 2 3 4 5 6 7 8 9 10 11 12

執行 GTP 時對原始文件向量 進行正規化

9 9 9 9 9 9

使用 DS 計算分類向量 9 9 9 9

使用 D 計算分類向量 9 9 9 9 9 9 9 9

對 DS 或 D 進行正規化 9 9 9 9 9 9 使用 XTtestT 處理測試文件 9 9 9 9 9 9 9 9 使用 XTtestTS1 處理測試文件 9 9 9 9

至於在對照組傳統向量空間法的實驗中,根據 3.4 節的描述,只有兩組的變因組合:

(1) 傳統向量空間法與中心向量法變因組合 1

‧ 執行 GTP 時對原始的 (未降階前的) 文件向量進行正規化處理,如此可得到 可供向量空間法使用而已正規化的文件向量。

(2) 傳統向量空間法與中心向量法變因組合 2

‧ 執行 GTP 時對原始的 (未降階前的) 文件向量不進行正規化處理,如此可得 到可供向量空間法使用而未正規化的文件向量。

相關文件