第三章 研究方法
3.5 實驗步驟
3.5.7 中心向量分類法的實驗變因設計
根據 3.4 節所描述的研究考量因素,包括了相關向量的正規化問題,以及 DS 矩 陣與 D 矩陣的取捨,本研究設計了多種控制變因的方式,以不同的組合進行分類的訓 練與測試,以便比較在各種不同變因下所的的分類結果。以下即說明以中心向量法作為 分類法時,與 LSI 搭配的各種變因組合。
(1) LSI 與中心向量法變因組合 1
‧ 執行 GTP 時對原始的 (未降階前的) 文件向量進行正規化處理。
‧ 以 DS 矩陣的列向量作為訓練文件的文件向量。
‧ 以 XTtestT 矩陣的列向量作為測試文件的文件向量。
‧ 對 DS 矩陣中的列向量進行正規化處理。
(2) LSI 與中心向量法變因組合 2
‧ 執行 GTP 時對原始的 (未降階前的) 文件向量進行正規化處理。
‧ 以 DS 矩陣的列向量作為訓練文件的文件向量。
‧ 以 XTtestT 矩陣的列向量作為測試文件的文件向量。
‧ 對 DS 矩陣中的列向量不進行正規化處理。
(3) LSI 與中心向量法變因組合 3
‧ 執行 GTP 時對原始的 (未降階前的) 文件向量不進行正規化處理。
‧ 以 DS 矩陣的列向量作為訓練文件的文件向量。
‧ 以 XTtestT 矩陣的列向量作為測試文件的文件向量。
‧ 對 DS 矩陣中的列向量進行正規化處理。
(4) LSI 與中心向量法變因組合 4
‧ 執行 GTP 時對原始的 (未降階前的) 文件向量不進行正規化處理。
‧ 以 DS 矩陣的列向量作為訓練文件的文件向量。
‧ 以 XTtestT 矩陣的列向量作為測試文件的文件向量。
‧ 對 DS 矩陣中的列向量不進行正規化處理。
(5) LSI 與中心向量法變因組合 5
‧ 執行 GTP 時對原始的 (未降階前的) 文件向量進行正規化處理。
‧ 以 D 矩陣的列向量作為訓練文件的文件向量。
‧ 以 XTtestT 矩陣的列向量作為測試文件的文件向量。
‧ 對 D 矩陣中的列向量進行正規化處理。
(6) LSI 與中心向量法變因組合 6
‧ 執行 GTP 時對原始的 (未降階前的) 文件向量進行正規化處理。
‧ 以 D 矩陣的列向量作為訓練文件的文件向量。
‧ 以 XTtestTS−1 矩陣的列向量作為測試文件的文件向量。
‧ 對 DS 矩陣中的列向量進行正規化處理。
(7) LSI 與中心向量法變因組合 7
‧ 執行 GTP 時對原始的 (未降階前的) 文件向量進行正規化處理。
‧ 以 D 矩陣的列向量作為訓練文件的文件向量。
‧ 以 XTtestT 矩陣的列向量作為測試文件的文件向量。
‧ 對 D 矩陣中的列向量不進行正規化處理。
(8) LSI 與中心向量法變因組合 8
‧ 執行 GTP 時對原始的 (未降階前的) 文件向量進行正規化處理。
‧ 以 D 矩陣的列向量作為訓練文件的文件向量。
‧ 以 XTtestTS−1 矩陣的列向量作為測試文件的文件向量。
‧ 對 D 矩陣中的列向量不進行正規化處理。
(9) LSI 與中心向量法變因組合 9
‧ 執行 GTP 時對原始的 (未降階前的) 文件向量不進行正規化處理。
‧ 以 D 矩陣的列向量作為訓練文件的文件向量。
‧ 以 XTtestT 矩陣的列向量作為測試文件的文件向量。
‧ 對 D 矩陣中的列向量進行正規化處理。
(10) LSI 與中心向量法變因組合 10
‧ 執行 GTP 時對原始的 (未降階前的) 文件向量不進行正規化處理。
‧ 以 D 矩陣的列向量作為訓練文件的文件向量。
‧ 以 XTtestTS−1 矩陣的列向量作為測試文件的文件向量。
‧ 對 DS 矩陣中的列向量進行正規化處理。
(11) LSI 與中心向量法變因組合 11
‧ 執行 GTP 時對原始的 (未降階前的) 文件向量不進行正規化處理。
‧ 以 D 矩陣的列向量作為訓練文件的文件向量。
‧ 以 XTtestT 矩陣的列向量作為測試文件的文件向量。
‧ 對 D 矩陣中的列向量不進行正規化處理。
(12) LSI 與中心向量法變因組合 12
‧ 執行 GTP 時對原始的 (未降階前的) 文件向量不進行正規化處理。
‧ 以 D 矩陣的列向量作為訓練文件的文件向量。
‧ 以 XTtestTS−1 矩陣的列向量作為測試文件的文件向量。
‧ 對 D 矩陣中的列向量不進行正規化處理。
上述 12 種變因組合可以表 3-3 簡要表示。
表 3-3 LSI 搭配中心向量法的實驗變因組合。
變因 組合 1 2 3 4 5 6 7 8 9 10 11 12
執行 GTP 時對原始文件向量 進行正規化
9 9 9 9 9 9
使用 DS 計算分類向量 9 9 9 9
使用 D 計算分類向量 9 9 9 9 9 9 9 9
對 DS 或 D 進行正規化 9 9 9 9 9 9 使用 XTtestT 處理測試文件 9 9 9 9 9 9 9 9 使用 XTtestTS−1 處理測試文件 9 9 9 9
至於在對照組傳統向量空間法的實驗中,根據 3.4 節的描述,只有兩組的變因組合:
(1) 傳統向量空間法與中心向量法變因組合 1
‧ 執行 GTP 時對原始的 (未降階前的) 文件向量進行正規化處理,如此可得到 可供向量空間法使用而已正規化的文件向量。
(2) 傳統向量空間法與中心向量法變因組合 2
‧ 執行 GTP 時對原始的 (未降階前的) 文件向量不進行正規化處理,如此可得 到可供向量空間法使用而未正規化的文件向量。