個別特徵在語音文件上的檢索效能

5. 語音文件檢索

5.4 個別特徵在語音文件上的檢索效能

對語音自動轉寫文件我們亦抽取與第 3.4 節等同之特徵種類。以下分別對擷取特徵中的相近度模型及機率模型等傳統檢索方法，在 TDT-2 經由 Dragon 辨識器所轉寫之語音文件上，單獨用傳統檢索方法進行檢索之檢索效能。

VSM

檢索方法為 VSM 時，其平均精確率結果如圖 5.2。由圖中可發現，，VSM-0 的表現最好，和語音正確轉寫文件上的結果相同。但是，在具有錯誤資訊的語音文件上，不論是 VSM-0、VSM-1 或 VSM-2 都降低了原本的檢索效能。由此可以得

0.5104

0.41

0.3909

0.2 0.25 0.3 0.35 0.4 0.45 0.5 0.55

VSM-0 VSM-1 VSM-2

檢索方法

平均精確率

圖 5.2 實驗於 TDT-2 Dragon 辨識器轉寫之語音文件 VSM 之 MAP

知，含有錯誤資訊的語音文件，對檢索效能會有所影響。圖 5.3 為均化遞減累積獲益結果，同樣可以發現，VSM-0 的成效依然最佳。

0.2 0.25 0.3 0.35 0.4 0.45 0.5 0.55 0.6 0.65 0.7

1 10 19 28 37 46 55 64 73 82 91 10

位置

均化遞減累積獲益

VSM-0 VSM-1 VSM-2

圖 5.3 實驗於 TDT-2 Dragon 辨識器轉寫之語音文件 VSM 之 NDCG

BM25

檢索方法為 BM25 時，其各個參數設定下的平均精確率如表 5.3 所示。

由表 5.3 可得知，最佳平均精確率值的參數設定為k=0.1，b=0.01。而平均精確率的結果亦較實驗於 TDT-2 語音正確轉寫文件上為低。含有錯誤資訊的語料，

同樣影響了 BM25 的檢索成效。圖 5.4 為均化遞減累積獲益之結果，同樣在參數設定為k=0.1，b=0.01時成效最好。

模型名稱 k b MAP BM25_01_001 0.1 0.01 0.5490 BM25_05_001 0.5 0.01 0.4652 BM25_10_001 1.0 0.01 0.4360 BM25_01_050 0.1 0.50 0.5094 BM25_01_005 0.1 0.05 0.5383 BM25_010_010 0.1 0.10 0.5369

BM25_20_075 2.0 0.75 0.3248

表 5.3 實驗於 TDT-2 Dragon 辨識器轉寫之語音文件 BM25 各種參數設定的 MAP

0.2 0.3 0.4 0.5 0.6 0.7 0.8

1 10 19 28 37 46 55 64 73 82 91 100

位置

均化遞減累積獲益

BM25_01_001 BM25_10_001 BM25_20_075 BM25_01_050

圖 5.4 實驗於 TDT-2 Dragon 辨識器轉寫之語音文件 BM25 各種參數調整下之 NDCG

LSI

在 LSI 檢索方法中，圖 5.5 為在不同維度設定下，平均精確率的變化曲線。可以看出，當維度越大時，平均精確率有明顯的下降。維度越大，代表所採用的資訊

0.5672

0.5718

0.5567

0.5519

0.5485

0.535 0.54 0.545 0.55 0.555 0.56 0.565 0.57 0.575

100 200 300 400 500

維度

平均精確率

圖 5.5 實驗於 TDT-2 Dragon 辨識器轉寫之語音文件 LSI 各個維度的 MAP

0.4 0.45 0.5 0.55 0.6 0.65 0.7 0.75

1 10 19 28 37 46 55 64 73 82 91 100

位置

均化遞減累積獲益

Dimension=100 Dimension=200 Dimension=300

圖 5.6 實驗於 TDT-2 Dragon 辨識器轉寫之語音文件 LSI 各個維度的 NDCG

越多，那麼在含有錯誤資訊的語音轉寫文件上，錯誤量也會提升，因此，平均精確率的效能會下降。而在圖 5.6 中，當維度為 100、200 及 300 時檢索序列中各個位置的均化遞減累積獲益。這和語音正確轉寫文件的結果不同，在語音正確轉寫文件中，維度為 300 時表現的整體均化遞減累積獲益最佳。然而，從圖 5.6 中，

我們發現，在維度為 300 時，其表現較維度 100 及維度 200 為差。維度 300 時，

錯誤的資訊影響到了資訊檢索的結果，而檢索效能因而下降。

LM

表 5.4 為 LM 在參數λ 的調整下，不同的平均精確率結果。可以發現，在參數設定λ =0.09 時的平均精確率最高。此平均精確率結果一樣低於在語音正確轉寫文件上的檢索效能。而在圖 5.7 中，均化遞減累積獲益相較於語音正確轉寫文件的結果，依然因文件錯誤率，而降低了檢索效能。

模型名稱 λ MAP 模型名稱 λ MAP

LM001 0.01 0.4510 LM007 0.07 0.5354 LM002 0.02 0.5058 LM008 0.08 0.5461 LM003 0.03 0.5180 LM009 0.09 0.5462 LM004 0.04 0.5253 LM010 0.10 0.5456 LM005 0.05 0.5206 LM020 0.20 0.5415 LM006 0.06 0.5306 LM090 0.90 0.4345 表 5.4 實驗於 TDT-2 Dragon 辨識器轉寫之語音文件 LM 各種參數設定下的 MAP

0.3 0.35 0.4 0.45 0.5 0.55 0.6 0.65 0.7 0.75

1 10 19 28 37 46 55 64 73 82 91 100

位置

均化遞減累積獲益

LM_010 LM_020 LM_090

圖 5.7 實驗於 TDT-2 Dragon 辨識器轉寫之語音文件 LM 各種參數設定下的 NDCG

在文檔中使用機器學習方法於語音文件檢索之研究 (頁 87-93)

5. 語音文件檢索

5.4 個別特徵在語音文件上的檢索效能

 VSM

 BM25

 LSI

 LM

VSM

BM25

LSI

LM