• 沒有找到結果。

評估索引結構與搜尋方法之效果

第六章 實驗評估

6.3 評估索引結構與搜尋方法之效果

6.3 評估索引結構與搜尋方法之效果

這部份的實驗目的是要評估索引結構與搜尋方法中各門檻值對帄均搜尋執 行時間之影響,在建立索引結構中有聚集門檻值參數 ,而在進行搜尋時則有集

合包含程度值 及查詢關鍵字個數

| q |

兩個變數,以下將分別評估這三個變數對

帄均搜尋執行時間所造成的影響。

不同個數關鍵字的查詢、不同聚集門檻值所建立的索引結構跟不同包含程度 值的查詢都會對系統實際搜尋的執行時間造成影響。實驗主要分成三部份,[實 驗 2.1] 評估給定不同建立索引結構中聚集門檻值對搜尋執行時間的影響,[實驗

2.2] 評估給定不同個數關鍵字的查詢對搜尋執行時間的影響,[實驗 2.3] 則評估 給定不同的集合包含程度門檻值對搜尋執行時間的影響。

6.3.1 測詴資料

本部份的實驗需比較不同個數關鍵字的查詢,蒐集方法為隨機挑選一個物件,

再由此物件中挑選一個出現頻率大於 100 的標籤當作查詢字。而我們將採用此方 法分別蒐集各 100 個查詢中標籤個數為 1、2、3 及 4 的資料來進行實驗。

6.3.2 實驗方法

實驗方法為將蒐集到的查詢字分別輸入以不同參數的情況進行搜尋,分別評 估不同建立索引結構中聚集門檻值、不同關鍵字個數的查詢字及不同集合包含程

64

度門檻值對系統進行搜尋時執行時間的影響。而本部份的實驗也將與最直接的搜 尋方法(I-baseline)進行比較,在此最直接的搜尋方法指的是未利用任何索引結構 支援的搜尋處理,也就是與資料集中所有物件的標籤集合逐一進行比對。

6.3.3 實驗評估

[實驗2.1] 評估給定不同建立索引結構中聚集門檻值對搜尋執行時間的影響

在這個實驗中固定索引結構門檻值

Object size

為 20,評估聚集門檻值 200、

400、600 及 1000 對搜尋執行時間的變化,並將集合包含程度門檻值設定為 1.0 觀察查詢中字數分別為 1、2、3 及 4 時,搜尋執行時間的變化。此外,亦評估不 同集合包含程度門檻值在不同索引結構門檻值時搜尋執行時間的變化。

圖 6.3 中有四條曲線,分別以關鍵字個數為 1、2、3 及 4 的查詢進行搜尋且 =1.0,從圖中可以發現當查詢字個數為 1 時在 =200 有最好的效果,而在 =1000 則最差;在查詢字個數為 4 時在 =1000 有最好的效果,而在 =200 則最差。我 們認為會有這些現象是因為在要求查詢比對完全正確( =1.0)的情況下字數越長

的查詢在本論文所推薦的搜尋方法中越容易對整個群集有判定不相關的情況出 現,反之字數越少的查詢,則越需要進行多次的判斷,甚至需要對整個群集中的 所有物件的標籤集合逐一進行比對,故才造成執行時間的增加。

65

圖 6.3 評估不同個數關鍵字的查詢在不同聚集門檻值中的搜尋執行時間

圖 6.4 中亦有四條曲線,分別以集合包含程度值 0.25、0.5、0.75 及 1.0 進行

搜尋且

| | 4 q

,從圖中可以發現當集合包含程度值為 0.25 時在 =200 有最好的效

果,而在 =1000 則最差;集合包含程度值為 1.0 的曲線則同圖 6.3 中曲線 Length4

相同。

0.4 0.45 0.5 0.55 0.6 0.65 0.7

200 400 600 800 1000

Execution time (sec)

Index Threshold

Length 1 Length 2 Length 3 Length 4

66

67

68

69

相關文件