• 沒有找到結果。

第六章 實驗評估

6.2 評估推薦查詢標籤方法之效果

6.2.2 實驗方法

我們假設使用者瀏覽一個推薦標籤所需花費的成本為Cost (目前設為整數t

值 2),而瀏覽一個物件所需要的成本為Cost (目前設為整數值 1)。這些成本值的o

大小設定是認為使用者瀏覽推薦標籤字詞時,必頇花費較多時間思考推薦字詞和 查詢之間的關係,相較之下,瀏覽一個物件可以很直觀、快速的判斷。

此外,假設使用者會由上而下依照系統所計算出的關聯代表性程度高低排名 進行瀏覽,且進行瀏覽時使用者清楚了解系統所推薦的標籤字詞跟查詢之間的關 係,若是與查詢無關的推薦標籤則不會對包含此標籤字詞的物件進行瀏覽。

在以上假設下,我們以章節 6.2.1 中所述的 1,000 筆測詴資料的查詢字分別 輸入本系統進行查詢。查詢標籤之推薦,由電腦依系統所推薦的第一名推薦標籤 加入為查詢進行搜尋,並檢查搜尋結果可是否有包含該測詴資料之物件編號。

若有找到,則計算此次搜尋所需花費成本;若找不到,則改用系統所推薦的 下一個推薦標籤字詞加入查詢,並依同樣方法進行實驗。若在所推薦的第 i 個推

51

52

相關性方法一及相關性方法二,系統將會依其計算方法挑選出相關性程度值 最高的前 25 個標籤字詞當作推薦字。

Random walk with restart 方法是藉由計算節點跟節點之間的連結關係程度,

評估各節點在圖形結構中的重要性分數。而本論文將此概念應用在標籤字詞與標 籤字詞之間,藉由將標籤字詞間的相關性分數作為連結關係的重要性分數值,以

Random walk with restart 方法得到各標籤字詞在字詞間的重要性分數並依照高低 進行排名。本論文也將評估相關性方法一及相關性方法二加上 Random walk with

restart [21]後對效果的影響。

相關性方法三是依照相關性方法一計算方法挑選相關性程度值最高的前

100 名,再進行 Random walk with restart 的程度值收斂,且將收斂次數設定為 30 次,經收斂後也同樣挑選出前 25 名當作推薦標籤。而相關性方法四則是使用相 關性方法二的計算方式,以同樣方法挑選推薦標籤。表 6.1 為[實驗 1.1]所使用的 各相關性方法:

表 6.1 實驗 1.1 所使用的相關性方法

方法名稱 計算方法

相關性方法一 Confidence

相關性方法二 Jaccard

相關性方法三 Confidence with Randomwalk 相關性方法四 Jaccard with Randomwalk

53

表 6.2 為僅考慮相關性分數做為計算關聯代表性程度的評估結果,實驗結果 中綜合考量 SQ_rate 及 Avg_cost 兩項數據,可以發現相關性方法四所需花費之

Avg_cost 高於相關性方法一,而相關性方法二則略高於相關性方法一。相關性方 法三雖然 Avg_cost 大幅低於相關性方法一,但相關性方法三的 SQ_rate 卻相當 低。就整體而言,使用相關性方法一或相關性方法二作為計算相關性程度的方法 都可以得到有效的結果,但仍然無法決定出一個最好的評估依據,故以下將再採 取相關性方法一及相關性方法二繼續進行實驗的評估。

表 6.2 評估不同相關性計算方法之結果

相關性方法一 相關性方法二 相關性方法三 相關性方法四

SQ_rate 75.60% 65.80% 25.50% 43.50%

Avg_cost 1174.0 1248.75 393.1 1450.29

[實驗1.2] 評估不同相關性結合多樣性之計算方法

在這個實驗中,我們將評估同時考慮相關性和多樣性來做為評估關聯代表性 程度的方法,將採用兩種不同相關性方法,分別為相關性方法一及相關性方法二。

多樣性方法則採用章節 4.3 中所介紹的兩種方法,多樣性方法一以算式五為計算 方法,多樣性方法二則採用算式六。以上述兩種相關性方法及兩種多樣性方法組 合共四種計算方式如下表 6.3,且相關性與多樣性比重的設定(算式七中參數 w) 設為 0.5,挑選出 score 值最高的前 25 個做為推薦標籤進行實驗。

54

55

56

薦標籤字詞及候選字詞在包含查詢字物件中的比例,而非僅考慮已推薦標籤字詞 或候選字詞,因若只考慮一方面的影響因素並不夠全面,會導致在計算關聯代表 性時提昇較罕見字詞的重要性程度。整合上述的分析,本論文將採用關聯代表性 方法一作為評估字詞的關聯代表性方法。

[實驗1.3] 評估推薦不同個數的標籤字詞對效果的影響

這個實驗將評估推薦不同個數的標籤字詞對瀏覽成本的影響。在此實驗中將 評估沒有推薦任何標籤字詞(R-baseline)、推薦 5 個的標籤字詞(1LV-5) 、推薦 10 個的標籤字詞(1LV-10) 、推薦 15 個的標籤字詞(1LV-15) 、推薦 20 個的標籤字 詞(1LV-20)及推薦 25 個標籤字詞(1LV-25)之間瀏覽成本的比較。

由表 6.7 發現不論在 SQ_rate 或 Avg_cost 兩方面,有進行查詢標籤推薦的各 組合之 Avg_cost 都大幅低於 R-baseline 的 Avg_cost,隨著推薦的標籤字詞個數 越多 SQ_rate 也隨之上升,當推薦字詞從 5 增加到 20 時,Avg_cost 則會隨之下 降。但當推薦字詞增加到 25,SQ_rate 則有較多幅度的提升,Avg_cost 卻略微增 加,我們認為主因是多推薦的 5 個標籤字所包含的物件資料較多的緣故,這也可 以從推薦 20 個增加到 25 時 SQ_rate 有顯著增加得到應證。整合上述的分析,我 們認為 1LV-25 的組合不論在 SQ_rate 或 Avg_cost 都有較好的表現。

57

表 6.7 推薦不同個數標籤字詞之瀏覽成本

1LV-5 1LV-10 1LV-15 1LV-20 1LV-25 R-baseline

SQ_rate 54.20% 58.80% 63.20% 66.10% 75.90% 100.00%

Avg_cost 1399.92 1172.32 1115.31 1076.308 1172.87 4214.711

[實驗1.4] 評估單層及雙層式查詢標籤推薦對效果的影響

這個實驗將比較使用單層推薦字(1LV)跟雙層推薦字(2LV)的瀏覽成本差 異。

實驗中將分成使用 1LV 和 2LV 兩組情況。1LV 只使用一層的推薦字詞進行 搜尋,2LV 則使用雙層的推薦字詞進行搜尋,在此的雙層是指採用第一層的推薦 字並結合原查詢字當作新的查詢字,再進行一次標籤字詞的推薦。在 2LV 中進 行搜尋時,我們假設若加上第一層及第二層的推薦字詞為查詢且搜尋不到所對應

的指定物件,則考慮只加上第一層之推薦字進行搜尋,例如若”apple, fruit,

red”、”apple, fruit, color”等組合都搜尋不到指定物件則採用”apple, fruit”再搜尋一 次。在此部分實驗中,我們想評估推薦不同個數的第一層推薦字對 SQ_rate 或

Avg_cost 效果的影響,考慮使用面向搜尋介面時多數使用者對於少量的資訊接受 度較高及[實驗 1.3]中效果最好的組合,在此採用推薦 5 個標籤字詞跟 25 個標籤 字詞進行實驗。

由表 6.8 中可發現比較使用單層推薦字 1LV-5 跟使用雙層推薦字 2LV-5 5

58

進行搜尋時其瀏覽成本有很大幅度的縮減,而 1LV-25 及 2LV-25 5 的組合亦有 同樣結果。至於 1LV-5 及 2LV-5 5 的組合中 SQ_rate 的減少是因為採用了章節

4.3.2 中所提出之挑選機制,使得一些相關程度高的字詞從第一層的候選字詞中 刪除,推薦 25 個標籤字詞的組合也是有相同狀況。比較推薦 5 個及 25 個標籤字 詞組合,可以發現推薦 5 個標籤字詞的組合中 SQ_rate 大約下降 2.4%,Avg_cost 則降低 570;推薦 25 個標籤字詞的組合 SQ_rate 大約下降 6.1%,而 Avg_cost 則只降低 492.81。整體來說,使用雙層的推薦字詞確實可有效降低瀏覽成本,且 經過實驗證實雙層式推薦字詞中第一層採用推薦 5 個標籤字詞並進行雙層式的 查詢標籤推薦,因此組合在 SQ_rate 的下降跟 Avg_cost 的減少都有比較顯著的 效果。

表 6.8 評估單層及雙層式查詢標籤推薦對瀏覽成本之影響結果

1LV-5 2LV-5 5 1LV-25 2LV-25 5

SQ_rate 54.20% 51.80% 75.90% 69.50%

Avg_cost 1399.92 829.12 1172.87 680.06

[實驗1.5] 評估推薦不同個數雙層式查詢標籤推薦對效果的影響

這部份的實驗將評估推薦不同個數的雙層推薦字對 SQ_rate 及 Avg_cost 效 果的影響,我們將設定第一層推薦字詞個數為 5 並比較推薦第二層標籤字詞個數 為 5、10、15、20 及 25 時效果的變化。

從表 6.9 中可以觀察到第二層推薦字詞越多時,Avg_cost 隨之減少,但

59

SQ_rate 卻有下降的趨勢,我們認為會有此現象是因為採用了章節 4.3.2 中所提出 之挑選機制,雖可有效避免挑選重複的相關推薦字詞,但是當推薦的字詞個數多 時,反而會造成第一層推薦標籤的候選字詞刪除過多,造成所推薦的標籤字詞效 果不佳。由於 SQ_rate 及 Avg_cost 之間的取捨是一個兩難問題(trade-off),但就 查詢處理而言,SQ_rate 是一個比較重要的考量。故在此我們認為 2LV-5 5 有最

好的效果。

表 6.9 評估推薦不同個數雙層式推薦字詞對效果的影響結果

2LV-5 5 2LV-5 10 2LV-5 15 2LV-5 20 2LV-5 25

SQ_rate 51.80% 49.40% 48.10% 45.40% 44.50%

Avg_cost 829.12 691.54 653.59 552.09 535.91

[實驗1.6] 評估計算關聯代表性程度時不同權重值對效果的影響

這個實驗將評估算式七中權重值 w 的變化對於瀏覽成本的影響,權重值 w 的大小代表著計算關聯代表性程度中相關性及多樣性的比例。我們將使用權重值 0.1、0.3、0.5、0.7 及 0.9 代入雙層的推薦(2LV-5 5),並觀察瀏覽成本的變化。

由表 6.10 可以觀察到在各權重值中 SQ_rate 及 Avg_cost 的效果差異不大,

但在權重值 w 值為 0.1 或 0.9 時效果稍弱,故可發現當權重值 w 設定過大或過小 時其並無特別顯著。

就各組的 SQ_rate 及 Avg_cost 效果的綜合表現,0.3、0.5、0.7 的組合表現

60

差異不大,折衷考量兩項表現,故選擇 0.5 的組合。

表 6.10 不同計算關聯代表性程度權重值之瀏覽成本

0.1 0.3 0.5 0.7 0.9

SQ_rate 46.20% 51.10% 51.80% 52.00% 51.60%

Avg_cost 915.33 795.05 829.116 870.421 876.027

[實驗1.7] 評估不同頻率查詢字所推薦字詞對效果的影響

這部份的實驗將比較使用不同出現頻率的查詢字對所推薦標籤字詞進行搜 尋時效果的差異。在此將分別評估頻率為 10-200、200-400、400-600、600-800、

800-1000、1000-1200、1200-1400、1400-1600、1600-1800 及 1800-2000 共十組 不同頻率的查詢字,實驗數量每組各 100 個查詢字。實驗方法為使用各組查詢字 進行雙層式查詢標籤的推薦並將參數 w 設定為 0.5。

從圖 6.1 中可觀察到各不同出現頻率的查詢字所搜尋到的 SQ_rate,大約分 布在 56%~71%當中,整體帄均約為 64.1%。從這些數據可結論,本論文所採用 之推薦查詢字方法,不論生冷字詞的查詢字抑或熱門的查詢字都可以得到穩定的 搜尋效果。

61

相關文件