實驗結果

第六章實驗評估與討論

6.3 本系統內部採用方法之效果比較

6.3.2 實驗結果

以下實驗是使用 Google 搜尋引擎進行查詢並擷取查詢結果做為資料集。執行時設定主題查詢字詞數量 n=10，QS=50；LDA 的參數設定為 α=0.2，β=0.1，

分群數則參考 n 設定為 10 群。

【實驗 1-1】評估有參考亂度的新穎程度值計算中不同 δ 值的設定對選出的主 題查詢字詞在查詢結果選擇率、重覆率與選擇率方面的影響 此實驗是針對階層架構中第一層主題查詢字詞的挑選過程，計算新穎程度值時參考亂度的比例設定δ 對於挑選結果涵蓋率、重覆率與選擇率的影響，實驗結

49 件內容為‘image courtesy japan meteorology agency blue marble surface image

L2 frequency-based: λ

L2 Coverage L2 Overlap L2 Selectivity

courtesy nasa idy28000 government bureau’，其中 image 是系統選出的主題查詢字詞。除了 image 與其他單字的共同出現次數會大於 1 之外，其餘任兩單字的共同

vertex weight: μ

Coverage Overlap Selectivity

算出來，沒有參考節點加權值，從實驗結果可知只有用單字之間的關係計算的語意明確度無法提升涵蓋率；當μ 介於 0.1 至 0.9 時相當於加重每一個節點自己的重要性分數，從圖 6.3 的實驗結果可知，著重單字本身在 T 中的重要性無法有效提升推薦架構在 T 的涵蓋率、重覆率與選擇率，這可能是因為我們處理的資料中扣除主題查詢字詞後單字大多出現頻率不高且近似，造成 TF-IDF 的效果有限不適合做為主要的分數來源。因此我們認為在μ=1.0 時，會使涵蓋率及選擇率較高而重覆率較低的情形是最佳的設定，也就是我們需要同時考慮單字與其他字的關係及其本身的重要性。

【實驗 1-4】單字相鄰位置關係圖中採用不同邊權重值計算方式對於次主題查 詢字詞在查詢結果的涵蓋率、重覆率及選擇率之影響

這個實驗是針對單字語意明確程度的計算中，使用頻率式和語意式的邊權重值估算對於產生的次主題查詢字詞在涵蓋率、重覆率與選擇率的影響。執行時加入亂度的新穎程度值 δ 設為 0.9，頻率式邊權重中則是 λ 設為 0.9，節點加權值 μ=1.0。

圖 6.4 中我們可看出在關係圖的兩種邊權重值計算方式的實驗，顯示兩種方式所算出的字詞語意明確度，對於最後選出的次主題查詢字詞在涵蓋率、重覆率以及選擇率都只有些微的差距。另外，從圖 6.5 與圖 6.6 所呈現的推薦結果我們能夠發現，頻率式產生的推薦字詞相較於語意式來說，較像主題性推薦字詞，例如頻率式推薦字詞中 barack lady 可能是指 barack 家的女仕，相對於語意式所推薦的 barack sr 表示美國總統歐巴馬之父親，或 barack sasha 為歐巴馬女兒之姓名等，語意式較能讓使用者了解推薦字詞表達的具體物件。基於兩種方式在評估效

果的三種數值上表現相當，但是使用語意式邊權重值所產生的次主題查詢字詞語意較為明確，因此本論文在後續的實驗中是採用語意式做為邊權重值計算的方法。

圖 6.4 不同邊權重值計算方式的實驗結果

圖 6.5 語意式邊權重值計算方式的推薦結果 0

0.1 0.2 0.3 0.4 0.5 0.6

L2 Coverage L2 Overlap L2 Selectivity

Edge weight counting way

semantic-based frequency-based

圖 6.6 頻率式邊權重值計算方式的推薦結果

【實驗 1-5】評估各主題查詢字詞下次主題查詢字詞的推薦數量決定方式對於 所找出的階層式推薦架構在查詢結果的涵蓋率、重覆率以及選擇率 之影響

圖 6.7 第二層推薦數量的分配方式

圖 6.7 中我們可以發現動態決定各主題查詢字詞的推薦數量，相較於平均分配來說能夠在重覆率增加幅度低的情況下使涵蓋率有效增加，表示若使第二階層

0 0.1 0.2 0.3 0.4 0.5

L2 Coverage L2 Overlap L2 Selectivity

Level2 suggestion size

Dynamic way Average way

中每一群的推薦數量都相同，則涵蓋率低的主題查詢字詞可能會出現篩選率低的推薦字詞。舉例來說，一個主題查詢字詞只有涵蓋 2 個物件，假設用平均數量的方式必須產生 5 個次主題查詢字詞，因此最佳的情況是一個次主題查詢字詞就能涵蓋該 2 筆物件，那麼其餘 4 個推薦字詞便會造成，使得使用者難以透過推薦字詞瀏覽到各個物件。

【實驗 1-6】評估查詢字詞的不同長度對推薦字詞在涵蓋率、重複率及選擇率 影響

本論文方法沒有限制查詢字詞之長度，但是經計算後可知我們所使用的測試查詢字平均長度約為 2.5 個英文單字，因此以 2.5 作為長短查詢字詞之分界觀察本論文方法在長短查詢字詞的處理效果。

表 6.1 查詢字長度與推薦結果的關係

L1 L2 topCoverage

length Coverage Overlap Selectivity Coverage Overlap Selectivity L2 whole

< 3 0.7952 0.2036 0.5537 0.4500 0.0569 0.3969 0.4667 0.81

>= 3 0.8824 0.2430 0.5019 0.5121 0.0684 0.4471 0.5344 0.9026

表 6.1 顯示出本論文方法對於長查詢字詞的搜尋結果涵蓋效果較佳，且能涵蓋搜尋結果排序前 50 中較多比例物件。我們推測可能的原因是短查詢字通常包含的語意概念較多且廣，因此在一個給定數量的推薦條件之下涵蓋率較不出色。

觀察次主題查詢字詞的評估結果，對於長查詢的搜尋結果能夠涵蓋率較多的物件，

且比在短查詢的搜尋結果更能區分各個物件，表示次主題查詢字詞中含有語意明

確且涵蓋的物件數量低的推薦字詞，這種推薦字詞之間若重覆率高便可能出現表 6.1 中重覆率及選擇率在長查詢的評估結果。

在文檔中提供網頁搜尋結果篩選之查詢字詞推薦 (頁 55-63)

第六章 實驗評估與討論

6.3 本系統內部採用方法之效果比較

6.3.2 實驗結果

L2 frequency-based: λ

vertex weight: μ

Edge weight counting way

Level2 suggestion size

第六章實驗評估與討論