• 沒有找到結果。

第六章 實驗評估與討論

6.3 本系統內部採用方法之效果比較

6.3.2 實驗結果

以下實驗是使用 Google 搜尋引擎進行查詢並擷取查詢結果做為資料集。執 行時設定主題查詢字詞數量 n=10,QS=50;LDA 的參數設定為 α=0.2,β=0.1,

分群數則參考 n 設定為 10 群。

【實驗 1-1】 評估有參考亂度的新穎程度值計算中不同 δ 值的設定對選出的主 題查詢字詞在查詢結果選擇率、重覆率與選擇率方面的影響 此實驗是針對階層架構中第一層主題查詢字詞的挑選過程,計算新穎程度值 時參考亂度的比例設定δ 對於挑選結果涵蓋率、重覆率與選擇率的影響,實驗結

48

49 件內容為‘image courtesy japan meteorology agency blue marble surface image

0

L2 frequency-based: λ

L2 Coverage L2 Overlap L2 Selectivity

50

courtesy nasa idy28000 government bureau’,其中 image 是系統選出的主題查詢字 詞。除了 image 與其他單字的共同出現次數會大於 1 之外,其餘任兩單字的共同

vertex weight: μ

Coverage Overlap Selectivity

51

算出來,沒有參考節點加權值,從實驗結果可知只有用單字之間的關係計算的語 意明確度無法提升涵蓋率;當μ 介於 0.1 至 0.9 時相當於加重每一個節點自己的 重要性分數,從圖 6.3 的實驗結果可知,著重單字本身在 T 中的重要性無法有效 提升推薦架構在 T 的涵蓋率、重覆率與選擇率,這可能是因為我們處理的資料 中扣除主題查詢字詞後單字大多出現頻率不高且近似,造成 TF-IDF 的效果有限 不適合做為主要的分數來源。因此我們認為在μ=1.0 時,會使涵蓋率及選擇率較 高而重覆率較低的情形是最佳的設定,也就是我們需要同時考慮單字與其他字的 關係及其本身的重要性。

【實驗 1-4】 單字相鄰位置關係圖中採用不同邊權重值計算方式對於次主題查 詢字詞在查詢結果的涵蓋率、重覆率及選擇率之影響

這個實驗是針對單字語意明確程度的計算中,使用頻率式和語意式的邊權重 值估算對於產生的次主題查詢字詞在涵蓋率、重覆率與選擇率的影響。執行時加 入亂度的新穎程度值 δ 設為 0.9,頻率式邊權重中則是 λ 設為 0.9,節點加權值 μ=1.0。

圖 6.4 中我們可看出在關係圖的兩種邊權重值計算方式的實驗,顯示兩種方 式所算出的字詞語意明確度,對於最後選出的次主題查詢字詞在涵蓋率、重覆率 以及選擇率都只有些微的差距。另外,從圖 6.5 與圖 6.6 所呈現的推薦結果我們 能夠發現,頻率式產生的推薦字詞相較於語意式來說,較像主題性推薦字詞,例 如頻率式推薦字詞中 barack lady 可能是指 barack 家的女仕,相對於語意式所推 薦的 barack sr 表示美國總統歐巴馬之父親,或 barack sasha 為歐巴馬女兒之姓名 等,語意式較能讓使用者了解推薦字詞表達的具體物件。基於兩種方式在評估效

52

果的三種數值上表現相當,但是使用語意式邊權重值所產生的次主題查詢字詞語 意較為明確,因此本論文在後續的實驗中是採用語意式做為邊權重值計算的方 法。

圖 6.4 不同邊權重值計算方式的實驗結果

圖 6.5 語意式邊權重值計算方式的推薦結果 0

0.1 0.2 0.3 0.4 0.5 0.6

L2 Coverage L2 Overlap L2 Selectivity

Edge weight counting way

semantic-based frequency-based

53

圖 6.6 頻率式邊權重值計算方式的推薦結果

【實驗 1-5】 評估各主題查詢字詞下次主題查詢字詞的推薦數量決定方式對於 所找出的階層式推薦架構在查詢結果的涵蓋率、重覆率以及選擇率 之影響

圖 6.7 第二層推薦數量的分配方式

圖 6.7 中我們可以發現動態決定各主題查詢字詞的推薦數量,相較於平均分 配來說能夠在重覆率增加幅度低的情況下使涵蓋率有效增加,表示若使第二階層

0 0.1 0.2 0.3 0.4 0.5

L2 Coverage L2 Overlap L2 Selectivity

Level2 suggestion size

Dynamic way Average way

54

中每一群的推薦數量都相同,則涵蓋率低的主題查詢字詞可能會出現篩選率低的 推薦字詞。舉例來說,一個主題查詢字詞只有涵蓋 2 個物件,假設用平均數量的 方式必須產生 5 個次主題查詢字詞,因此最佳的情況是一個次主題查詢字詞就能 涵蓋該 2 筆物件,那麼其餘 4 個推薦字詞便會造成,使得使用者難以透過推薦字 詞瀏覽到各個物件。

【實驗 1-6】 評估查詢字詞的不同長度對推薦字詞在涵蓋率、重複率及選擇率 影響

本論文方法沒有限制查詢字詞之長度,但是經計算後可知我們所使用的測試 查詢字平均長度約為 2.5 個英文單字,因此以 2.5 作為長短查詢字詞之分界觀察 本論文方法在長短查詢字詞的處理效果。

表 6.1 查詢字長度與推薦結果的關係

L1 L2 topCoverage

length Coverage Overlap Selectivity Coverage Overlap Selectivity L2 whole

< 3 0.7952 0.2036 0.5537 0.4500 0.0569 0.3969 0.4667 0.81

>= 3 0.8824 0.2430 0.5019 0.5121 0.0684 0.4471 0.5344 0.9026

表 6.1 顯示出本論文方法對於長查詢字詞的搜尋結果涵蓋效果較佳,且能涵 蓋搜尋結果排序前 50 中較多比例物件。我們推測可能的原因是短查詢字通常包 含的語意概念較多且廣,因此在一個給定數量的推薦條件之下涵蓋率較不出色。

觀察次主題查詢字詞的評估結果,對於長查詢的搜尋結果能夠涵蓋率較多的物件,

且比在短查詢的搜尋結果更能區分各個物件,表示次主題查詢字詞中含有語意明

55

確且涵蓋的物件數量低的推薦字詞,這種推薦字詞之間若重覆率高便可能出現表 6.1 中重覆率及選擇率在長查詢的評估結果。