• 沒有找到結果。

結論與未來研究方向

7.1 結論

針對主題資訊分散且資料量多的搜尋結果,本論文提出一個藉由分析網頁摘 要及標題,從這些資訊中分別計算單字的主題廣泛度與語意明確度,首先根據主 題廣泛度挑選第一層的主題查詢字詞;第二層則是以語意明確為目標,因此根據 單字語意明確度產生第二層的次主題查詢字詞後,便建構出雙層的階層式字詞推 薦架構。使用者能夠透過點選符合自己需求的推薦字詞瀏覽系統篩選後的資訊,

減少其需要瀏覽的資料量及主題範圍。

兩種邊權重值計算方式經過實驗的效果比較後,雖然數據分析的結果是頻率 式的結果較佳,但差距不大的情形下我們選擇能使語意較為明確的語意式方法做 為系統方法。從各項實驗結果中,可以發現本論文方法在數據上的表現比基準方 法更能涵蓋搜尋結果的情況下,重覆率的增加幅度沒有成正比,這表示本論文方 法所產生的推薦架構能夠有效區隔搜尋結果,且產生的階層架構語意明確。

68

7.2 未來研究方向

從推薦結果觀察,我們認為像 Wikipedia 這類的入口網站不適合成為推薦字

詞的一部分,因為使用者通常會直接點選搜尋結果而不是透過推薦字詞,或是選 擇直接以網站名稱作為查詢字進行搜尋。因此未來可以先從單字集中分析可能為 入口網站的單字並將其從候選集合中排除掉,或是給予較少的推薦數量,如此才 能產生對使用者有幫助的推薦字詞。另外,本論文方法的處理時間成本偏高,對 於搜尋引擎這種講求回應速度的系統來說是需要改善的一點。隨機漫走的計算時 間是其中最耗時的一個關鍵因素,因此未來可考慮針對關係圖減少節點數量的調 整方法,例如使用資訊檢索的 TF-IDF 方式給予單字分數並以此過濾較不重要的 單字,達到減少節點的效果。

69

參考文獻

[1] Z. Abbassi, V. S. Mirrokni, and M. Thakur. Diversity maximization under matroid constraints. In KDD, pages 32-40, 2013.

[2] R. Agrawal, S. Gollapudi, A. Halverson, and S. Ieong. Diversifying search results. In WSDM, pages 5-14, 2009.

[3] K. Bache, D. Newman, and P. Smyth. Text-based measures of document diversity.

In KDD, pages 23-31, 2013.

[4] Z. Bao, B. Kimelfeld, and Y. Li. Automatic suggestion of query-rewrite rules for enterprise search. In SIGIR, pages 591-600, 2012.

[5] S. Bhatia, D. Majumdar, and P. Mitra. Query suggestions in the absence of query logs. In SIGIR, pages 795-804, 2011.

[6] D. M. Blei, A. Y. Ng, and M. I. Jordan. Latent dirichlet allocation. JMLR, 3, 2003.

[7] J. Carbonell and J. Goldstein. The use of MMR, diversity-based reranking for reordering documents and producing summaries. In SIGIR, pages 335-336, 1998.

[8] V. Dang and W. B. Croft. Diversity by proportionality: An election-based approach to search result diversification. In SIGIR, pages 65-74, 2012.

[9] V. Dang and W. B. Croft. Term level search result diversification. In SIGIR, pages 603-612, 2013.

[10] V. Dang and G. Kumaran, Adam Troy. Domain dependent query reformulation for web search. In CIKM, pages 1045-1054, 2012.

[11] M. P. Kato, T. Sakai, and K. Tanaka. Structured query suggestion for specialization and parallel movement: Effect on search behaviors. In WWW, pages 389-398, 2012.

[12] J. L. Koh and I. C. Chou. An Efficient Approach for mining top-k high utility

70

specialized query expansions on social tagging systems. In DASFAA, pages ,2014.

[13] C. D. Manning and H. Schütze. Foundations of statistical natural language processing. MIT press, 1999.

[14] K. T. Maxwell and W. B. Croft. Compact query Term Selection using topically related text. In SIGIR, pages 583-592, 2013.

[15] T. Nguyen, H. W. Lauw, and P. Tsaparas. Using micro-reviews to select an efficient set of reviews. In CIKM, pages 1067-1076, 2013.

[16] U. Ozertem, O. Chapelle, P. Donmez, and E. Velipasaoglu. Learning to suggest: a machine learning framework for ranking query suggestions. In SIGIR, pages 25-34, 2012.

[17] J. H. Paik. A novel tf-idf weighting scheme for effective ranking. In SIGIR, pages 343-352, 2013.

[18] R. L. T. Santos, C. Macdonald, and I. Ounis. Exploiting query reformulations for web search result diversification. In WWW, pages 881-890, 2010.

[19] D. Skoutas and M. Alrifai. Tag clouds revisited. In CIKM, pages 221-230, 2011.

[20] P. Venetis, G. Koutrika, and H. Garcia-Molina. On the selection of tags for tag clouds. In WSDM, pages 835–844, 2011.

[21] J. Xu and W. B. Croft. Query expansion using local and global document analysis. In SIGIR, pages 4-11, 1996.