• 沒有找到結果。

Yahoo!奇摩 Q&A

在文檔中 摘要 (頁 61-65)

第 6 章 實驗與結果探討

6.3 回覆前五名答案(top 5 answer)之實驗分析

6.3.1 Yahoo!奇摩 Q&A

表 6.5:使用神達電腦公司 Q&A 資料回覆最佳答案實驗之正確率平均值

未分類資料 分類資料

ED-特徵向量法 IP-特徵向量法 INCSS ED-特徵向量法 IP-特徵向量法 INCSS

實驗一 98.1% 92.9% 73.2% 94.7% 92.1% 80.4%

實驗二 92.9% 90.5% 66.3% 84.4% 82.9% 66.0%

實驗三 95.7% 91.8% 69.3% 89.0% 86.7% 72.8%

平均 95.5% 91.7% 69.6% 89.3% 83.9% 73.0%

由表 6.5 中可以清楚的發現本論文提出的方法不論是特徵向量搭配歐基理德法或 者是搭配內積法的結果比 INCSS 系統的正確率平均提昇了約 15%左右,尤其在未分類 資料方面更提昇了約20%。而觀察圖表發現,特徵向量搭配歐基理德法較搭配內積法的 正確率約高出3~6%,可以發現特徵向量搭配歐基理德法在處理英文問題上有較為優秀 的結果。另外,EXP2 的部分也因為和 Yahoo!奇摩的實驗相同,正確率一樣有下降的情 形發生。

由以上 6.2.1 和 6.2.2 小節總結來說,在回覆最佳答案的實驗上,本論文所提出的 兩種方法不論在中文或者是英文的資料上相較於 INCSS 系統都有著長足的進步。實驗 中顯示其正確率差距最大者有25.9%的差距。

正確性比較。接著以表6.6 顯示這三種方法在分類資料庫上實驗的平均表現。

使用未分類Yahoo!奇摩Q&A資料回覆5個最可能答案 之正確率比較-實驗一(顧客問題類似FAQ問題)

50.0 60.0 70.0 80.0 90.0 100.0

50 100 150 200 250 300 350 400 450 500 550 實驗筆數

正確率(%)

ED-特徵向量法 IP-特徵向量法 INCSS系統

圖6.13:使用未分類 Yahoo!奇摩 Q&A 資料回覆 5 個最可能答案 之正確率比較-實驗一(顧客問題類似 FAQ 問題)

使用未分類Yahoo!奇摩Q&A資料回覆5個最可能答案 之正確率比較-實驗二(顧客問題不似FAQ問題)

50.0 60.0 70.0 80.0 90.0 100.0

50 100 150 200 250 300 350 400 450 500 550 實驗筆數

正確率(%)

ED-特徵向量法 IP-特徵向量法 INCSS系統

圖6.14:使用未分類 Yahoo!奇摩 Q&A 資料回覆 5 個最可能答案 之正確率比較-實驗二(顧客問題不似 FAQ 問題)

使用未分類Yahoo!奇摩Q&A資料回覆5個最可能答案 之正確率比較-實驗三(顧客問題為任意可能問題)

50.0 60.0 70.0 80.0 90.0 100.0

50 100 150 200 250 300 350 400 450 500 550 實驗筆數

正確率(%) ED-特徵向量法

IP-特徵向量法 INCSS系統

圖6.15:使用未分類 Yahoo!奇摩 Q&A 資料回覆 5 個最可能答案 之正確率比較-實驗三(顧客問題為任意可能問題)

使用分類Yahoo!奇摩Q&A資料回覆5個最可能答案 之正確率比較-實驗一(顧客問題類似FAQ問題)

50.0 60.0 70.0 80.0 90.0 100.0

50 100 150 200 250 300 350 400 450 500 550 實驗筆數

正確率(%)

ED-特徵向量法 IP-特徵向量法 INCSS系統

圖6.16:使用分類 Yahoo!奇摩 Q&A 資料回覆 5 個最可能答案 之正確率比較-實驗一(顧客問題類似 FAQ 問題)

使用分類Yahoo!奇摩Q&A資料回覆5個最可能答案 之正確率比較-實驗二(顧客問題不似FAQ問題)

50.0 60.0 70.0 80.0 90.0 100.0

50 100 150 200 250 300 350 400 450 500 550 實驗筆數

正確率(%)

ED-特徵向量法 IP-特徵向量法 INCSS系統

圖6.17:使用分類 Yahoo!奇摩 Q&A 資料回覆 5 個最可能答案 之正確率比較-實驗二(顧客問題不似 FAQ 問題)

使用分類Yahoo!奇摩Q&A資料回覆5個最可能答案 之正確率比較-實驗三(顧客問題為任意可能問題)

50.0 60.0 70.0 80.0 90.0 100.0

50 100 150 200 250 300 350 400 450 500 550 實驗筆數

正確率(%)

ED-特徵向量法 IP-特徵向量法 INCSS系統

圖6.18:使用分類 Yahoo!奇摩 Q&A 資料回覆 5 個最可能答案 之正確率比較-實驗三(顧客問題為任意可能問題)

表6.6:使用 Yahoo!奇摩 Q&A 資料回覆 5 個最有可能答案實驗之正確率平均值

未分類資料 分類資料

ED-特徵向量法 IP-特徵向量法 INCSS ED-特徵向量法 IP-特徵向量法 INCSS 實驗一 99.3% 98.5% 96.3% 98.5% 98.5% 96.8%

實驗二 85.2% 95.7% 81.0% 81.3% 91.0% 75.9%

實驗三 92.4% 97.1% 88.3% 90.3% 94.9% 84.5%

平均 92.3% 96.1% 88.5% 90.0% 94.8% 85.7%

由表6.6 中可以發現本論文提出的方法在回覆前五名答案時,特徵向量搭配歐基理 德法或者是搭配內積法比INCSS 系統的正確率提昇 4.3%~7.6%。而觀察圖表發現,特 徵向量搭配內積法時其正確率較搭配歐基理德法來說有較為優秀的表現,其差距約在 4%左右。這與先前的理論分析有所出入,我們將在 6.4.2 節中詳加探討其中可能的因素。

實驗一其正確率高達 98%,即常見問題資料庫中的數量增加,顧客問題與常見問 題的問法類似時,可以預見有更高的正確率。如此,客服人員可以更快速的回覆需要進 一步處理之問題。

在文檔中 摘要 (頁 61-65)

相關文件