第四章 實驗結果與分析
第四節 給分機制之分析與討論
在給分機制中,本研究利用星等及 IDF 進行分數的評估。星等是利用情緒給 分,例如正向為 5 分,偏正為 4 分,模糊為 3 分,偏負為 2 分,而負向為 1 分。
將該產品所有的評論之意見詞情緒分數相加除以意見詞的總數,其分數就為該產 品之星等,並利用星等的中間值「3 等」作為推薦與不推薦的界線,測試資料若 沒有出現於訓練資料,則利用第三章第四節的規則,並用投票確認極性後,給定 情緒分數,而分數給定為正向 5 等,模糊 3 等,而負向為 1 等。IDF 是利用該詞 出現的次數和情緒做為依據,將每個意見詞的 IDF 相加後除以意見詞的個數後,
即為該產品的 IDF 值,並利用訓練資料中星等為 3 所對應的 IDF 值 6.401 作為推 薦與不推薦之界線,表 44 為測試資料中星等與 IDF 之對應表。
表 44:測試資料中星等與 IDF 之對應表 (https://www.amazon.co.jp/ ),以評估其相似度,表 45 為本研究星等、IDF 值和日
79
本亞馬遜之星等數值比較,長條圖則顯示於圖 57 及圖 58。
表 45:本研究之星等、IDF 與日本亞馬遜提供之星等比較表
產品 星等 IDF 值 日本亞馬遜星等
チノ 3.333(推薦) 5.113(不推薦) 4.692 テ イ ル ズ オ ブ
ゼ ス テ ィ リ ア エ ドナ
4.438(推薦) 7.264(推薦) 4.87
夕立改二 4.625(推薦) 9.811(推薦) 4.961 小泉 花陽 4.522(推薦) 8.520(推薦) 5 加藤恵 3.917(推薦) 7.478(推薦) 4 安原 絵麻 4.464(推薦) 9.340(推薦) 5 金剛 中破 ver 4.439(推薦) 9.298(推薦) 4.567 島田愛里寿 3.667(推薦) 5.451(不推薦) 4.9 時雨改二 4.452(推薦) 9.094(推薦) 4.94 遠坂凛 4.318(推薦) 8.334(推薦) 3
圖 57:本研究之星等與日本亞馬遜之星等比較長條圖(PART1)
81
法較嚴格,此外日本亞馬遜的評論為一篇小文章的方式進行評論,而本研究之實 驗數據大多為單一短句,因此訓練之詞彙也會相對較少。
島田愛里寿在日本亞馬遜中共有 11 項評分紀錄:10 則 5 星和一則 4 星,而 本論文有 14 則該產品之評論。4 星之評論在缺點上也只是說「底座容易沾黏指紋」, 其餘皆給予好評。但本論文在該產品的測試資料中有:「這次壽屋的塗裝真的沒 有很好」、「這次膝上襪的部份的塗裝蠻不好的」等負向例句,這個狀況應可以依 資料不同作為判定。
最後遠坂凛的部分在日本亞馬遜只有 3 則評分紀錄:分別為 4 分、3 分及 2 分,而本論文有 10 則評論。在亞馬遜的評論中有很多對於臉部的不滿,而本論 文之訓練資料也有:臉不太適合凜的感覺、臉感覺怪怪的等評論,不過相較之下 由於本論文的正面評論也有一些,這或許就為本論文之星等比日本亞馬遜之星等 還高的原因。
不過在分析上由於本論文是以「3 分以上為推薦」,故日本亞馬遜除了最後一 項的遠坂凛為 3 分推薦程度較低,其餘都為 4 分以上的星等,都是可以列為推薦 之星等。故在星等上本論文有著 90%的相似度。
在 IDF 的狀況下有兩項產品被系統列為不推薦,而最後一項產品被列為推薦,
故該方法有著 70%的相似度。
由於本研究之語料庫收集與驗證皆以巴哈姆特為主,為證明本實驗之客觀性 及可性度,特別選取與訓練、測試資料來源不同公司的 GSC(GOOD SMILE COMPANY)(http://www.goodsmile.info/zh/ )所生產的「噬神者亞莉莎・伊莉妮提 娜・阿米耶拉」作為實驗資料,並增加臉書社團「PVC_Figure 人型討論分享社」
83
(https://www.facebook.com/groups/figure.hot/ )作為收集評論之平台,接著同時與 巴哈姆特和日本亞馬遜進行比較。在 PVC_Figure 人型討論分享社中共蒐集四位 網友的 PO 文,共擷取 8 則評論作為分析,圖 60 為四則 PO 文之紀錄。
圖 60:產品「噬神者亞莉莎・伊莉妮提娜・阿米耶拉」的四則 PO 文 經由系統之給分機制後,得出該產品的星等為 4(推薦)和 IDF 值 6.410(推薦)。
接下來巴哈姆特的有兩篇開箱文共 11 則評論,給分機制分析出之星等為 4.333(推 薦)及 IDF 值 8.248(推薦);最後日本亞馬遜之星等為 4.5 分(推薦)(2017/7/23 之 數據)。表 45 為臉書社團和巴哈姆特收集之評論原句、分群及配對之列表,圖 61 為臉書社團、巴哈姆特及日本亞馬遜之星等相似度長條圖。
表 46:臉書社團和巴哈姆特收集之評論列表 臉書社團「PVC_Figure 人型討論分享社」
句數標記 原句 分群 配對
第 1 句 GSC 應該都不差 不差[正向] 整體+不差
第 2 句 真的神韻有到位 神韻(整體) 神韻+不錯
到位[正向]
第 3 句 GSC 做的很不錯 不錯[正向] 整體+不錯
第 4 句 整體的氣勢是不錯 整體(整體) 氣勢 整體*
氣勢+不錯
不錯[正向]
85