• 沒有找到結果。

第四章、 實證分析

第二節、 分析資料

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

第二節、 分析資料

一、 視覺化分析圖

(一) 飯點地點分佈圖

該資料集來自於 Booking.com,顧客對對飯店給予評論,而飯店分佈於 歐洲的六個國家,分別是倫敦、荷蘭、法國、義大利、奧地利、西班牙,地 圖分佈圖表示如下:

圖 4-1 飯點地點分佈圖

(二) 關係矩陣圖

將正、負面評論的字數、評論者評論數、飯店總評論述、評論分數,倆 倆計算其相關係數。結果顯示負面文字的影響評分的程度比正面強烈

,負面評論字數越多,分數越低;相反的,正面評論字數越多,分數越高,

而其他因素對評論分數影響不大。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖 4-2 關係矩陣圖

(三) 評論者之國籍分佈圓餅圖

評論者的國籍總共有 227 個國家,我們將國家按各州劃分,畫成圓餅圖

(如下圖),其中歐洲給予評論最多,可能飯店所在地位於歐洲,所以所以 顧客也多來自於歐洲,而南美洲給予評論相較偏少。

圖 4-3 評論者之國籍分佈圓餅圖

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

(四) 各國評論者給評論次數之長條圖

統計各國給予評論的次數,將其畫成長條圖作比較,從下圖觀察,發現 英國的的評論次數最多,將近二十五萬筆評論,其餘國家都不到都不到五萬 筆評論。

圖 4-4 各國評論者給評論次數之長條圖

(五) 各國評論者給分情況

將評論者按各州劃分,計算評論分數的帄均(紅線),加減一個標準差

(黑線),其中南美洲給分相較高,而亞洲給分較低。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

(六) 飯店正負評論字數分佈圖

計算各飯店之正負面評論字數,結果顯示正負評字數差不多,大約都 20 個字左右。

圖 4-6 飯店正負評論字數分佈圖

二、 訓練模型

(一) 文本分析基本原理

在理解一段文字時,我們通常是從中獲取資訊,從詞性的角度來解讀一 段敘述,能有效的分辨各個詞的資訊量。沒有提供資訊的詞,主要為連接詞、

感嘆詞、稱謂、量詞等;有提供資訊的詞不外乎是名詞、形容詞、動詞。

舉例來說,「In class, I have a good day with my classmate in the math class」,有資訊的詞為:have、good、day、classmate、math、class ;沒有 意義的詞為:I、a、with、my、in、the。因此,自然語言分析(NLP)之基本

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

頻率。計算每個詞在一筆資料的出現次數(後稱 TF),及在所有資料中出現在 資料的次數(後稱 IDF),相乘為一個數值稱之 TF-IDF,用以代表該詞在每筆 資料的重要程度。

舉上面的例子,class 的 TF 值為 2(出現兩次),其他詞的 TF 值為 1。可 以看出 class 跟這段敘述的主題,有相對較高的相關性。而這裡只有一個舉 例,所以沒有辦法與其他例子的出現頻率做比較。因此各個詞語的 IDF 值 皆相同。簡單來說,每一個詞在每筆資料,都有屬於他的 TF-IDF 值。

因此 TF-IDF 傾向於過濾掉常見的詞語,保留重要的詞語。(TF 高,表示在 文章裡重要;IDF 高,表示他只獨特存在於該資料中,代表該資料與主題有 強烈相關性。)

(二) 分析結果

本論文採用資料約為 55 萬筆,並使用 sklearn 提供的 train_test_split 套 件,隨機挑選其中之 20%作為訓練集資料,用以訓練模型,其餘 80%資料 則做為測詴集資料。為求運行效率,又將剩下的資料分成三堆資料數相差不 遠的測詴集,已分別進行測詴。

表 4-1 各資料集的 MAE 數據

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

由表 4-1 結果可以看出,變異程度(MAE)足夠小,模型與預測結果皆可 被使用。而四個資料集的變異程度接近,可以說明該模型適用於所有資料集,

且各資料集之間並無太多不同的特性。因此,此模型訓練成功。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

上圖是評論字詞的重要性的排名的排序,前面 TF-IDF 轉換器我們設定 要找前 10000 個重要字詞,精確度較高。我們專注在前 50 重要的字詞,分 別看名詞、形容詞,可以看出飯店的重要因素,以及顧客會關注的感受。可 以推測出,旅客在選擇飯店時,會看重價格(money)、房間樣式(room)、地 點(location)、以及員工(staff) 這幾個重要因素,以及給人的感受。

接下來,分別看正面評論、負面評論的情緒分析,可以分別得知他們想 要的、以及不想要的感受。從正面評論中,staff、location、hotel、room、service 為前五大重要因素,而旅客主要喜歡有 excellent、amazing、comfortable、

beautiful、loved、everything 的感覺;從負面評論中,room、staff、hotel、

money、bathroom、bed 為前五大重要因素,而旅客主要不想要有 dirty、old、

rude、small、nothing 的感覺。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

綜合評論分析結果,我們發現要經營好一個飯店,房間的環境跟員工的 服務態度是最重要的兩大因素。 便利的地點跟良好的服務態度,會提升旅 客對飯店的印象,進而有舒適、被愛、充實、經驗等美好體驗,也會因此不 在意價格的高低。 頗析正面的感受用詞,能發現好的感受通常是全面性的、

整體性的用詞,並無太多詳細的刻劃。因此,若要給旅客好的感覺,請記得 特別注重飯店的整體一致性,尤其是房間與員工的整體規劃。

另一方面,較差的環境與惡劣的服務態度,旅客通常會歸咎於外在因素,

不會責怪自己難搞。房間部分,髒亂、過於狹小、單一無裝飾、過於老舊、

以及員工部分的服務態度不佳,都是旅客在入住飯店時,最能直接的負面感 受。當對飯店有負面情緒時,更會激起旅客對價格的注意,認為自己的花費 並沒有得到相應的回報。

因此,即使飯店整體規劃再好,再旅客最直接接觸的人(員工)、事(服務) 以及物(房間)方面,若無維持好品質,便功虧一簣。 一個飯店要獲得好的評 價,除了顧好房間及服務品質,更要創造良好的整體感,便能成功取悅旅客。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

第五章、 結論

根據本篇研究之自然語言處理、數據分析之結果,便能了解到哪些因素會影 響到顧客對顧客對飯店的評論,進而影響到評論分數的高低。如果顧客感到位置 便利、環境舒適、心情愉悅等等正面感受,就會獲得好評;如果顧客感到環境髒 亂、設備老舊、房間狹小等等負面感受,就會獲得負評。因此,飯店管理應著重 於地理位置的便利性、飯店的房型和格局,以及專業的服務態度,以增加顧客正 向評價。

林大貴(2017)。Tensorflow+keras 深度學習人工智慧實務應用。新北市:博碩。

人工智能. (n.d.).In Wikipedia.,上網日期 107 年 11 月 25 日,

檢自: https://wiki.mbalib.com/zh-tw/人工智能

蕭佑和(2018).完整解析 AI 人工智慧:3 大浪潮+3 大技術+3 大應用,

上網日期 107 年 11 月 25 日,

檢自:https://meethub.bnext.com.tw/完整解析 ai 人工智慧:3 大浪潮+3 大技術+3 大應用

c.s.blog.2017.Understanding LSTM

Networks,from:http://colah.github.io/posts/2015-08-Understanding-LSTMs/

Entrepreneur Network.(2018/1/18).10 Artificial Intelligence Trends to Watch in 2018.fromhttps://www.entrepreneur.com/article/307589

Géron, A. (2017). Hands-on machine learning with Scikit-Learn and TensorFlow:

concepts, tools, and techniques to build intelligent systems: " O'Reilly Media, Inc.".

Hochreiter, S., & Schmidhuber, J. J. N. c. (1997). Long short-term memory. 9(8), 1735-1780.

Jacques Bughin, Eric Hazan, SreeRamaswamy, Michael Chui, TeraAllas, Peter Dahlström, Nicolaus Henke, and Monica Trench(2017). How artificial intelligence can deliver real value to companies,from

https://www.mckinsey.com/business-functions/mckinsey-analytics/our-insights/how-a rtificial-intelligence-can-deliver-real-value-to-companies

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

PwC (2017).Sizing the prize What’s the real value of AI for your business and how can you

capitalise?,fromhttps://www.pwc.com/gx/en/issues/analytics/assets/pwc-ai-analysis-si zing-the-prize-report.pdf

Sebastian RaschkaVahidMirjalili (2015). Python Machine Learning.Birmingham :Packt Publishing Ltd

相關文件