• 沒有找到結果。

應用羅吉斯迴歸分析在個性化旅遊景點推薦模型之研究 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "應用羅吉斯迴歸分析在個性化旅遊景點推薦模型之研究 - 政大學術集成"

Copied!
67
0
0

加載中.... (立即查看全文)

全文

(1)國立政治大學商學院 統計學系研究所 碩士學位論文. 應用羅吉斯迴歸分析在個性化旅遊景點 治. 政. 大 推薦模型之研究 立. ‧ 國. 學. A Study on the Personalized Recommendation Model of Tourist Attractions Using Logistic Regression. ‧. Analysis. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 指導教授:鄭宇庭 博士 郭訓志 博士. 研究生:王品方 撰. 中華民國 一百零七 年 四 月.

(2) 謝誌 兩年時間過得好快,以前看學長姊的論文謝誌第一句都這麼打的,直到自 己也到了這個時間點,才深刻的感受到這句話的感慨。很珍惜到政大一切的學 習資源與實習機會,人生從來就沒有規劃過自己的未來會考研究所這個過程, 但直到考上政大的那一刻才驚覺自己對於統計的應用多有熱忱,才有辦法吊車 尾擠入商院窄門!回想這兩年很感謝跟著指導教授鄭宇庭博士經歷了豐富的市 場調查與實習經驗,在口條能力與個人的包袱上皆成長了非常多,是一段這輩 子永生難忘的日子!. 政 治 大 Datathon 競賽,之後也獲得參賽隊伍隊友們的支持,延伸當時的想法來建立旅 立 論文初期的發想是來自於口試委員謝邦昌博士在台北醫學大學舉辦的. ‧ 國. 學. 遊推薦模型,過程當中有著酸甜苦辣,各種煎熬的歷程,謝謝鄭宇庭博士與郭 訓志博士的細心指導,讓後續的完成有了加速的進度!更謝謝口試委員謝邦昌. ‧. 博士、鄧家駒博士在口試當天提供了很多關於論文上的建議,受益良多,感受. sit. y. Nat. 到一個產品的從發想到上架之前所需要思考的深度有多深!. al. er. io. 在政大的日子裡,人生有如當頭棒喝一般的開竅了,開始對自己的未來有. v. n. 很多的想法與規劃,真的很感謝當初聽了爸爸的建議做了這個決定,讓我的人. Ch. engchi. i n U. 生從渾渾噩噩的慘狀開始有了轉捩點,呼應到來政大的第一天,別蓮蒂博士在 道德倫理課上講的第一句話,我入寶山且滿載而歸了!. Ricky 謹 誌 於 Rick 王 王 品 方 謹 誌 於 國立政治大學統計學系 中華民國一百零七年四月 II.

(3) 摘要 我們正生活在一個大數據的時代,甚至也有人說得資料者得天下。在這個 互聯網快速發展,讓大數據的各種應用受到了業界的高度關注與技術的快速升 級,使得傳統的觀光產業隨著時代紛紛轉型,希望透過消費者的消費行為、個 人資訊、成交紀錄等海量訊息透過數據分析找到市場需求與提供精準行銷,最 後提高了顧客服務滿意度,並帶來龐大商機。而這一切的源頭都是為了更懂消 費者的心,有別於傳統旅遊資料庫僅限於對客戶人群做簡單的統計分析,現在 反而更側重於遊客的心理研究與旅遊後的產品體驗,一切以遊客的需求為關注. 政 治 大 察到的現象並給予經驗談無法給出的決策與建議,這也是本次研究旅遊推薦模 立 點,並且通過對累積的大數據進行洽當地管理、建模與分享,從分析結果中觀. ‧ 國. 學. 型最主要的出發點。. 本研究設計問卷並調查研究年輕族群對於旅行的偏好,進行了解目標客群. ‧. 的心理研究後,應用羅吉斯迴歸分析,將蒐集到的數據建模,找到每一種旅行. sit. y. Nat. 方式較容易吸引到哪一些族群,並且對該族群做出該旅遊景點的推薦。最後,. al. er. io. 未來的計畫是,希望延伸本旅遊景點推薦模型的概念,給予抵達目的地的交通. v. n. 方式與費用的精準計算,並利用輿情分析找到年輕族群熱搜的景點,提供一整. Ch. engchi. i n U. 趟旅行路線的規劃,作為旅遊業者開發新型旅行產品之參考來源。. 【關鍵字】 羅吉斯迴歸分析、個性化推薦、旅遊產業. III.

(4) Abstract This is an era of big data; some people even regard that the person who owns the data controls the world. With the rapid development of the Internet, the applications of big data attract attention from various industries and the skills of data analysis are upgrading rapidly. Therefore, traditional tourism industry needs to be transformed to avoid being eliminated. Business attempts to discover the market demand and provide precision marketing by analyzing massive data from consumer behavior, personal information and transaction records. The final object is to improve customer service. 政 治 大 the customers more furtherer 立and detailed. Instead of using simple statistical analysis satisfaction, and bring in more business opportunities. The purpose is to understand. ‧ 國. 學. of consumer information like traditional tourism database, it focuses more on the psychological states of tourists and the travel experience currently. The final objective. ‧. is to meet tourists’ demand; therefore, the accumulated data of customers are. y. sit. Nat. managed, modeled and shared appropriately in this research.. al. er. io. An online survey with questionnaire is designed to investigate travel preference. v. n. of young group. After understanding the psychological research of target customers,. Ch. engchi. i n U. the Logistic regression analysis is used to analyze the collected data and build a model. The model is able to discover the target group of each travelling style, and further provide itinerary recommendation. The future plan is to enhance the application of this concept of attraction recommendation model by combining the precise calculation of transportation and cost. Simultaneously, public opinion analysis is used to analyze the popular attractions which young adults are preferred. The ultimate objective is to provide a complete route plan for a trip as a reference for travel agency to develop new travel product.. IV.

(5) 【Key Words】Logistic Regression Analysis, Personalized Recommendation, Tourism Industry. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. V. i n U. v.

(6) 目. 錄. 目 錄 ........................................................................................................................ VI 表目錄 ....................................................................................................................... VII 圖目錄 ........................................................................................................................... 8 第壹章. 緒論 ........................................................................................................... 9. 第一節 第二節. 研究背景與動機.................................................................................... 9 研究目的.............................................................................................. 11. 第三節. 研究流程.............................................................................................. 11. 第一節 第二節 第三節. 政 治 大 個性化旅遊景點推薦的相關研究...................................................... 18 立 羅吉斯迴歸分析之相關研究.............................................................. 23 旅遊產業趨勢概況.............................................................................. 13. 學. 第參章. 文獻探討 ................................................................................................. 13. ‧ 國. 第貳章. 研究方法 ................................................................................................. 26 資料來源.............................................................................................. 26 研究架構.............................................................................................. 26 問卷設計.............................................................................................. 27. 第四節. 羅吉斯迴歸分析.................................................................................. 32. 第一節 第二節. y. sit. er. 探索性分析.......................................................................................... 36 建立旅遊景點推薦模型...................................................................... 44. al. n. 第伍章. 研究分析 ................................................................................................. 36. io. 第一節 第二節. Nat. 第肆章. ‧. 第一節 第二節 第三節. Ch. engchi. i n U. v. 結論與未來規劃 ..................................................................................... 61 結論...................................................................................................... 61 未來規劃.............................................................................................. 63. 參考文獻 ..................................................................................................................... 64. VI.

(7) 表目錄 表 2- 1 好奇心日報調查的中國旅遊產業新趨勢 .................................................... 15 表 3- 1 變數名稱代號解釋 ........................................................................................ 28 表 4- 1 Omnibus Tests of y1 Model Coefficients ........................................................ 46 表 4- 2 Model Summary of y1 ..................................................................................... 46 表 4- 3 Classification Table of y1 ................................................................................ 47 表 4- 4 y1 的羅吉斯迴歸模型表 ................................................................................ 47 表 4- 5 Omnibus Tests of y2 Model Coefficients ........................................................ 49 表 4- 6 Model Summary of y2 ..................................................................................... 49 表 4- 7 Classification Table of y2 ................................................................................ 49 表 4- 8 y2 的羅吉斯迴歸模型表 ................................................................................ 50 表 4- 9 Omnibus Tests of y3 Model Coefficients ........................................................ 50 表 4- 10 Model Summary of y3 ................................................................................... 51. 立. 政 治 大. ‧. ‧ 國. 學. 表 4- 11 Classification Table of y3 .............................................................................. 51 表 4- 12 y3 的羅吉斯迴歸模型表 .............................................................................. 52 表 4- 13 Omnibus Tests of y4 Model Coefficients ...................................................... 52 表 4- 14 Model Summary of y4 ................................................................................... 53 表 4- 15 Classification Table of y4 .............................................................................. 53 表 4- 16 y4 的羅吉斯迴歸模型表 .............................................................................. 54. Nat. y. sit. n. al. er. io. 表 4- 17 Omnibus Tests of y5 Model Coefficients ...................................................... 54 表 4- 18 Model Summary of y5 ................................................................................... 55 表 4- 19 Classification Table of y5 .............................................................................. 55 表 4- 20 y5 的羅吉斯迴歸模型表 .............................................................................. 56 表 4- 21 Omnibus Tests of y6 Model Coefficients ...................................................... 57 表 4- 22 Model Summary of y6 ................................................................................... 57 表 4- 23 Classification Table of y6 .............................................................................. 57 表 4- 24 y6 的羅吉斯迴歸模型表 .............................................................................. 58 表 4- 25 模型預測正確率表 ...................................................................................... 60 表 5- 1 模型匹配的族群特性 .................................................................................... 62. Ch. engchi. VII. i n U. v.

(8) 圖目錄 圖 1- 1 圖 1- 2 圖 1- 3 圖 1- 4 圖 2- 1 圖 3- 1 圖 4- 1 圖 4- 2. 近十年來臺旅客及國民出國人次變化 .......................................................... 9 近十年觀光外匯收入及國人國內旅遊收入及觀光總收入 .......................... 9 近十年來臺旅客觀光目的別人次及佔比變化 ............................................ 10 研究流程 ........................................................................................................ 12 一張圖看懂台灣旅遊新創的模式 ................................................................ 17 研究架構 ........................................................................................................ 27 性別組成比例 ................................................................................................ 36 年齡組成比例 ................................................................................................ 36. 圖 4- 3 對於旅伴的考量 ............................................................................................ 37 圖 4- 4 選擇旅行地點時最在意的因素 .................................................................... 37 圖 4- 5 台北旅行的報名費用接受範圍 .................................................................... 38. 政 治 大 圖 4- 6 一年四季當中最喜歡的季節 ........................................................................ 39 立 圖 4- 7 喜歡的天氣狀態 ............................................................................................ 39. y. Nat. n. al. er. sit. 喜愛的城市體驗 .......................................................................................... 43 羅吉斯迴歸模型流程圖 1 ........................................................................... 44 羅吉斯迴歸模型流程圖 2 ........................................................................... 45 預測選擇景點的機率表 .............................................................................. 59. io. 圖 4- 13 圖 4- 14 圖 4- 15 圖 4- 16. ‧. ‧ 國. 學. 圖 4- 8 旅行景點的選擇類型偏好 ............................................................................ 40 圖 4- 9 旅行時重吃還重玩 ........................................................................................ 40 圖 4- 10 希望旅行帶來的滿足 .................................................................................. 41 圖 4- 11 平時對於 Facebook/Instagram 上的旅遊訊息關注程度 ............................ 42 圖 4- 12 對台北的美食與遊玩景點的熟悉程度 ...................................................... 42. Ch. engchi. 8. i n U. v.

(9) 第壹章. 緒論. 第一節 研究背景與動機 據交通部觀光局發布最新數據如圖 1-1、圖 1-2 顯示,近十年出入境旅 客人數與來臺旅客觀光占比明顯呈現正向成長;如圖 1-3 顯示,在 2016 年的觀 光總收入已突破新台幣 8,000 億元,這顯示我國旅遊業處於一個穩步發展的階 段,具備可研究的價值。. 立. 政 治 大. ‧. ‧ 國. 學 er. io. sit. y. Nat. 圖 1- 1 近十年來臺旅客及國民出國人次變化. n. al. Ch. 資料來源:觀光局. engchi. i n U. v. 圖 1- 2 近十年觀光外匯收入及國人國內旅遊收入及觀光總收入 資料來源:觀光局 9.

(10) 圖 1- 3 近十年來臺旅客觀光目的別人次及佔比變化 資料來源:觀光局. 政 治 大. 隨著互聯網迅速發展,使得網路上的資訊已經呈現出爆炸性的增長趨勢,. 立. 2017 年 3 月數位時代雜誌提到,單以公開、財報揭露投資金額來說,在 2016. ‧ 國. 學. 下半年始 9 個月內已有超過 30 億資金流向旅遊新創,抓緊臺灣旅遊碎片化的需 求與自由行意識抬升的趨勢,網站開始承載著百家爭鳴的旅遊資訊,亞太旅遊. ‧. 體驗預訂平台 KLOOK 執行長林照圍則提出:「如何運用 AI 人工智慧到旅遊產. y. Nat. sit. 業內,透過數據分析、深度學習,讓消費者對人工智慧帶來的改變,會是未來. n. al. er. io. 五到十年的趨勢。」然而就台灣出生於 1990 年後的年輕世代來說,關注社群平. i n U. v. 台 Instagram 中關注人數破萬的素人、收看新興職業 Youtuber 的 Vlog 或是在. Ch. engchi. Google 查看眾多頗具噱頭的部落格文章,為的是從中獲得更多國內外的照片吸 晴的秘境、道地且 CP 值高的旅遊相關資訊,但用戶進行選擇時已經浪費大量 時間,更是沒有耐心再到一個人滿為患的目的地進行排隊,此為本研究動機之 一,以年輕人角度出發挑選景點,進行簡易且輕鬆的方式來取得遊客的旅行偏 好,進行個性化的推薦,探索免排隊的台北。 在智慧型手機普及的時代,通訊軟體增加了手機黏著度。交友 app 從早期 的愛情公寓、BeeTalk、Pairs 派愛族、到後來新加坡的交友軟體 Paktor 拍拖, 競爭市場擴大,也陸續推出更多元服務來因應廣大消費者的交友需求。其中 Paktor 首度前進線下整合,推出 Paktor Premium 創造實體約會服務,並在今年 10.

(11) 上半年就已創下 4,000 萬元營收(經理人月刊,2017)。此也是本研究動機之 一,抓住年輕人對於認識新朋友的渴望,將擁有相同興趣的朋友透過一起互動 遊戲的方式認識彼此,是一個可以進一步探討的趨勢。. 第二節 研究目的 綜合上述研究動機,欲在未來設計一款名為「瞎晃」的旅遊行動應用程 式(MOBILE APPLICATION),發想初衷是希望在這個資訊爆炸、資料量過載 的時代,在一個充斥海量國外觀光資訊的旅遊環境中,開發一個省時省力又能 在控制的預算和時間內,以台北市與新北市為主,讓不僅僅是台北人或是台灣. 政 治 大 行。而本次的研究內容,僅先探討註冊瞎晃 APP 時會進行到的小測驗並獲得景 立 人甚至是來自世界各地想要探索台灣的美的人們,皆可以有趣的方式不虛此. ‧ 國. 學. 點推薦的部分,因此,本研究主要使用羅吉斯迴歸分析方法,以大學及剛畢業 學生作為分析對象,設計適用於瞎晃 APP 中的測驗題目,探討依據受訪者的個. ‧. 人特性,進而開發一個有效的旅遊景點推薦的模型,故主要研究目的概區分為. y. sit. al. n. 旅客透過小測驗即可直接推送一個旅遊景點的流程。 二、. Ch. engchi. 探討此景點推薦模型之預測準確性。. er. 透過羅吉斯迴歸分析的應用,建立一個旅遊推薦模型,將不同特性的. io. 一、. Nat. 以下二項:. i n U. v. 第三節 研究流程 根據上述的研究動機及目的,首先,針對近年來旅遊觀光產業與羅吉斯迴 歸分析技術之相關文獻的研究;其次,了解旅遊產業在國內的發展環境趨勢與 技術的廣泛應用程度之後,開始設計與發放問卷以便相關研究內容進行蒐集、 整理與建模。應用羅吉斯迴歸進行分析,再依據分析結果作結論並發想後續延 伸。因此,本研究之整體研究流程,如圖 1-4 所示。研究架構安排如下:第壹 章為緒論,第貳章為文獻探討,第參章為研究方法,第肆章為研究分析,第伍 章為結論與未來展望。 11.

(12) 研究動機. 研究目的. 文獻探討. 政 治 大. 確定目標客群. 環境趨勢. 學. ‧ 國. 立. 研究方法. 問卷設計與資料整理. ‧ y. Nat. n. er. io. al. sit. 研究分析. Ch. en gchi 結論. 未來展望. 圖 1- 4 研究流程. 12. i n U. v.

(13) 第貳章. 文獻探討. 本章主要分為三節,第一節為近兩年內旅遊產業趨勢的研究,包括國外與 台灣的學術與網路研究報告;於第二節探討個性化旅遊景點推薦的相關研究, 分為兩個部分,一是國內外個性化推薦的成功案例,二是國內外個性化推薦在 旅遊產業上的學術研究;於第三節中,分為兩個部分,針對羅吉斯迴歸分析在 國內外之應用相關文獻研究,及羅吉斯迴歸分析在旅遊產業上的應用參考文 獻。. 第一節 旅遊產業趨勢概況 一、. 國外旅遊產業研究. 立. 政 治 大. Circella 等(2017)蒐集約 2,400 名美國加州居民,包括 2015 年千禧世代(青. ‧ 國. 學. 壯年,18-34 歲)和 X 世代(中年成年人,35-50)研究兩個不同世代對於旅遊. ‧. 選取的多模態行為分析,認為在研究旅遊模型選擇前更重要的是了解他們的時. y. Nat. 代成長背景與影響選擇的因素。像是研究結果顯示千禧世代相較於 X 世代,在. er. io. sit. 旅行時選擇騎腳踏車的方式多出 2 倍,選擇搭乘 Uber 或 Lyft 的方式多出三 倍,選擇通勤時搭乘接駁車或校車的方式多出 5 倍。後續探討年輕人之所以不. al. n. v i n 選擇開車甚至是延遲去考汽車駕照的原因,是因為他們比起 X 世代來說是重度 Ch engchi U 使用網路與智慧型手機 app 的族群,認為互聯網資訊在旅行當中能扮演解決多 種任務的角色,而加上環境保護意識提升,他們更偏好搭乘大眾交通工具。 一位印度學者 Ranteallo(2016)指出事實上通過社交媒體如 Instagram, Flickr,Tumblr,Youtube 和 Twitter 等進行食物交流,已經影響了許多人以各種 方式消費食物和飲料,並且吸引到不同的旅遊目的地體驗美食,是一個現今旅 遊的趨勢。遊客將在他們極具吸引力的美食體驗,品嘗的味道和樂趣的照片分 享出來並且使用標籤#foodgasm 和#foodporn,意思是烹飪與美食帶來的視覺與 味覺饗宴,網友們皆可以透過標籤被吸引到現場消費,擁有商機但這些都沒有 被當代旅遊研究人員廣泛研究。通過社交媒體,特別是以照片的形式,已經創 13.

(14) 造了對於多元化的食品生產,分銷和消費在供應鏈上更廣泛的認知。此外,涉 及食品美學的流行文化以及其社會與文化建設,也創造了美食攝影網站和部落 格對於烹飪旅遊宣傳和目的地行銷手法的相關性。 中國最賺錢的商業雜誌之一好奇心日報(2016)指出現今人們不再滿足於 單純的旅遊,人們追求一切領域的個性化和當地化,住在當地居民開的 Airbnb 裡,吃房東推薦的當地人常去的小餐館,穿得和當地人並無二致地走在本地居 民區。於是好奇心研究所從旅遊行業大會、業內公司,到各式各樣的年輕旅遊 者(1980 年代後出生的族群)的報導,也採訪了窮遊私人定制、Hive、白日夢. 政 治 大 制(早上九點到晚上九點,每週六天)下的年輕人並沒有太多時間專門休年 立. 旅行這樣的新型公司或項目中做了多個調查。研究結果顯示在國內, 996 工作. 假。另外,告別學生時代不久的年輕人,還記得自己當初總在利用得天獨厚的. ‧ 國. 學. 假期(和翹課)優勢錯峰出行。工作之後,他們也希望繼續這種不用擠火車也. ‧. 不用在景點數人頭的旅行,因此很多年輕人不會在黃金周旅行,而是選擇利用. y. Nat. 周末加年假拼湊一個小長假出來,或是利用兩份工作之間的間隙出遊,而對學. er. io. sit. 校裡的年輕人,留學或交換學生、異地戀和出差也成了各種被動旅遊的契機, 因此對於很多年輕人來說,一年中這種被動旅遊的次數超過了主動旅遊。除了. al. n. v i n 被動出行之外,以表 2-1 統整並挑選三點作為呈現好奇心日報三個面向來探討 Ch engchi U 中國旅遊產業的新趨勢。. 14.

(15) 表 2- 1 好奇心日報調查的中國旅遊產業新趨勢. 三大問題 年輕人如何 挑選旅行目 的地?. 重點 1. 重點 2. 早就看膩了老套的景 點,「鮮為人知」成了 當今對旅遊景點的最佳 封號之一。. 重點 3. 用過一次之後,就會因 為旅行信息太過時而慘 遭淘汰。. UGC 遊記最大的問 題是乾貨(沒有廢話 的長文)太少,研究 顯示有 1,036 人無法 忍受沒有乾貨的旅行 心情類 UGC 攻略, 393 人無法忍受「你 推薦個餐館,連地址 都沒有」。. 住青旅和 Airbnb 有時 治 政候的主要目的是滿足 大. 吸引年輕人 的旅行要素 有哪些?. 有超過 1/5 的人表示會特 別留心當地人喜愛的小 眾景點和美食。. 「認識當地人」的需 求,又不想 tinder 之類 的交友軟件。. 酒店很美的話,不太 在乎在當地具體怎麼 玩,可能出行前連行 程都沒規劃過,但卻 極度在意住宿品質。. 年輕人想跟 誰一起旅 行?. 根據 Google 提供數據顯 示,「獨自旅行創意」 (solo travel ideas) 在網絡. 一個合適的旅伴的評判 標準是:需要在對旅遊 景點的偏好、逛街、體. 年輕人喜歡自由行, 但並不能推斷出他們 討厭跟團。不喜歡傳. 上的搜索量增加了 50%,「獨自旅行目的 地」(solo travel destinations) 的搜索量則 每年增長 60% 還多。 根據 TripAdvisor 的數據 顯示中國女性其實更愛 獨自出遊,現在已經至 少有 43%的中國女性選 擇過獨自旅行,略高於. 力方面都跟自己匹配。. 統旅遊團的主要原因 是老套的導遊、景點 和購物店。. 立. n. er. io. sit. y. ‧. ‧ 國. 學. Nat. al. Ch. engchi. i n U. v. 全球 41%的平均水平。 綜合以上幾點,可以得知現在的年輕人認為互聯網上的資訊能解決大部分 的問題,因此做任何旅遊的行前規劃都仰賴著社群平台與網路上的海量資訊, 旅遊結束後再進行意見回饋,這麼一來,一個旅遊地點的網路評價對於任何商 家來說,就顯得格外重要。根據中國大陸國家旅遊局數據顯示遊客通過旅行社. 15.

(16) 進入景區的比例已經從 2010 年的 60%-70%下降到 2015 年的 20%-30% ,這也 是現今旅行社面臨到因為資訊衝擊下而必須開始轉型的主要原因之一。 二、. 台灣旅遊產業研究. 1997 年鈺林旅行社出資成立「玉山票務」後,台灣的旅行社開始進入了電 子商務的時代,當時科技的發展對於台灣的觀光業造成很大的衝擊。最重要的 衝擊,就是讓資訊的傳遞速度加快,更透明化。2005 年開啟了 Web2.0 時代, 旅遊網站同樣也進入 Travel2.0 模式,例如背包客棧的 UGC 模式、中國時報 旅行社推出「部落客旅行團」以及「旅遊經」改版推出台灣第一個旅遊部落格. 政 治 大 2008 年 Facebook 提供了繁體中文版進入台灣,更讓旅遊訊息可以在 立. 平台。(科技報橘,2017). Facebook 上有更多的曝光與接觸,由於旅遊資訊越來越透明,許多旅遊消費者. ‧ 國. 學. 跨過了旅遊中間代理商(旅行社 Travel Agent),直接在訂票訂房的網站上購. ‧. 買,然後自己規劃行程,加上廉價航空的興起,自由行成了最夯的旅遊模式,. y. Nat. 這時有意識到的旅行社開始想辦法設計出新的旅遊型態。接下來台灣智慧型手. er. io. sit. 機的使用在 2011 年後開始大量成長,手機變成是跟鑰匙及錢包一樣是出門必帶 的物品,當時網路資訊氾濫,傳統的旅遊網站已無法滿足個人旅遊的需求,這. al. n. v i n 時旅遊新創就如雨後春筍的發展,同時也受到國外及大陸新的網路經濟模式及 Ch engchi U 行動科技的影響,旅遊新創的變化也越來越多元化。(旅遊研究所,2017). 過去的年代,也就是所謂的旅遊 1.0,單向的旅遊服務,例如做了一組包套 的行程,就單向丟到市場去,消費者幾乎一定會買這個產品,因為資訊不對 稱,他們也沒別的產品可以買。後來旅遊 2.0,不同型態的業者就出來,也可以 說是分眾市場出現了。到了旅遊 3.0,已經不是所謂的分眾,而是在旅遊業者之 外,另外的社群在「聚眾」了,消費者的喜好也越來越精準了,讓觀光產業成 為一個「動經濟」,一個移動的經濟。如有人要路跑、健身、溯溪旅遊或節慶旅 等,等於到哪裡辦活動,哪裡的飯店就客滿。走到現今旅遊 4.0,旅遊業者變成 是一個策展人了,必須自己去找一個主張,以這個主張為基礎,包裝一個玩 16.

(17) 法,讓大家享受。用觀光業的術語來說,就是「跟團旅遊」的市場一直在縮小 中,以自我主張為主的「目的地旅遊」卻快速地蓬勃發展,在整個產業鏈裡 面,如食、衣、住、行、娛、購、遊,甚至商店、小街上的小販,只要是好的 伴手禮,都可能成為旅遊業者的元件商。這些資訊集結在自由行的行動網路系 統裡面,每個人拿著手機走遍全台灣,造成的商機很大(雄獅旅遊總經理黃信 川,2016) 。 三、. 台灣消費者的旅遊需求. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 2- 1 一張圖看懂台灣旅遊新創的模式. 如圖 2-1 顯示,以近年來的旅遊新創網站為主,大部份都跳脫了傳統旅遊 規劃的框架,為因應越來越夯的自由行、客製化服務及碎片化的需求(Tsai, 2016),使用兩岸比較常見的四種模式來說明: (一) 產品模式. 17.

(18) 新創的旅行社不再以大眾化的組團方式操作,而是以深度、客製化及高品 質來服務消費者,另外中小型的旅宿飯店業者也吹起了文創風,把在地的文化 融入到住宿的體驗,再來就是旅遊碎片化的需求,消費者買了機+酒之後,也可 以先出發前就先預訂好當地的體驗活動,讓自由行的行程安排更加豐富。 (二) 技術模式 這個模式通常需要有強大的 IT 技術能力,像整合旅遊產業的上游供應商 之後再提供 API 來讓各 OTA 或旅遊網站串接,另一種則是用搜尋技術或 一樣串接 API 把相關航空公司的機位、訂房網站的飯店,甚至於旅行社 的旅遊團來集中比價。. 政 治 大 有價值的內容才是王道,因為大家不想再看官方網站或是一般新聞媒體的 立. (三) 工具模式. ‧ 國. 學. 介紹,而轉向看專業達人的分享文,或是專業旅遊編輯匯整的策展好文,所以 專精一個或幾個旅遊地區的內容網站通常會受到歡迎,而把旅遊景點串成旅遊. ‧. 行程的規劃工具不見得實用,但如果可以在當地使用手機結合地圖模式再加上. sit. y. Nat. 導航,那對於旅行者就會很方便了。. io. er. (四) 社群模式. 旅遊前看別人的分享及口碑是一定要的,雖然背包客棧已經上線 10 幾年. al. n. v i n 了,不過在台灣仍是必看及討論互動的網站之一,另外把「空閒的資源」出租 Ch engchi U 如共乘模式等的分享經濟也慢慢在台灣開始流行,再來就是只需要付適當的費 用就可以找當地人帶你玩。. 第二節 個性化旅遊景點推薦的相關研究 一、. 個性化推薦國內外相關研究. 個性化推薦是根據用戶的興趣特點和購買行為,向用戶推薦用戶感興趣的 資訊和商品。這種瀏覽大量無關的網路資訊和產品過程,無疑會使淹沒在信息 過載問題中的消費者不斷流失。為解決這些問題,個性化推薦系統應運而生 (MBA 智庫百科)。而個人化(Personalization)與客製化(Customization)不. 18.

(19) 同的是,個人化是基於預測且運用大量數據分析,自動地提供消費者專屬訊 息,而客製化則是依消費者有意識的選擇,進而改善使用經驗(Lee,2018)。 本研究將以兩個國內外的產業的成功案例來說明個性化推薦是現今線上平台的 趨勢,以下分別是社群媒體平台個性化推薦、電子商務平台個性化推薦與影音 串流平台個性化推薦。 (一) 社群媒體平台個性化推薦 Facebook 於 2016 年二季度財報,其日活躍用戶總數(Daily Active User, DAU)達 13.3 億,營收總額 64.4 億美元中 84%來自於移動廣告。並在日活、用 戶黏度、廣告營收等數據上都甩掉競爭對手一條街。News feed(信息流)是. 政 治 大. Facebook 最重要的功能。它不同於以往的時間排序,而是機器算法依據用戶以. 立. 前點贊、評論、分享的內容,來推送用戶關心的內容。也就是說,如果你對朋. ‧ 國. 學. 友的照片點贊評論過,那麼下次這個朋友的照片出現的就比較靠前;若你隱藏 過 Candy Crush 遊戲的內容,那麼 Facebook 就會減少給你推薦遊戲內容的概. ‧. 率。而廣告是 Facebook 主要的營收來源,在獲取廣告主反饋的成交數據後,依. y. Nat. sit. 靠強大的機器學習系統優化整個轉化流程,並追溯到每一個展示所帶來的價. n. al. er. io. 值,讓廣告主看到了具體投入後的回報,然後按照價值收費。Facebook 之所以. i n U. v. 能夠按照展示收費,主要得益於 News Feed Ads 下將廣告插入信息流,作為內. Ch. engchi. 容的一部分個性化推薦給用戶。在 Facebook 投放後台,廣告主除了能根據用戶 性別、位置、使用設備等條件投放,還可選擇目標投放人群的興趣喜好、行為 特點等,比如上一秒你剛剛給朋友用 iPhone 6s 拍的照片點了贊,下一秒就看到 蘋果公司為你推薦他們的新產品了。借用 Facebook 積累了 10 年的機器學習技 術,廣告主將大大減少資金浪費在非目標用戶身上的可能(鈦媒體,2016)。 (二) 電子商務平台個性化推薦 淘寶用戶體驗研究專家渡劫(2013)指出,讓中國大陸三巨頭之一阿里巴 巴集團旗下的淘寶網擄獲消費者心的最主要關鍵是,淘寶網是一個以不斷提升 用戶體驗為己任的網站,最主要的關鍵是提供個性化服務。首先,根據用戶在. 19.

(20) 網站的瀏覽購物行為,提供操作頁面、搜索結果、商品推薦等方面的呈現差異 化服務;其次,根據現有的購物流程中的個性化需求,為用戶找商品提供更多 的維度,如寶貝標籤系統,用戶可以打破以往根據關鍵詞、類目逐級查找或搜 索商品的瀏覽習慣,而是使用標籤這種網狀的系統,來快速定位自己想找的商 品,或者在逛的過程中,找到哪些以往不知道怎麼才能找到的商品。還會推出 不同的導購頁面,社會化、移動化的應用等,也將會滿足用戶的需求。此外, 淘寶未來更像是平台的服務者和保障者,而非組織者。致使讓台灣目前有 80 萬 淘寶會員,市場也預估每年網購商機至少達到逾千億元新台幣。 (三) 影音串流平台個性化推薦. 政 治 大. 個人化推薦是 Netflix 引以為傲的特色,他們的首席產品官 Neil Hunt 表. 立. 示,Netflix 有 80%以上的電影觀看都是通過推薦生成的,而且 Netflix 推薦. ‧ 國. 學. 系統每年產生的價值超過 10 億美元。他們針對配圖的個性化定制,採用線上 學習框架「上下文老虎機」(contextual bandits),他能針對每個用戶和情境快速. ‧. 找出最優的個性化配圖選擇,如傾向於喜劇的用戶選擇了一位著名的喜劇演員. y. Nat. sit. 的圖片,同時為傾向於浪漫愛情劇的用戶選擇了一張在接吻的情侶的圖片. n. al. er. io. (Ashok et al.,2017)。. i n U. v. Spotify 和 Apple Music 都十分注重如何找出你可能會喜歡但是還沒接觸到. Ch. engchi. 的音樂。Apple Music 更主觀一些,他們會由所謂「專家」推薦你可能喜歡的音 樂;但 Spotify 相信人性永遠凌駕於演算法之上,會從和你聽同一首歌的使用者 歌單中找出那些你沒有聽過的音樂再推薦給你。Spotify 也相信歌曲可以用最少 的文字產生最大的影響,「很多時候,我們只是要找到能喚起人們情感最簡單的 事情。」當人們真正喜歡做這一件事情,例如聽音樂,只要有夠廣的音樂能提 供選擇、品質夠佳的音樂就能說服這些人每個月花 9.9 美金來成為 Spotify 的白 金會員,而在全球擁有高達 2000 萬的付費使用者,已是 Apple Music 的三倍 多。(淵浩,2016) 二、. 個性化旅遊景點推薦國內外相關研究 20.

(21) 國內外研究者從不同角度對旅遊相關系統做了大量的研究工作,先後提出 了多種旅遊系統模型。本文將統整近年來針對個性化旅遊系統研究的新動態研 究,分為以下三類:旅遊者特徵導向推薦系統、地理資訊導向推薦系統與文字 導向推薦系統。 (一) 旅遊者特徵導向推薦系統 許峰等人(2016)提出旅遊模型的重構,認為旅遊者在整個旅遊系統中處 於核心位置,整個旅遊系統中信息經過處理最終又反饋回旅遊者本身,這些信 息的作用就是為了更好的服務於旅遊者,這正是旅遊者在旅遊活動中關鍵作用 的體現,也符合服務主導邏輯下顧客中心的思想。然後對過去、現在與未來的. 政 治 大. 需求信息進行分析與數據挖掘。讓無論是旅遊者、景區、政府皆可用於服務優. 立. 化、偏好分析、實時監控、線路推薦、客流預測、精準營銷等方面。. ‧ 國. 學. (二) 地理資訊導向推薦系統. 肖政(2016)指出一些帶有地理位置標籤的圖片分享網站受到了用戶的歡. ‧. 迎,並隨之產生了海量的包含地理位置、拍攝時間、標籤等信息的照片。通過. sit. y. Nat. 對這些代地理標籤信息的照片集的挖掘,可以得到城市景點區域和用戶興趣偏. al. er. io. 好等信息,而利用這些信息又可以為用戶提供個性化的景點推薦服務。研究顯. v. n. 示對 Flickr 上分享的照片元數據分析後,大量照片的標籤信息偏少,因此在改. Ch. engchi. i n U. 進了用戶相似度推薦算法的基礎上使用 DBSCAN 類聚算法,綜合用戶偏好、照 片時間上下文、景點區域熱度信息,為用戶提供個性化旅遊景點區域推薦。 胡喬楠(2015)認為互聯網的旅客遊記以指數級快速增長,雖為旅行者景 點和路線甄選的重要考量,但其數量龐大、格式多樣、質量參差不齊,很難高 效、快速、準確地得到有用的資訊,因此到 travelBlog 與 travelPod 爬了 8 萬多 篇遊記,從中提取了每一篇的地理名詞,設計了一個地理本體樹算法與透過 closet+算法來進行關聯規則的旅遊景點推薦;行程路線規劃系統則參考 TripMine 創造了 Multiple Guide 算法進一步優化路線規劃效率,提出了多個優 化策略,通過快速剪枝,大大加快了路徑查找的速度。提出的推薦系統算法考. 21.

(22) 慮了旅遊景點滿意度、旅遊景點時間及旅遊景點費用這三個因素,為出行者提 供最合適的路線規劃。 (三) 文字導向推薦系統 Wen 等人(2017)提出,由於 Location-based social network(LBSN)服務 就是能夠讓用戶分享給朋友自身目前的定位,當用戶旅行時,這些定位資訊實 際上是具有一些照片和標籤資訊的旅行路線。因此,這些大量產生的路線在許 多完善的研究領域中發揮著如流動預測或交通管理等重要作用,而這篇文獻他 們著重在於旅行的規劃,並打算透過以地理定位為基礎的社交網路中的共享數 據發現旅行體驗。為了便於旅行計劃,他們可以讓用戶通過關鍵字指定他們的. 政 治 大. 偏好,並通過探索其他用戶曾經發布的可能關鍵字來擴展旅行計劃的輸入。然. 立. 而,現有旅遊路線推薦服務的查詢結果通常僅通過流行程度或路線上載次數來. ‧ 國. 學. 排列路線。對於這樣的排名可以得到一個評分函數,其中每條路線根據其特徵 (例如,地點的數量,地點的流行度)具有一個分數,於是他們建構了一個關. ‧. 鍵字感知代表旅行路線(KRTR)框架來檢索多個推薦路線,而其中關鍵字意味. y. Nat. sit. 著用戶對旅行的個性化需求。. n. al. er. io. 結合以上三類的個人化推薦,Memon 等人(2015)研究帶有時間和空間背. i n U. v. 景的地理標記照片,並結合歷史天氣數據推導出他們的天氣情況,以推薦上下. Ch. engchi. 文驅動的個性化語義旅遊位置。如根據從他的旅行歷史中獲得的用戶的旅行偏 好,預測他在一個陌生城市中的旅遊地點的旅遊偏好。他們以包含中國幾個城 市拍攝照片的 Flickr 資料集來驗證他們的推薦系統,結果顯示他們的推薦方法 與其他更先進的地標推薦方法相比,能夠產生更好的推薦與更準確地預測旅遊 者到一個陌生城市的偏好。結論是針對短期和有目的性的旅遊人群的個人偏好 用熱門度的方法來預測會較容易,而長期和深度旅遊的人群偏好則用協同過濾 法來預測會產生較好的結果。. 22.

(23) 第三節 羅吉斯迴歸分析之相關研究 一、. 國內外關於羅吉斯迴歸分析的研究. 事實上,許多社會科學的觀察都是分類的而不是連續型的,在面對二元應 變數的情況之下,羅吉斯迴歸分析模型應用的最為廣泛,常用於疾病罹患診 斷,經濟預測等領域,例如,探討引發疾病的危險因素,並根據危險因素預測 疾病發生的概率等。因此,本文將以下提到的三個構面來分別敘述羅吉斯迴歸 分析的應用已可以廣泛適用在各行各業上。分別是在醫療產業方面的羅吉斯迴 歸分析研究、在社會科學方面的羅吉斯迴歸分析研究與在地理環境方面的羅吉 斯迴歸分析研究。. 政 治 大. (一) 在醫療產業方面的羅吉斯迴歸分析研究. 立. Kitasako 等人(2017)要求在日本東京的總共 1,108 名年齡為 15 至 89 歲的. ‧ 國. 學. 受試者,完成自我管理的日常飲食,習慣和健康狀況問卷。將頻繁攝取含酸物 質或胃食道逆流病的受試者和至少一顆初始琺瑯磨損的牙齒置於 ETW(Erosive. ‧. Tooth Wear,受侵蝕影響的牙齒磨損)陽性組,將其餘受試者置於 ETW 陰性. y. Nat. sit. 組。進行多因素羅吉斯迴歸分析以確定與 ETW 共同相關的因素。分析結果顯. n. al. er. io. 示,碳酸飲料或運動飲料攝取的頻率增加與除了 70-89 歲的日本成年人之外的 所有年齡組的 ETW 發病率較高相關。. Ch. engchi. (二) 在社會科學方面的羅吉斯迴歸分析研究. i n U. v. Ahn 等人(2006)使用從韓國領先的移動電信服務提供商之一的數據庫中 的 5,789 個實際客戶交易和帳單數據樣本,除了調查了導致客戶流失的因素 外,也分析了客戶流失因素與客戶流失之間的中介效應,其中採用了三種羅吉 斯迴歸,首先,在自變量多項式羅吉斯迴歸模型被用於容納三個客戶狀態,其 次,對自變量的二元羅吉斯迴歸模型用於建模和分析客戶流失。第三,對自變 量和客戶狀態的二元羅吉斯迴歸模型用於分析客戶流失。這項研究不僅證實了 以往關於解釋性流失因素研究的一些結果,如通話質量,忠誠點和服務使用水 平被認為是影響移動電話市場客戶流失率的主要因素之一;還確定了新的研究 23.

(24) 結果,如投訴數量,忠誠點獎勵,計費金額,性別,通話計劃和手機互聯網功 能等因素直接或間接地影響了客戶流失的可能性,從而產生部分中介效應,與 如果有效實施客服處理部分,向客戶服務中心註冊的投訴數量可能會降低直接 客戶流失和客戶狀態更改為不使用的可能性等狀況。 (三) 在地理環境方面的羅吉斯迴歸分析研究 詹勳全等人(2012)依據 2009 年 8 月的莫拉克颱風崩塌資料,以羅吉斯 迴歸法建立阿里山森林鐵路附近邊坡之山崩潛感預測模式,為有效挑選模式內 之山崩潛感因子,利用山崩與非山崩次數分佈圖、崩壞比圖及檢測資料是否符. 政 治 大 形粗糙度、最大時雨量與總雨量等)的山崩組與非山崩組資料進行取樣後,以 立 合常態分配後進行因子篩選,針對各山崩潛感因子(如岩性、坡度、坡向、地. 羅吉斯迴歸法計算出各因子的羅吉斯迴歸係數,並建立客觀山崩潛感模式。並. ‧ 國. 學. 為了解所建立模式之優劣,利用分類誤差矩陣表對建置完成之山崩潛感模式進. ‧. 行結果驗證,山崩組正確率達 75.31%、非山崩組正確率有 68.75%、總體正確. y. Nat. 率達 69%,整體結果表現良好。用該結果繪製莫拉克颱風事件的山崩潛感圖,. er. io. sit. 可以發現莫拉克颱風新增山崩地區絕大部分位於中高及高潛感地區,代表未來 若與莫拉克颱風相似之極端降雨型態,則可以利用本研究所建立之山崩潛感模. n. al. Ch. 式,作為阿里山森林鐵路山崩預警之參考。 二、. engchi. i n U. v. 國內外關於羅吉斯迴歸分析與旅遊產業的研究. 羅紅等人(2014)認為全球低碳經濟背景下,鄉村旅遊低碳化發展是必然 趨勢。他們以 Crompton(1979)提出的推拉理論模型為基礎,將遊客低碳鄉村 旅遊決策行為影響因素歸為推和拉 2 類,依據對北京市 300 位遊客的調查建構 二元羅吉斯模型(願意、不願意去鄉村低碳旅遊)對其影響因素進行實證分 析。分析結果顯示,遊客的學歷、年出遊次數、鄉村旅遊滿意程度、感知到的 北京鄉村旅遊低碳發展緊迫程度及鄉村旅遊目的地總體特色與其低碳旅遊決策 呈正相關;而由於目前北京市低碳鄉村旅遊產品內容不夠豐富、目的地低碳旅 遊設施體系不完善以及旅遊者對低碳旅遊認知度不高等原因,對旅遊者低碳旅 24.

(25) 遊決策行為有一定的負面影響;比如,基於遊客對低碳旅遊認識度普遍較低、 不全面,導致低碳旅遊是一種窮遊行為的認識誤解區。 Boakye 等人(2017)提出針對 2014 年華盛頓地區家庭旅遊調查資料的一 些分析,調查了智慧型手機和非智慧型手機使用者 (兩者皆是高級旅行者資訊 系統的客戶,Advance Traveler Information Systems(ATIS)) 如何獲取和使用 旅行資訊,重點是這些系統如何影響他們的旅行行為。他們建構羅吉斯迴歸模 型以理解旅行者特徵和 ATIS 如何影響旅行決策。調查結果顯示,網路、智慧 型手機的 APP 和廣播是智慧型手機用戶最主要的信息來源,而網路,廣播和電. 政 治 大 者都不願意對他們的旅行計畫 (如更改模式、旅行路線/時間或取消行程) 做 立 視是非智慧型手機用戶最常用的信息來源。因此當智慧手機和非智慧手機使用. 出任何調整時,智慧型手機使用者比非智慧型手機使用者更可能決定改變計畫. ‧. ‧ 國. 學. io. sit. y. Nat. n. al. er. 路線。. Ch. engchi. 25. i n U. v.

(26) 第參章. 研究方法. 第一節 資料來源 本研究問卷來源分為網路問卷發放與紙本問卷發放,其中網路問卷是在 Facebook 平台上的政大 NCCU 交流版社團內進行發放,對象是政大 NCCU 交 流版內成員,含大學部、碩博士班學生與政大校友們,共回收 120 份;紙本問 卷的對象是政大統研所碩一和碩二的同學進行發放,共回收 34 份。由上述兩個 管道共計 154 份,其中男性受測者有 59 名,女性受測者有 95 名。本研究問卷. 政 治 大 「Clementine12.0」來進行後續景點推薦流程的資料分析。 立. 回收期間為 2017 年 12 月 18 日~2017 年 12 月 25 日止,使用資料探勘軟體. ‧ 國. 學. 第二節 研究架構. 本研究依據所欲探討之研究目的與近年來旅遊市場文獻研究之後,認為目. ‧. 前年輕人是帶動整個旅遊產業趨勢的一個族群,抓住吸引年輕人易淘汰老套的. sit. y. Nat. 旅遊方式、喜愛自由行與渴望結交新朋友的要素,開發一個可以一應俱全的模. al. er. io. 型。因此,將針對我的目標客群進行問卷的發放,蒐集初步的資料當作建構一. v. n. 個旅遊景點推薦模型的基底,來預測前來註冊的遊客能夠推薦的景點,並將獲. Ch. engchi. i n U. 得相同景點與相同特性的遊客組成一個團體,進行出團旅遊,如圖 3-1 顯示, 首先,運用探索性分析,了解此次受訪者的特性與其對於旅遊上的偏好與選 擇;其次運用羅吉斯迴歸分析進行推薦受訪者一個旅遊景點,將與問卷內容的 景點選擇做比對計算預測正確率,確定此模型的有效性;最後,將說明瞎晃 APP 後續流程設計。. 26.

(27) 問卷初始資料結合(網路問卷、紙本問卷). 數據準備. 探索性分析(用圖表顯示敘述性統計量). 分析前奏 數據分析. 羅吉斯迴歸分析 (模型建構、預測正確率檢測). 計算檢測. 立. 知識展現. 治 政 數據視覺化 大. 學. ‧ 國. 數 據 處 理 系 統. 資料導入(變數轉換、刪除、複選題處理). 用戶. ‧. 圖 3- 1 研究架構. sit. y. Nat. io. al. er. 第三節 問卷設計. v. n. 本研究之問卷共包含以下三個部分,基本資料、對於旅遊的偏好與蒐集旅. Ch. engchi. i n U. 遊景點的來源來進行基底資料建立模型,分別詢問性別、同行成員、旅行時在 意、考慮與需要滿足的要點、費用、季節、天氣與景點類型,問答形式之數值 類型是類別尺度(Nominal Scale);年齡、對於台北旅遊相關事項在社群媒體 上的關心度與美食景點的熟悉程度,問答形式之數值類型是順序尺度(Ordinal Scale)。發放的問卷設計 18 道測驗問題,並從中選取 14 道題目作為研究分 析,如表 3-1 顯示。. 27.

(28) 表 3- 1 變數名稱代號解釋. 問題變項 問題項 構面 內容. 變 數 名 稱 數值 (問題) 類型. 你是誰? (性別). 類別型. sex_M. 基本資料 Right now 幾歲? (年齡). 連續型. age. 對於旅遊 可以接受與素未 謀面 的 partner_1 的偏好 新朋友一起體驗旅行嗎? partner_2. 類別型. partner_3 partner_4. 立. 答案項 內容. 變數名稱 (答案). (1) 男. sex_M =1. (2) 女. sex_M=0. 18~39 歲. (1) 可以接受系統隨機 partner_1=1 分配人員,與您或您的 partner_2=0 朋友一起旅行 partner_3=0. 政 治 (2)大可以,但希望是一 群皆為同性的新朋友. 學. ‧ 國. 18,19,20,21,22, 23,24,25,26,27, 28,35,39,43.. partner_4=0 partner_1=0 partner_2=1 partner_3=0 partner_4=0. ‧. (3) 可以,但希望一群 partner_1=0 當中可以有男有女 partner_2=0 partner_3=1 partner_4=0 (4) 不可以!我只想要 partner_1=0 一個人的旅行 partner_2=0. er. io. sit. y. Nat. v ni. n. al. Ch. U 不可以!我只想跟 e n g c h i (5) 我朋友一起旅行. 你選擇旅行地點 時的 考 care_1 量通常最在意的是? care_2. 類別型. (1) 預算($$$). partner_3=0 partner_4=1 partner_1=0 partner_2=0 partner_3=0 partner_4=0 care_1=1 care_2=0 care_3=0. care_3. 28. (2) 距離. care_1=0 care_2=1 care_3=0. (3) 天氣. care_1=0 care_2=0 care_3=1.

(29) 景點(包含:類型/ care_1=0 新鮮度/熱門度) care_2=0 (4). care_3=0 以台北一日遊來說,你最 money_1 多可以接受多少 的報 名 money_2 費用呢? money_3 (僅包含抵達目的地後開 始的整趟行程的 吃喝 玩 樂+交通費用). 類別型. (1) NT$200 內. money_1=1 money_2=0 money_3=0. (2) NT$500 內. money_1=0 money_2=1 money_3=0. (3) NT$1,000 內. money_1=0 money_2=0 money_3=1. 立. (4) NT$1,000 以上 治 政 大 類別型. (1) 春. ‧ 國. 學. 一年四季當中喜 歡的 季 season_1 節? season_2 season_3. y. season_3=0 season_1=0 season_2=0 season_3=1. n. er. io. al. season_1=0 season_2=1. sit. Nat. (3) 秋. Ch. engchi. 你喜歡什麼樣的 天氣 狀 weather_1 態呢? weather_2 weather_3. 類別型. 29. season_1=1 season_2=0 season_3=0. ‧. (2) 夏. money_1=0 money_2=0 money_3=0. v i n (4) 冬 U. season_1=0 season_2=0 season_3=0. (1) 晴天. weather_1=1 weather_2=0 weather_3=0. (2)陰天. weather_1=0 weather_2=1 weather_3=0. (3)雨天. weather_1=0 weather_2=0 weather_3=0. (4)沒特別偏好/無感. weather_1=0 weather_2=0.

(30) weather_3=1 旅 行 的 景點選擇 通常 會 prefer_1 prefer 哪一種類型? prefer_2 prefer_3. 類別型. prefer_1=1 prefer_2=0 prefer_3=0. (2) 熱門打卡聖地. prefer_1=0 prefer_2=1 prefer_3=0. (3) 大自然秘境. prefer_1=0 prefer_2=0 prefer_3=1. (4) 很懶且沒有特別喜 prefer_1=0 好/跟隨朋友類型 prefer_2=0 prefer_3=0 (1) 飲食 playoreat_1=1. 政 治 大. 旅 行 時 你是你更 重哪 一 playoreat_1 類別型 點? playoreat_2. 立. (1) 巷弄內私房景點. playoreat_2=0. (2) 玩樂. ‧ 國. 學. (3) 以上皆重. n. Ch. y. al. satisfy_1=1 satisfy_2=0 satisfy_3=0 satisfy_4=0. er. io. satisfy_3 satisfy_4. engchi. playoreat_1=0 playoreat_2=0. (1) 冒險犯難. sit. 類別型. ‧. Nat. 你會希望旅行帶 給你 什 satisfy_1 麼樣的滿足? satisfy_2. playoreat_1=0 playoreat_2=1. v. (2) 放鬆愜意. satisfy_1=0 satisfy_2=1 satisfy_3=0 satisfy_4=0. (3) 嘗鮮. satisfy_1=0 satisfy_2=0 satisfy_3=1. i n U. satisfy_4=0. 30. (4) 朝聖心. satisfy_1=0 satisfy_2=0 satisfy_3=0 satisfy_4=1. (5) 以上皆是. satisfy_1=0 satisfy_2=0 satisfy_3=0.

(31) satisfy_4=0 平時對於 FB 上推播的旅 fbig 遊相關資訊/Instagram 朋 友 or 網美打卡景點的關 蒐集旅遊 心度多高? (0-10 分) 景點的來 對台北 (包含台北市與新 tpfood 源 北市)美食景點熟嗎? (0-. 連續型. 0~10 分. 0,1,2,3,4,5, 6,7,8,9,10. 連續型. 0~10 分. 0,1,2,3,4,5, 6,7,8,9,10. 對台北 (包含台北市與新 tpsite 北市)觀光景點熟嗎? (010 分). 連續型. 0~10 分. 0,1,2,3,4,5, 6,7,8,9,10. 哪一種城市體驗你會愛? (可以複選). 類別型. (1)網美這麼好當? (ex: y1 熱門打卡餐廳/景點). 10 分). 立. y. 政 治 (2)踏上文青之旅! (ex: 大 市集/展覽等). y2. (4)小當家 (ex:烹飪教室). y4. (5)越夜越美麗. y5. ‧. ‧ 國. 學. (3)飛簷走壁(ex:激烈的 y3 室內外活動). y. Nat. (ex:夜景/酒吧). sit. n. al. er. io. (6)C'est la vie! 享 受 人 y6 生!(隨意驚喜景點). Ch. engchi. 31. i n U. v.

(32) 第四節 羅吉斯迴歸分析 本節將本研究有使用到的技術分兩個部份來介紹,分別是羅吉斯迴歸分析 定義與虛擬變數的介紹。 一、. 羅吉斯迴歸分析定義. 羅吉斯迴歸(英語:Logistic regression 或 Logit regression) ,即邏輯模型(Logit model,也譯作「評定模型」 、 「分類評定模型」)是離散選擇法模型之一,屬於多 重變量分析範疇,是社會學、生物統計學、臨床、數量心理學、計量經濟學、市 場行銷等統計實證分析的常用方法。. 政 治 大 的機率用符號 𝑝表示,機率值的範圍應在 0 與 1 之間。若以線性迴歸方程式來表 立. 學. 示,. E(Y = 1|X) = β0 + β1 X1 + ⋯ + β𝑘 X𝑘. ‧. ‧ 國. 使用羅吉斯迴歸時,依變相(Y)需是二元分類的變項,事件發生(Y=1). 表示在特定自變項(X)數值的情況下,預測或估計依變項 Y=1 的平均值,然. sit. y. Nat. 而在特定 X 數值下,平均值的範圍有可能大於 1 或小於 0,為了避免碰到上述的. al. er. io. 難題,將條件機率 P(Y=1|X)作為羅吉斯轉換(Logistic or Logit transformation) ,. v. n. 也就是事件發生(Y=1)的勝算(Odds of event)取自然對數。在此情況下,於特. Ch. engchi. i n U. 定 X 下,依變項(Y=1)的分佈是二項式分佈(Binomial Distribution) ,其平均值 為特定 X 數值下,事件發生的條件機率,π(x) = P(Y = 1|X = x),即當 X=x 時, Y=1 的機率。方程式如下: π(𝑥). 𝑙𝑜𝑔𝑖𝑡 [𝜋(𝑥)] = log (1−π(x)) = β0 + β1 X1 + ⋯ + β𝑘 X𝑘 π(x) =. eβ0 +β1 X1 +⋯+β𝑘 X𝑘 1+eβ0 +β1 X1 +⋯+β𝑘 X𝑘. =. 1 1+e−(β0 +β1 X1 +⋯+β𝑘 X𝑘 ). (1) (2). 第(1)式中,某一自變項的羅吉斯歸係數取指數後的值,我們稱它為勝算 比(Odds ratio) ,如自變項 X1 羅吉斯迴歸係數為β1,對羅吉斯迴歸係數β1取指數 後為eβ1 (廖麗娜,2010)。. 32.

(33) 羅吉斯迴歸與線性迴歸相比具有許多獨特的優點,如對正態性和方差齊性 不做要求,對自變量類型不做要求、係數的可解釋性等。儘管羅吉斯迴歸應用如 此廣泛,但在具體使用中主要存在三個問題:資料的適合、適合度檢定及迴歸診 斷問題(馮國雙、陳景武、周春蓮,2004)。 (一) 資料的適合問題: 在應用羅吉斯迴歸方法前,首先應分析該資料用羅吉斯模型是否適合,這就 是資料的適合性問題。當迴歸模型的自變量為分類變數時,可以不必考慮線性關 係,但當自變量為連續型變數時,則需要檢驗兩者之間的線性關係是否成立,如. 政 治 大 以恰當的方式進入方程式。嚴格來說,因為如果兩者之間的關係是非線性的,參 立. 果不成立,應進行相應的變數變換,如對數變換、指數變換、多項變換等,使其. 數估計將發生偏差,從而導致結果的不準確已及結論的不可靠。判斷自變量與. ‧ 國. 學. logit p 之間是否具有線性關係可用多種方法,而比較簡單的一種方法是在模型中. ‧. 加入非線性項,從而判斷出自變量與 logit p 是否有非線性關係。羅吉斯迴歸模型. y. Nat. 對樣本含量有一定的要求,一般經驗認為,樣本規模至少應是自變量個數的 10. er. io. sit. 倍以上。當樣本含量過少時,估計的方程式會顯得不穩定,係數與標準誤的估計 也會使方程式變得無法解釋。. n. al. Ch. (二) 適合度檢定的問題:. engchi. i n U. v. 建立模型並進行假設檢驗只說明了模型中的迴歸係數是否具有統計學意義, 但並不表明模型適合度的效果如何。適合度檢定檢驗結果出來,適合度的效果好, 所做出的結論才更符合事實,若效果不好,預測值與實際值差別較大,得出的結 論是不可靠的。然而,有在文獻中發現有文章所用的評價指標是判定係數 R2,這 是不恰當的。R2 是多元線性迴歸中經常用到的一個指標,表示應變量的變動中油 模型中自變量所解釋的百分比,並不涉及預測值與觀測值之間差別的問題。在羅 吉斯迴歸當中,評價模型適合度檢定的指標主要有 Pearson 卡方檢驗、偏差 (Deviance) 、Homer-Lemeshow(HL)指標、AIC、SC 等。Pearson 卡方和 Deviance 主要用於自變量不多且為分類變量的情況,當自變量增多且含有連續型變量時, 33.

(34) 用 HL 指標則更為恰當。Pearson 卡方、Deviance 和 HL 指標值均服從卡方分佈, 當檢驗顯示無統計學意義(p-value>0.05)表示模型適合度檢定適合的好。而 AIC 與 SC 指標還可用於比較模型的優劣,當適合多個模型時,可以將不同模型按其 AIC 和 SC 指標值排序,AIC 和 SC 值較小者一般認為適合得更好。 (三). 迴歸診斷問題:. 即使資料符合羅吉斯迴歸應用的條件,所求模型的適合程度也不一定很好, 因為模型中很可能存在相關性較強的幾個變數或較為特殊的幾個樣本,從而影響 模型的適合度效果,這時就應該對模型進行多重共線性診斷以及離群值識別等。. 政 治 大 ( Tolerance )、 變 異 數 膨 脹 因 素 ( Variance Inflation Factor, VIF )、 條 件 指 數 立. 羅吉斯迴歸與多元線性迴歸一樣也存在多重共線性問題,其診斷可以用容忍度. (Condition Index)、變異比率(Proportion of Variation)等指標來表示。. ‧ 國. 學. 二、. 虛擬變數的介紹. ‧. 變數可以分為可用數量表現的連續型變樹的數量變數,和無法定量度量的屬. y. Nat. 性變數,如性別、職業、季節等。因此為了在模型當中能夠反映這些因素的影響,. er. io. sit. 並提高模型的精度,需要將他們量化,而這種量化通常是通過引入虛擬變數來完 成的。根據這些因素的屬性類型,構造只取 0 或 1 的人工變量,通常稱為虛擬變. al. n. v i n 數(Dummy Variable) 。如教育程度分為三個層次,高中以下、高中、大學及其以 Ch engchi U 上。這時需要引入兩個虛擬變量:(MBA 智庫文檔) D1 = {. D2 = {. 1, 高中 0, 其他. }. 1, 大學及其以上 0,. 其他. }. 模型可以寫為: 𝑌𝑖 = β0 + β1 X1 + β2 D1 + β3 D2 + 𝜀. 34.

(35) 其中,高中以下的模型為: E(Y𝑖 |𝑋𝑖 , D1 = 0, D2 = 0) = β0 + β1 X1 高中的模型為: E(Y𝑖 |𝑋𝑖 , D1 = 1, D2 = 0) = (β0 + β2 ) + β1 X1 大學及其以上: E(Y𝑖 |𝑋𝑖 , D1 = 0, D2 = 1) = (β0 + β3 ) + β1 X1. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 35. i n U. v.

(36) 第肆章. 研究分析. 本章於第一節中,針對問卷內容填答狀況資料進行探索性分析,其次,在第 二節運用羅吉斯迴歸分析方法建立景點推薦模型與探討模型的預測準確率。. 第一節 探索性分析 本節將以問卷的三個構面來進行探索性分析,首先,第一小節探討此次受訪 者地基本資料概況,並繪製統計圖,其次,在第二小節中,針對受訪者對於旅遊 的偏好繪製統計圖表並觀察其特性,最後,在第三小節中,對於受訪者蒐集旅遊. 政 治 大. 景點的來源繪製統計圖並觀察其特性。 一、 基本資料概況. 立. ‧ 國. 學. 年齡組成. 性別. ‧. 男, 38%. 23<=AGE<24 23%. 20<=AGE<21 9%. y. Nat. sit. 18<=AGE<19 10%. n. al. 21<=AGE<22 13%. Ch. er. io. 女, 62%. 25<=AGE<26 5%. i n U. v. e n g c h i24<=AGE<25 12%. 19<=AGE<20 10% 22<=AGE<23 12%. 圖 4- 2 年齡組成比例. 圖 4- 1 性別組成比例. 由圖 4-1,圖 4-2 顯示,可以知道此次問卷受訪者的基本特徵,男女比大約 是 4:6 的狀態,在教育部統計處公布最新的數據顯示(University TW, 2017)國立 政治大學全校的男女比也將近 4:6 的狀況,所以問卷結果是均衡的;年齡分布以 18~26 歲為主,其中又以滿 23 歲的族群佔最大比例,整體對於目標族群的分布 上還算均衡。. 36.

(37) 二、 對於旅遊的偏好 可以接受與素未謀面的新朋友 一起體驗旅行嗎? 可以接受系統隨機分配人員,與您或您的朋友 一起旅行. 57. 可以,但希望一群當中可以有男有女. 46. 不可以!我只想跟我朋友一起旅行. 42. 可以,但希望是一群皆為同性的新朋友. 5. 政 治 大. 不可以!我只想要一個人的旅行. 立. 4. 0. 10. 20. 30. 40. 50. 60. 圖 4- 3 對於旅伴的考量. ‧ 國. 學. 由圖 4-3 中可以看出,此次問卷的受訪者,占比最多且接近 4 成的人是願意. ‧. 隨機被系統分配旅伴的,接近 3 成的人更希望隨機之餘能夠有異性組成的團體一 起旅行,而有 27%的人堅持希望與自己熟識的朋友一起旅行,而在問卷後面的意. y. Nat. io. sit. 見回饋欄提到大部分原因是擔心遇到個型不合的陌生旅伴,而影響了自己整趟旅. n. al. er. 行的心情。要求希望是同性旅伴或是想要一個人旅行的人佔少數(各佔 2%~3% 的人)。. Ch. engchi. i n U. v. 你選擇旅行地點時的考量通常最在意的是? 預算. 70. 景點(包含:類型/新鮮度/熱門度). 59. 天氣. 18. 距離. 7 0. 10. 20. 30. 40. 圖 4- 4 選擇旅行地點時最在意的因素 37. 50. 60. 70. 80.

(38) 由圖 4-4 中可以看出,有 45%的人在選擇旅行地點時最在意的因素是預算, 而近 40%的人在意的是旅行的景點,12%的人在意天氣狀況,而把距離放在最在 意的因素的族群只佔了 3%~4%,這裡可以粗淺地推論出,此次受訪的年輕族群 們,出門旅遊只要控制在合理的預算內,景點的新鮮度與熱門度為大家最在意的 因素,無論這個景點的距離有多遠,都是有意願前往的。. 以台北一日遊來說, 你最多可以接受多少的報名費用呢? NT$1000內. NT$500 內. 37. 30. ‧ 國. NT$200 內. 政 治 大. 學. NT$1000 up. 立. 81. 6. 10. 20. 30. 40. 50. 60. 70. ‧. 0. 90. Nat. y. 80. sit. 圖 4- 5 台北旅行的報名費用接受範圍. n. al. er. io. 由上述統計得知預算是此次受訪的年輕族群旅行時最多人在意的因素,而. i n U. v. 如圖 4-5 顯示,以台北一日遊來說,受訪的年輕族群可以接受的預算比重由高. Ch. engchi. 到低分別是新台幣 1,000 元內(52.6%)、新台幣 500 元內(24.03%)、新台幣 1,000 元以上(19.48%)、新台幣 200 元內(3.9%)。說明隨著經濟快速發展與 人民生活水平的提高,年輕族群可以負擔的娛樂預算是出乎意料的高。. 38.

(39) 一年四季當中最喜歡的季節? 夏 11%. 冬 12%. 秋 59%. 春 18%. 政 治 大. 圖 4- 6 一年四季當中最喜歡的季節. 立. 圖 4-6 顯示,有 77%的人喜歡界在轉換夏天與冬天的交界之間的秋天與春. ‧ 國. 學. 天,這說明了年輕族群喜愛這種涼爽宜人的氣候,其中又以喜愛秋天的人佔了 將近 60%的大多數。. ‧. n. al. er. io. sit. y. Nat. 你喜歡什麼樣的天氣狀態呢?. 沒有特別偏好/ 無感 2%. Ch. engchi. i n U. v. 晴天 80% 陰天 18%. 圖 4- 7 喜歡的天氣狀態. 由圖 4-7 顯示,喜歡的天氣狀態中,選擇晴天的比例最高,占 80%,其次有 18%的人選擇陰天,2%的人對於天氣沒有特別偏好,0%的人選擇雨天。結合圖 4-6 與圖 4-7 明顯地說明著,涼爽晴朗的好天氣是大部分年輕族群的偏好。. 39.

(40) 旅行的景點選擇通常會prefer哪一種類型?. 大自然秘境. 52. 很懶且沒有特別喜好/跟隨朋友類型. 50. 巷弄內私房景點. 45. 熱門打卡聖地. 7 0. 10. 20. 30. 40. 50. 60. 政 治 大. 圖 4- 8 旅行景點的選擇類型偏好. 立. 從圖 4-8 來看,首先,意外的發現熱門打卡景點僅占了 4.5%,反倒是大自. ‧ 國. 學. 然秘境與項弄內私房景點共占了 63%。這說明了比起跟風到人擠人的景點,年 輕族群更是傾向前往鮮為人知的大自然美景與道地美食。這充分驗證了第二章. ‧. 文獻探討中好奇心日報有提出的對於年輕人的觀察報告之一。但這邊甚至也發. Nat. sit. y. 現了有 30%的人是沒有特別目的地嚮往的被動族群,這個占比也是不容忽視,. al. n. 擇。. er. io. 此現象說明了花五分鐘的時間直接提供一個推薦景點套餐給他更是適合他的選. Ch. engchi. i n U. v. 旅行時你更重哪一點?. 飲食 25%. 以上皆重 58%. 玩樂 17%. 圖 4- 9 旅行時重吃還重玩 40.

(41) 由圖 4-9 顯示,有接近 60%的人旅行時飲食與玩樂皆重視,而重視飲食的 人多過於重視玩樂的人。這說明了對於年輕族群在一個旅行的規劃當中,除了 景點的滿足之外,美食的享用更是不可忽視的重點! 你會希望旅行帶給你什麼樣的滿足? 以上皆是 20%. 嘗鮮 11%. 朝聖心 1%. 立. 冒險犯難 1%. 政 治 大. 放鬆愜意 67%. ‧ 國. 學 圖 4- 10 希望旅行帶來的滿足. ‧. 由圖 4-10 來看希望旅行時帶給你什麼樣的滿足發現,選擇放鬆愜意的比例. sit. y. Nat. 最高,占 67%,其次,選擇是選擇全方位滿足,比例為 20%,最後擁有 11%選. n. al. er. io. 擇嘗鮮的心態。這說明了大部分的年輕族群還是會傾向行程不會太過緊湊、步. i n U. v. 調慢一點可以享受周遭氣氛、感受城市的氣息的這種規劃,而新型有噱頭的景. Ch. engchi. 點也擁有喜愛嘗鮮的市場。至於選擇以上皆是 20%的族群,我認為,並不是說 每一項都必須要滿足他們,反倒是各種類型的活動他們都不排斥且願意將各種 元素納入旅行當中。. 41.

(42) 三、 蒐集旅遊景點的來源 平 時 對 於FB / INS TAGRAM 上 推 播的 旅 遊 資 訊 、 朋 友 OR網 美打卡景點的關心度多 高 ? 30 25. 數量. 20 15 10 5 0 0. 1. 2. 3. 4. 5. 6. 7. 政 治 大. 8. 9. 10. 關注程度. 立. 圖 4- 11 平時對於 Facebook/Instagram 上的旅遊訊息關注程度. ‧ 國. 學. 這裡是調查平時對於社群媒體 Facebook 或是 Instagram 平台上的旅遊資訊. ‧. 的關注程度用 0 分~10 分來表示,分數越高表示關注程度越高。可以從圖 4-11 看. Nat. sit. y. 到整體呈現左偏的狀態,這說明整體關注程度是偏高的,有約莫一半的人關心程. n. al. er. io. 度是超過 5 分,這也意味著年輕族群是容易受到社群平台如 Facebook 或 Instagram. i n U. 上的資訊影響並且被吸引前往觀光。. Ch. engchi. v. 對台北 ( 包 含台北市與新北市 )景 點熟嗎 ? 美食景點. 遊玩景點. 40 35 30 數量. 25 20 15 10 5 0 0. 1. 2. 3. 4. 5. 6. 7. 8. 熟悉程度. 圖 4- 12 對台北的美食與遊玩景點的熟悉程度 42. 9. 10.

(43) 可以看到圖 4-12 這邊我將對台北的美食景點與遊玩景點熟悉程度繪製在同 一張圖中,與圖 4-11 一樣用 0 分~10 分來表示熟悉程度,分數越高表示對此類型 越熟悉。用比較圖可以更明顯地看出大家對於台北遊玩景點的熟悉程度比起美食 景點還要更高,這也代表著年輕族群對於系統中台北的景點要求會更為嚴苛,鮮 為人知的景點才能獲得他們的認可,而美食景點大家熟悉程度保持著較普通的態 度,表示說在對於美食並沒有太過熟悉的狀況下,尋找熱門景點來作為美食景點 在現階段來說是可以接受的。. 哪一種城市體驗你會愛?. 政 治 大. 0.7468. C'est la vie!享受人生!(???隨意驚喜景點). 立. 0.4545. 學. 踏上文青之旅! (ex:市集/展覽等). 0.4481. 小當家(ex:烹飪教室). 0.2922. 網美這麼好當? (ex: 熱門打卡餐廳/景點). Nat. 飛簷走壁(ex: 激烈的室內/室外活動). n. 圖 4- 13 喜愛的城市體驗. Ch. engchi. sit. 0.1948. er. io. al. y. 0.2662. ‧. ‧ 國. 越夜越美麗(ex:夜景/酒吧). i n U. v. 對喜愛的城市體驗調查發現如圖 4-13,由於這題是複選題的關係,每個人都 會選擇 1 個以上的城市體驗,因此這裡的百分比是將所有選該類別的總數占整體 受訪者的比例。選擇隨意驚喜景點比例約占 75%,其次是夜景或酒吧景點約占 45%左右,再來依序是市集或展覽等活動景點(約 45%)、烹飪教室等廚藝課程 景點(約 29%) 、熱門打卡餐廳或景點(約 27%)與激烈室內外活動(約 20%) 。 這說明年輕族群對於未知的世界是比較有興趣的,現在的時代選擇太多,每天都 在面臨海量的網路資訊接收,而想要旅遊就是希望獲得片刻的放鬆,因此,不用 選擇就是最好的選擇了。. 43.

(44) 第二節 建立旅遊景點推薦模型 本節將以羅吉斯迴歸分析來建立旅遊景點的推薦模型,首先,第一小節說明 模型建立的過程,其次,在第二小節中,會針對模型來檢驗其預測準確率。 一、. 建立模型. 首先,在將資料匯入 clementine 進行分析前,先來做資料整理的步驟。我們 先將從網路與紙本問卷蒐集到的答案合併過後,將問卷最後一題喜歡的旅遊景點 作為此次的應變數 Y 來建模,由於 Y 當初設定的是複選題,因此將 Y 拆解成 Y1~Y6,表示成 6 個變數,代表 6 種旅遊型態並建立 6 條旅遊景點推薦模型。接. 政 治 大 有離散型態的 X 都設成虛擬變數來進行建模。 立. 下來,將其他問卷題目當成自變數 X,由於 X 有連續型態與離散型態,因此將所. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. 圖 4- 14 羅吉斯迴歸模型流程圖 1. 44. v.

(45) 圖 4- 15 羅吉斯迴歸模型流程圖 2. 政 治 大 依據圖 4-14、圖 4-15 的羅吉斯迴歸分析串流,可以清楚看到選擇模型當中 立. ‧ 國. 學. 的過程。首先,藉由讀取資料的節點(名稱為 dummy.txt)將上述整理過後的資料 導入系統,其次,透過 Filler 的節點將 y1~y6 的變數中空白值補 0。再者,應用. ‧. 羅吉斯迴歸分析分別使用 enter 選模方式的節點(名稱為 y=1 enter)、forwards 選. sit. y. Nat. 模方式的節點(名稱為 y=1 forwards)、backwards 選模方式的節點(名稱為 y=1. io. er. backwards)進行景點的推薦模型,其中,enter 表示將所有欄位直接輸入方程式,. al. 建模時不進行欄位選擇;forwards 表示使用向前選取法,透過逐步納入系統檢定. n. v i n Ch 後的最佳欄位進入模型,直到無法對模型產生足夠改進時,即為最終模型; engchi U. backwards 表示向後選取法,初始模型包含作為預測變數的所有欄位,逐一將對 模型貢獻最小的欄位刪除,直到不對模型功能造成重大損害時產生最終模型(謝 邦昌等人,2017)。以此類推六個模型的建造過程,最後,依據 Logistic 金磚節 點提供個別的推薦模型,以下我們將透過三個指標來評斷模型的效果,進而決定 本文的最終模型,分別是 Omnibus Tests of Model Coefficients 來進行模型適合度 檢定、Cox & Snell R Square 和 Nagelkerke R Square 來比較模型的解釋能力,最 後用模型的 Classification Table 來看模型的預測能力。. 45.

(46) 表 4- 1 Omnibus Tests of y1 Model Coefficients. Omnibus Tests of Model Coefficients (y1) Step. Chi-square df. Sig.. enter. 52.906. 29. 0.004. forwards. 22.242. 2. 0. backwards 40.528. 8. 0. y1 的模式係數的 Omnibus 測試相當於線性迴歸裡的 ANOVA-F 檢定,探討 羅吉斯迴歸模型中的β係數是否全部為 0,如下顯示: H ∶ 𝛽=0 政 治 大 H ∶ 𝛽≠0 0. 立. 1. 由表 4-1 可以觀察到三種模型的顯著性(Sig.)p 值<0.05,拒絕虛無假說。. ‧ 國. 學. 有足夠證據顯示此 y1 的羅吉斯迴歸模型是顯著的,具有預測能力。. io. y. 0.291 0.424 a 125.573(a) v i0.196 l C forwards 156.237(a) 0.134 n h e n 0.231 backwards 137.951(b) g c h i U 0.337. n. enter. -2 Log Cox & Snell Nagelkerke likelihood R Square R Square. sit. Step. y1. er. Nat. Model Summary of. ‧. 表 4- 2 Model Summary of y1. 接下來,根據表 4-2 顯示,取決於 Cox & Snell R Square 與 Nagelkerke R Square,enter 的模型之應變量可以被解釋的變異比例在 29.1% ~ 42.4%之間,為 三種模型之中解釋能力最高者,因此 enter 模型是相較之下較好的選擇。. 46.

參考文獻

相關文件

1900年, Bachelier以數學方法分析巴黎股票交易的價格變化,自

4.1 多因子變異數分析 多因子變異數分析 多因子變異數分析 多因子變異數分析與線性迴歸 與線性迴歸 與線性迴歸 與線性迴歸 4.1.1 統計軟體 統計軟體 統計軟體 統計軟體 SPSS 簡介 簡介

表 2.1 停車場經營管理模型之之實證應用相關文獻整理 學者 內容 研究方法 結論

住宅選擇模型一般較長應用 Probit 和多項 Logit 兩種模型來估計,其中以 後者最常被使用,因其理論完善且模型參數之估計較為簡便。不過,多項

樹、與隨機森林等三種機器學習的分析方法,比較探討模型之預測效果,並獲得以隨機森林

則巢式 Logit 模型可簡化為多項 Logit 模型。在分析時,巢式 Logit 模型及 多項 Logit 模型皆可以分析多方案指標之聯合選擇,唯巢式 Logit

近年來,國內外已經有很多學術單位投入 3D 模型搜尋的研究,而且在網路 上也有好幾個系統提供人使用,例如台灣大學的 3D Model Retrieval

本研究於 2017 年 2 月至屏東縣 10 所校園採集使用水源及經淨水處理