• 沒有找到結果。

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

9

第一章 緒論

第一節 研究背景

網路幾乎已經成為了日常生活中不可或缺的一部份,隨著軟硬體技術逐漸進 步,人們能夠透過網路完成的事越來越多,過去人們需要在商店購買產品,如今 電子商務提供人們直接在網路上購買實體商品的服務。然而沒有親眼看到商品,

人們要分辨商品的好壞就只能透過照片和他人的評價,有一項針對美國人進行的 調查(Horrigan 2008)顯示,有百分之 81 的美國人在購買商品前會上網搜尋商品評 論至少一次,其中有 73%到 87%的人表示商品評論顯著影響他們的購買意願;

Aggarwal (2016)也提到網路是商業和電子商務的重要媒介,隨著網路的日漸發達,

電子商務必將慢慢取代實體商店,線上產品評論系統正是在這樣的環境下誕生並 快速發展。

現在已經有各式各樣的網站提供人們對各式各樣的商品進行評價,這些商品 不只侷限於實體商品,甚至還能評價音樂、電影等等產品。有些網站是專門架設 給人們評論各大廠商的商品,而許多電子商務平台本身也有提供消費者評價商品。

每個網站評價的方式都有所不同,有些僅提供消費者對產品進行一個整體的評分,

有些則可以讓消費者對產品的各個項目進行評分,而有的網站讓消費者可以對產 品評一個總分並寫一段評論,亞馬遜(Amazon)就是這種形式。這些網站的存在讓 蒐集消費者資訊變得容易許多,不需要透過問卷調查等費時費力的方式。

除了消費者之外,生產者也需要透過產品評論來調整商品和服務的設計,蒐 集消費者過去的購買、搜尋和評價資訊能更了解消費者的喜好,依此設計推薦系 統將消費者可能願意購買的產品推薦給消費者,因此近年來有許多推薦系統相關 的研究(Dror, et al., 2011; Hu, et al., 2013; Steck, 2011; Yang, et al.; 2012)。

除了這些網站之外,人與人之間透過社群媒體也已經形成了無數個社交網絡,

越來越多人會在 Facebook, Youtube, Twitter 等等的社交網站上發表自己購買某樣

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

10

產品的評論。這會影響看到這些評論的人,看到別人提出產品的缺點勢必會對產 品有負面印象,反之亦然。隨著越來越多的人透過各種方式來評價各項產品和服 務,已經產生了廠商所不能忽視的口碑效應(e-word of mouth),見 Duric 和 Song (2012).

第二節 研究目的

提供開放式的文字評論雖然能獲得更多的消費者意見,但卻讓資料的處理變 的困難,不可能每個人都會針對商品的每一個特點進行評論,大部份的人只會寫 自己在意的部份。處理文字資料時,通常會先分析所有評論所提到的各個特點,

形成商品的各個特徵(feature or aspect),再將這些評論中提到的內容依照好壞轉 化成分數。不同消費者會提到不同特徵,因此遺漏值將會發生在每一筆評論中沒 有提到而別人有提到的特徵中,如何處理這些遺漏值將成非常嚴峻的挑戰。

本研究希望能找出消費者所提到的特徵對產品總分的影響,以及這些遺漏值 填補後是否能接近消費者真實意見。使用迴歸模型的估計值可以探討特徵對產品 總分的影響,而消費者真實意見即為遺漏值的真實值。因此本研究將設計一套多 重插補(multiple imputa-tion)的方法來估計迴歸模型參數,並以之填補亞馬遜網站 的 Canon 系列數位相機之消費者評論資料,資料為林沛盈(2013)所蒐集並量化。

Sridhar 和 Srinivasan (2012)提到人們通常只會寫其他人的評價中沒有提到 或是自己不認同的部份,沒有寫的部分可能是前面已有許多人提過的,因此使用 主流意見,即眾數填補這些遺漏值是一個可行的方式。另外還有很直觀的做法就 是填補平均值,使用平均值和眾數取代遺漏值是填補這類資料最簡單的方式,但 這兩者都會使填補後之資料分配集中在某一個特定的值上。因此近年來有許多不 同的處理方式,如 Pradel, Usunier, 和 Gallinari (2012)分析 yahoo 音樂的資料,分 析過程中使用兩種方式處理遺漏值,一為將遺漏值忽略,二為將遺漏值視為負面 評分,兩者都得到不好的結果。另外 Steck (2010)提出消費者評論的遺漏值是不 隨機遺失(missing not at random)並填補一些經過複雜運算的值來取代遺漏值,並

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

11

未得到好結果,同時此研究主要目的為提高推薦系統中最好的 k 個推薦物之命中 率(top-k hit rate),與本研究之需求不同。

這些方法都是填補一個特定的值來取代遺漏值(single imputation),且填補遺 漏值時都是使用全部資料進行計算。然而消費者撰寫評論可能會受到其他評論影 響,使用者撰寫評論的時候也只會看到更早的評論,使用全部資料進行插補並不 是很符合此情形。插補資料時應只使用時間在其之前的資料,而非全部資料,若 第 i 筆觀測值出現遺漏值,只使用第 1 到 i-1 筆資料來填補遺漏值。

第三節 論文架構

第二章將回顧遺漏值(missing value)以及插補法(imputation)之相關文獻,第 三章將詳細介紹本研究設計的方法以及模擬結果,第四章將分析亞馬遜網站的 Canon 系列數位相機之消費者評論資料的填補結果,第五章為結論以及未來研究 方向。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

12

相關文件