• 沒有找到結果。

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

13

第一章 緒論

1.1 研究背景

近幾年來,網路的普及,使消費者與廠商之間的資訊不對稱得以下降,消費 者的議價能力(power)得以提昇[Rezabakhsh et al., 2006; Rust and Oliver, 1994];web 2.0 更帶動了使用者產生內容(User Generate Content)的爆炸性增 加[Duric and Song, 2012; Chen et al., 2012]。

消費者將許多評論放上網站,產生了讓廠商無法忽視的口碑效應(e-Word of Month) [Duric and Song, 2012]。根據兩項針對超過兩千名美國成年人的研究 [Horrigan, 2008],有 81%的網路使用者曾為一項商品上網進行至少一次的資料 搜尋,其中有 73%到 87%的人表示,網路評論對他們的購買意願產生了顯著的影 響。特別是高涉入產品(high-involvement products),例如手機、數位相機等 價格較高、使用期間較長的商品,消費者的錯誤選擇將造成更大的經濟損失、及 更長的時間忍受不良商品[Gu et al., 2012]。因此,在該類產品中,消費者評 論影響其他消費者的選擇更甚。

網路評論不但是消費者信任的重要資訊來源,也是企業收集消費者意見的直 接管道[Fu et al., 2013]。根據 Merrill Lynch (1988)表示,企業中 80%-90%

之資料為具有潛力之非結構化資料(Unstructured Data),大部分網站上的顧客 評論皆屬於此類資料,需要進一步整理、分析才能從中粹取出有用的知識 [Feiguina and Lapalme, 2007]。在消費者與廠商之間的權力結構逐漸往消費者 端傾斜的網路時代[Bakos, 1991],廠商必頇擁有在許多評論網站中快速彙整資

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

14

料的能力。若能在海量資料(big data)中透過資料探勘的方式精準的掌握消費者 意見,並了解那些面相(aspect)為廠商需要加強的關鍵規格、或立即改善的商品 缺陷,便能在這個 web 2.0 的時代,抓住消費者需求,並且取得快速改善產品設 計之能力[Zhang et al., 2012]。

1.2 研究動機與目的

網路的發展改變了消費者表達意見的管道,並產生了大量的訊息。廠商從眾 多產品評論中,快速識別並提取消費者主觀意見之需求已變得越來越普遍,造就 了意見探勘(Opinion Mining)領域的興起[Chen et al., 2012; Fu et al., 2013;

Zhang et al., 2012]。意見探勘致力於萃取一份文件所傳達的正負面情緒,以 摘要或總結整份文件。針對網路消費者評論,現有意見探勘技術主要可分為兩類

─ 文 件 層 面 (Document-level) 以 及 面 相 層 面 (Aspect-level)[Chen et al., 2012]。藉由各種情緒偵測工具與技術,文件層面意見探勘辨別消費者在評論中 對整體商品的喜好或厭惡[Esuli and Sebastiani, 2006; Goldberg and Zhu, 2006; Pang et al., 2002; Turney, 2002]。

然而,兩個對整體商品持有相同滿意度的消費者,對於個別面相或許會有不 同的感受[Wang et al, 2010]。因此,部分研究跨過文件層面,進一步針對產品 的特色、面相層面進行研究。面相情緒探勘(Aspect-based Opinion Mining)萃 取消費者評論中的不同面相,並且判別消費者針對各個面相傳達的正面或負面情 緒。不同的「面相萃取(Aspect Identification)」與「情緒偵測(Sentiment Analysis)」技術都相繼應用於此領域中,本論文將於第二章詳述這些方法。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

15

過去已有許多文獻致力於面相情緒探勘[Chen et al, 2012; Feiguguina, and Lapalme, 2007; Fu et al., 2013; Hu and Liu, 2004; Zhang et al., 2012]。

然而,一件商品可以有眾多面相,並非每一個面相都受到消費者重視、會對購買 意願或整體商品滿意度造成影響。若能分辨不同面相間的重要性差異,對消費者 而言,可以針對較重視的面相篩選資料,以降低購買前的搜尋成本;對廠商而言,

可藉此判斷那些面相較能左右銷售量與使用者滿意度。因此,相較於各面相的滿 意度,區別消費者對各面相的重視程度更具有商業價值[Yu et al, 2011]。然而,

在現有文獻中,探討消費者認為關鍵之「重要面相」的研究仍然相當有限。

根據本研究之整理,探討重要面相之研究方法主要分為「頻率」與「複迴歸 分析」等兩種。前者透過加總各面相在句子中被提及之頻率,比較各產品面相的 重要性;後者使用複迴歸之分析方式,藉由評論中整體滿意度與各面相情緒之間 的關聯,找出各面相影響整體滿意度的權重。然而,頻率法假設被消費者提到次 數較多的為重要之面相,此前提假設在許多實際資料中未必成立。而複迴歸之分 析方式必頇取得各面相之完整資訊。據本研究所知,除了少部分評論網站﹝如旅 館業﹞之資料外,大部分網路上之評論皆為非結構性文章,消費者在撰寫評論時 並不會提到所有面相。也因此,使用複迴歸之研究方式之時機相對較受限制。

除此之外,上述研究皆未考慮各評論之間的互相影響。消費者在發表文章之 前,往往已閱讀過較早發表的評論,並且在發表評論的意願以及內容上都受到這 些評論的影響。Shrihari and Raji (2012)表示,受到獨特性需求的影響,若同 意大部分的主流意見,消費者將會透過強調個別差異來突顯自己的特色。以圖 1 中的評論為例,該消費者給予 Canon SX210 產品 4 顆星的高分,且表示這台相機 的表現正如其它評論所寫的。然而,在評論中實際提到的意見,卻只有對網站上

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

16

的商品內容描述感到不滿意。使用現有評論探勘技術將僅會得到該評論對於「商 品內容描述」面相的意見為負向的結果。此結果不但與 4 顆星的商品總分不一致

(Inconsistent),且遺漏了該評論者對於其它面相存在、但並未表達的意見。

圖 1 Socail Influence 僅表現個別意見

為了改善上述問題,本研究首先偵測評論中是否存在面相與商品評分不一致、

以及是否具有隱而未現的意見,並藉由評論間的互相關聯修正上述現象。再透過 本研究提出,找尋重要面相之架構進行整體資訊的彙整。相較於現有方法,本研 究能更精準的取得消費者評論中之重要面相,並給予廠商管理建議。

1.3 研究方法與架構

在本研究中,我們將提出一個適用於非結構化評論資料的自動分析架構及各 種分析工具。我們使用全球最大的網際網路線上零售商 Amazon [ Jopson &

Barney, 2011] 之消費者評論進行研究,並選擇數位相機作為本研究之標的物。

數位相機屬於高涉入性產品,失敗成本高,因此消費者在進行購買決策前往往會 參考其他線上評論之意見。且 Amazon 之評論發表具有限制性,評論之發表者必 頇曾經在 Amazon 上購買此商品(如圖 2 所示)。此限制性使得 Amazon 之評論較 能代表實際購買且使用過該商品的消費者。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

17

圖 2 Amazon 發文限制

有別於現有方法,本架構首先藉由一致性檢測(consistency test)與至少考 量數目(Minimum Decision Number)找出包含有未表達面相的評論(詳見 3.3.1)。

並藉由獨特性假設為這些評論中的未表達面相填值(詳見 3.3.3)。最後透過本研 究提出的重要面相架構 MPA 輔以決策樹與迴歸分析,彙整影響消費者對整體商品 評價的正負面相,並總結各個世代的產品優勢與需改善之產品特色。

本研究的架構分為四大部分:「資料前處理」、「面相辨識與情緒偵測」、

「不一致性改善」與「重要面相彙整」。在第一部分「資料前處理」中,本研究 選取數位相機 Canon SX 系列三個世代 SX210, SX230, SX260 的消費者評論,並 在 Amazon.com 上取得相關消費者評論資料。第二部分「面相辨識與情緒偵測」

為句子貼上各面相之標籤與判別相對應的情緒。第三部分「不一致性改善」偵測 評論的商品總分與面相評價之間是否存在不一致性的問題,並透過填值程式做出 修正。第四部分「重要面相彙整」,透過本研究分析之重要面相資訊,彙整同一 系列產品三個世代之間的比較表格,並提出相關之管理建議。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

18

1.4 研究結果與貢獻

藉由實際分析 Amazon 上的評論資料,本研究證實是否考量不一致性、與是 否填補評論中隱而未現的意見,確實會對重要面相分析結果產生影響。在各項假 設成立的前提下,本研究所提出的重要面相彙整架構能精確的找出商品重要的優 勢及弱點面相,並能以此分析同系列商品的發展趨勢、以供廠商發展新世代商品 時作為參考。本研究的貢獻可分為三個層面:

1. 在評論探勘之領域中,本研究首先考慮了評論之間的關聯性,並以此發展填 值方法,以預測消費者隱而未現的意見、改善整體商品與各面相之間給分不 一致的現象。

2. 本研究提出一分析架構,該架構填補了過去尋找重要面相研究的不足,能更 精確的找出影響消費者購買決策的重要面相。

3. 本研究藉由在 Amazon 上所取得的實際評論資料及本研究所發展的 MPA 架構,

分析 SX210、SX230,及 SX260 等三個世代數位相機的消費者評論。分析結 果清楚指出該系列相機不同世代間的優勢特徵,及急需改善的商品面相。

本論文的發現,可供日後意見探勘研究、及新世代產品發展作為參考。

1.5 論文結構

在本論文剩下的章節裡,我們將於第二章回顧意見探勘應用於評論之面相萃 取、情緒分析,與重要面相彙整等技術的相關文獻。第三章將闡述本研究所提出 的架構與方法。對 Amazon 上實際評論資料的分析結果將於第四章呈現。最後,

我們將在第五章為本研究做出結論,並提出研究限制、及未來可能的研究方向。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

19

相關文件