• 沒有找到結果。

隱藏意見萃取--辨識多世代商品之關鍵特色 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "隱藏意見萃取--辨識多世代商品之關鍵特色 - 政大學術集成"

Copied!
83
0
0

加載中.... (立即查看全文)

全文

(1)國立政治大學商學院企業管理學系 碩士論文. 隱藏意見萃取--辨識多世代商品之關鍵特色 Latent Opinion 治 Extraction:. 政. 大. 學. ‧ 國. Identify Critical 立 Product Features in Multiple Generations. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 指導教授: 唐. 揆 博士. 研究生:林 沛. 盈. 撰. 中華民國一百零二年七月.

(2) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 2. i Un. v.

(3) 摘要 隨著網路的普及,消費者將許多自身經驗撰寫成產品評論放上網站,使得消 費者與廠商之間的資訊不對稱得以下降,同時產生了讓廠商無法忽視的口碑效應。 根據兩項針對超過兩千名美國成年人的研究,有 81%的網路使用者曾為一項商品 上網進行至少一次的資料搜尋,其中有 73%到 87%的人表示網路評論對他們的購 買意願產生了顯著的影響,特別是高涉入性產品。. 政 治 大 擁有在許多評論網站中快速彙整資料的能力。因此,針對評論做意見探勘,是非 立 在消費者與廠商之間的權力結構逐漸往消費者端傾斜的網路時代,廠商必頇. ‧ 國. 學. 常重要的研究議題。而在意見探勘的領域中,若能分辨不同面相間的重要性差異, 對廠商而言,可藉此判斷那些面相較能左右銷售量與使用者滿意度,本研究著重. ‧. 於探討消費者認為「重要面相」的研究。. y. Nat. io. sit. 然而,過去的研究較少討論到評論依據時間,後發表的評論會被前述評論影. n. al. er. 響的議題。本研究發現依據傳統的面相意見探勘,將會產生面相分數與整體分數. Ch. i Un. v. 不一致性的狀態,顯示消費者應有隱而未現的意見未被充分表達。本研究首度考. engchi. 慮了評論之間的關聯性,並以此發展填值方法。此外,本研究針對 Amazon 網站 上 Canon 數位相機 SX210、SX230,及 SX260 等三個世代數位相機的消費者評論 提出 GPA、MPA Matrix 之分析架構。分析結果清楚指出該系列相機不同世代間的 正向與負向面相。透過本研究的自動分析架構,廠商可以從數千筆消費者評論中, 有效率且更精準的找到消費者滿意與需改善之面相。. 關鍵字:意見探勘、情緒分析、面相偵測、社會影響、遺失值填值. 3.

(4) Abstract A growing number of consumers have written product reviews to share their own experience on the Internet. The development decreases information asymmetry between consumers and manufactures and causes e-word of mouth effect that firms could not ignore. According to the survey of more than 2000 adults in the U.S., 81% of Internet users had searched for product. 政 治 大 Internet users said the product reviews influenced their purchase 立. information they planned to buy at least one time. Between 73% and 87%. ‧ 國. 學. intention, especially in high involvement products.. Consequently, it is essential for manufactures to have the ability to. ‧. summarize thousands of consumer product reviews into useful information. y. Nat. io. sit. in a short time. Thus, review opinion mining becomes an important issue. n. al. er. in the recent years. In the field of review opinion mining, it is critical. Ch. i Un. v. for manufactures to differentiate product features in terms of their. engchi. importance. According to the data from aspect opinion mining, manufactures can determine which product feature significantly influences sales volume and customer satisfaction. Therefore, our research focused on identifying “critical product features.” We found existing studies did not address the time-effects on product reviews. That is, consumer review might be influenced by the foregoing reviews. The time-effects will cause inconsistent between the overall 4.

(5) score and the feature score while the data based on the traditional aspect opinion mining method. Our research took the inconsistent situation into consideration, and developed an imputation method for features missing in reviews. In addition, we analyzed the sentiment polarity of Canon digital camera (SX210, SX230, SX260 generations) on Amazon with GPA, MPA Matrix. The results clearly identify the positive and negative features in different product generations. Using the automatic sentiment analysis framework we propose, manufactures could find the critical features that. 政 治 大. receive very favorable responses from consumers or need improvement in. 立. an efficient and more accurate way.. ‧ 國. 學. Keywords: Opinion Mining, Sentiment Analysis, Aspect Identification,. ‧. Social Influence, Missing Data Imputation. n. er. io. sit. y. Nat. al. Ch. engchi. 5. i Un. v.

(6) 致謝詞 這篇論文使用到斷字斷句、情緒偵測、語意分析,以及基礎的統計學。非常 感謝唐揆老師、家齊學長的指導。在選擇題目上是一個漫長的過程:花了一年半 的時間,大多數時候在學習過去研究做過的成果,以及對於議題做假設性的討論。 「原來踩在前人的腳步上是這麼回事阿!」在感慨之餘也深刻體會到做出跨時代 性研究的不容易之處。. 政 治 大 會,聽取每週新研究的論文,並且訓練我們在短時間內講述一個議題的邏輯性。 立 唐揆老師在議題上的指導具有精準的眼光,每個星期五固定花時間與我們開. ‧ 國. 學. 對於程式語言一翹不通的我,透過家齊學長細心、耐心、用心的教學,讓我在短 短時間能夠快速學習起基本的架構,並且學會將大量重複性的工作透過程式執行,. ‧. 這對後續學弟妹的研究應有不錯的幫助。這些訓練,雖然比預期的更加辛苦,但. y. Nat. io. sit. 對我而言不論是在學校課業上、找工作上,都是很有幫助的一對一訓練。沒有辛. n. al. er. 勤的耕耘,便沒有豐碩的成果,這段建構基礎的時光對我而言,十分的珍貴。. Ch. i Un. v. 最後,感謝 MBA 同學們、朋友們、我的家人在這段時間的鼓勵與支持。以及. engchi. 最後因颱風變更行程的審查老師們:唐正老師、郁惠老師,謝謝你們的建議。從 統計學踏足資料探勘領域的路途中,踏出每一個步伐都不容易,但當我闔上這本 碩士論文時,回頭一看:難以言喻的紮實收穫。希望有機會能在未來的工作上繼 續應用。 再次謝謝唐揆老師與家齊學長!. 6.

(7) 目錄 摘要 ..................................................................................................................................... 3 Abstract............................................................................................................................. 4 致謝詞 ................................................................................................................................. 6 第一章. 緒論 .............................................................................................................. 13. 1.1 研究背景 .......................................................................................................... 13 1.2 研究動機與目的 ............................................................................................. 14 1.3 研究方法與架構 ............................................................................................. 16. 政 治 大. 1.4 研究結果與貢獻 ............................................................................................. 18. 立. 1.5 論文結構 .......................................................................................................... 18. ‧ 國. 學. 第二章. 文獻回顧 ...................................................................................................... 19. ‧. 2.1 面相萃取 ........................................................................................................... 19. sit. y. Nat. 2.2 情緒分析 .......................................................................................................... 22. n. al. er. io. 2.2.1 監督式情緒偵測 ................................................................................. 23. i Un. v. 2.2.2 非監督式情緒偵測 .............................................................................. 27. Ch. engchi. 2.3 重要面相彙整.................................................................................................. 29 第三章. 研究方法 ...................................................................................................... 32. 3.1 資料前處理 ...................................................................................................... 33 3.2 面相辨識與情緒偵測 ..................................................................................... 35 3.2.1 面相辨識 ............................................................................................. 35 3.2.2 面相標籤 ............................................................................................. 38 3.2.3 情緒偵測 ............................................................................................. 39 3.3 不一致性改善.................................................................................................. 41 7.

(8) 3.3.1 填值偵測 .............................................................................................. 41 3.3.2 填入順序 .............................................................................................. 42 3.3.3 填值方式 GM (Group Majority Value) ......................................... 43 3.4 重要面相彙整.................................................................................................. 44 3.4.1 GPA Matrix ......................................................................................... 44 3.4.2 迴歸與決策樹分析 ............................................................................. 46 3.4.3 MPA Matrix ......................................................................................... 47 第四章. 研究結果 ...................................................................................................... 49. 政 治 大. 4.1Canon Sx 系列三世代產品描述 ..................................................................... 49. 立. 4.2 原始資料描繪 ................................................................................................... 51. ‧ 國. 學. 4.3 至少考量數目決定 .......................................................................................... 54. ‧. 4.3 GPA、迴歸與決策樹分析 ............................................................................... 60. sit. y. Nat. 4.3.1 GPA Matrix ......................................................................................... 60. n. al. er. io. 4.3.2 迴歸分析 ............................................................................................. 66. i Un. v. 4.3.3 決策樹分析 ......................................................................................... 69. Ch. engchi. 4.4 MPA 彙整結果 ................................................................................................... 72 第五章. 結論 .............................................................................................................. 76. 參考文獻........................................................................................................................... 77. 8.

(9) 表目錄 表 1 斷句斷字.............................................. 34 表 2 Zhang et al.定義之數位相機十大面相.................... 35 表 3 MPQA Corpus 情緒字典 .................................. 40 表 4 情緒程度.............................................. 40 表 5 經面相辨識與情緒偵測處理後,各面相評價實例............ 41 表 6 各族群各世代之評論數目 ................................ 44 表 7 GPA Matrix............................................ 45. 政 治 大. 表 8 MPA Matrix............................................ 48. 立. 表 9 Canon SX 系列三世代產品規格比較表..................... 49. ‧ 國. 學. 表 10 原始定義之 13 面相.................................... 51. ‧. 表 11 SX210 情緒偵測後原始資料............................. 52. sit. y. Nat. 表 12 GM 填值後結果 ........................................ 52. n. al. er. io. 表 13 SX210 各面相頻率計算................................. 55. i Un. v. 表 14 SX210 負向情緒個數................................... 55. Ch. engchi. 表 15 SX210 正向情緒個數................................... 56 表 16 SX230 負向情緒個數................................... 56 表 17 SX230 正向情緒個數................................... 57 表 18 SX260 負向情緒個數................................... 57 表 19 SX260 正向情緒個數................................... 57 表 20 SX210 GPA Matrix..................................... 62 表 21 SX230 GPA Matrix..................................... 63. 9.

(10) 表 22 SX260 GPA Matrix..................................... 64 表 23 SX210 D5 迴歸分析 .................................... 66 表 24 SX230 D5 迴歸分析 .................................... 67 表 25 SX230 D5 迴歸分析 .................................... 68 表 26 SX 三世代回歸顯著變數統整 ............................ 69 表 27 SX 三世代 MPA Matirx.................................. 73 表 28 A13(Picture)三世代面相分類........................... 73 表 29 A3(Zoom)三世代面相分類............................... 74. 政 治 大. 表 30 A5(Brust)三世代面相分類.............................. 74. 立. 表 31 A6(Battery)三世代面相分類............................ 74. ‧ 國. 學. 表 32 A10(Flash)三世代面相分類............................. 75. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. 10. i Un. v.

(11) 圖目錄 圖 1 Socail Influence 僅表現個別意見 ....................... 16 圖 2 Amazon 發文限制 ....................................... 17 圖 3 Canon SX230 之廠商產品描述 ............................ 21 圖 4 Video 面相以 Recording 替代 ............................ 21 圖 5 描述麥克風............................................ 21 圖 6 監督式情緒偵測........................................ 23 圖 7 非監督式情緒偵測...................................... 23. 政 治 大. 圖 8 雙極性之形容詞結構.................................... 28. 立. 圖 9 數位相機與電視之 RFF .................................. 29. ‧ 國. 學. 圖 10. Trip Advisor 結構性給分 ............................. 31. ‧. 圖 11 Amazon 評論範例 ...................................... 33. sit. y. Nat. 圖 12 面相區隔演算法 ....................................... 37. n. al. er. io. 圖 13 面相區隔演算法-卡方值................................ 37. i Un. v. 圖 14 Battery 之相關詞彙................................... 38. Ch. engchi. 圖 15 關鍵字字庫........................................... 38 圖 16 面相標籤............................................. 39 圖 17 決策樹分支........................................... 47 圖 18 Canon SX 系列三世代產品圖............................ 50 圖 19 SX210 負向情緒個數................................... 58 圖 20 SX210 正向情緒個數................................... 58 圖 21 SX230 負向情緒個數................................... 59. 11.

(12) 圖 22 SX230 正向情緒個數................................... 59 圖 23 SX260 負向情緒個數................................... 60 圖 24 SX260 正向情緒個數................................... 60 圖 25 以 SX210 D5 為訓練資料所產生的決策樹(局部)............ 70 圖 26 以 SX230 D5 為訓練資料所產生的決策樹(局部)............ 71 圖 27 以 SX230 D5 為訓練資料所產生的決策樹(局部)............ 72. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 12. i Un. v.

(13) 第一章 緒論 1.1 研究背景 近幾年來,網路的普及,使消費者與廠商之間的資訊不對稱得以下降,消費 者的議價能力(power)得以提昇[Rezabakhsh et al., 2006; Rust and Oliver, 1994];web 2.0 更帶動了使用者產生內容(User Generate Content)的爆炸性增. 政 治 大 消費者將許多評論放上網站,產生了讓廠商無法忽視的口碑效應(e-Word of 立. 加[Duric and Song, 2012; Chen et al., 2012]。. ‧ 國. 學. Month) [Duric and Song, 2012]。根據兩項針對超過兩千名美國成年人的研究 [Horrigan, 2008],有 81%的網路使用者曾為一項商品上網進行至少一次的資料. ‧. 搜尋,其中有 73%到 87%的人表示,網路評論對他們的購買意願產生了顯著的影. y. Nat. io. sit. 響。特別是高涉入產品(high-involvement products),例如手機、數位相機等. n. al. er. 價格較高、使用期間較長的商品,消費者的錯誤選擇將造成更大的經濟損失、及. Ch. i Un. v. 更長的時間忍受不良商品[Gu et al., 2012]。因此,在該類產品中,消費者評. engchi. 論影響其他消費者的選擇更甚。 網路評論不但是消費者信任的重要資訊來源,也是企業收集消費者意見的直 接管道[Fu et al., 2013]。根據 Merrill Lynch (1988)表示,企業中 80%-90% 之資料為具有潛力之非結構化資料(Unstructured Data),大部分網站上的顧客 評論皆屬於此類資料,需要進一步整理、分析才能從中粹取出有用的知識 [Feiguina and Lapalme, 2007]。在消費者與廠商之間的權力結構逐漸往消費者 端傾斜的網路時代[Bakos, 1991],廠商必頇擁有在許多評論網站中快速彙整資 13.

(14) 料的能力。若能在海量資料(big data)中透過資料探勘的方式精準的掌握消費者 意見,並了解那些面相(aspect)為廠商需要加強的關鍵規格、或立即改善的商品 缺陷,便能在這個 web 2.0 的時代,抓住消費者需求,並且取得快速改善產品設 計之能力[Zhang et al., 2012]。. 1.2 研究動機與目的 網路的發展改變了消費者表達意見的管道,並產生了大量的訊息。廠商從眾 多產品評論中,快速識別並提取消費者主觀意見之需求已變得越來越普遍,造就. 政 治 大. 了意見探勘(Opinion Mining)領域的興起[Chen et al., 2012; Fu et al., 2013;. 立. Zhang et al., 2012]。意見探勘致力於萃取一份文件所傳達的正負面情緒,以. ‧ 國. 學. 摘要或總結整份文件。針對網路消費者評論,現有意見探勘技術主要可分為兩類. ‧. ─ 文 件 層 面 (Document-level) 以 及 面 相 層 面 (Aspect-level)[Chen et al.,. sit. y. Nat. 2012]。藉由各種情緒偵測工具與技術,文件層面意見探勘辨別消費者在評論中. n. al. er. io. 對整體商品的喜好或厭惡[Esuli and Sebastiani, 2006; Goldberg and Zhu, 2006; Pang et al., 2002; Turney, 2002]。. Ch. engchi. i Un. v. 然而,兩個對整體商品持有相同滿意度的消費者,對於個別面相或許會有不 同的感受[Wang et al, 2010]。因此,部分研究跨過文件層面,進一步針對產品 的特色、面相層面進行研究。面相情緒探勘(Aspect-based Opinion Mining)萃 取消費者評論中的不同面相,並且判別消費者針對各個面相傳達的正面或負面情 緒。不同的「面相萃取(Aspect Identification)」與「情緒偵測(Sentiment Analysis)」技術都相繼應用於此領域中,本論文將於第二章詳述這些方法。. 14.

(15) 過去已有許多文獻致力於面相情緒探勘[Chen et al, 2012; Feiguguina, and Lapalme, 2007; Fu et al., 2013; Hu and Liu, 2004; Zhang et al., 2012]。 然而,一件商品可以有眾多面相,並非每一個面相都受到消費者重視、會對購買 意願或整體商品滿意度造成影響。若能分辨不同面相間的重要性差異,對消費者 而言,可以針對較重視的面相篩選資料,以降低購買前的搜尋成本;對廠商而言, 可藉此判斷那些面相較能左右銷售量與使用者滿意度。因此,相較於各面相的滿 意度,區別消費者對各面相的重視程度更具有商業價值[Yu et al, 2011]。然而, 在現有文獻中,探討消費者認為關鍵之「重要面相」的研究仍然相當有限。. 政 治 大. 根據本研究之整理,探討重要面相之研究方法主要分為「頻率」與「複迴歸. 立. 分析」等兩種。前者透過加總各面相在句子中被提及之頻率,比較各產品面相的. ‧ 國. 學. 重要性;後者使用複迴歸之分析方式,藉由評論中整體滿意度與各面相情緒之間. ‧. 的關聯,找出各面相影響整體滿意度的權重。然而,頻率法假設被消費者提到次. sit. y. Nat. 數較多的為重要之面相,此前提假設在許多實際資料中未必成立。而複迴歸之分. n. al. er. io. 析方式必頇取得各面相之完整資訊。據本研究所知,除了少部分評論網站﹝如旅. i Un. v. 館業﹞之資料外,大部分網路上之評論皆為非結構性文章,消費者在撰寫評論時. Ch. engchi. 並不會提到所有面相。也因此,使用複迴歸之研究方式之時機相對較受限制。 除此之外,上述研究皆未考慮各評論之間的互相影響。消費者在發表文章之 前,往往已閱讀過較早發表的評論,並且在發表評論的意願以及內容上都受到這 些評論的影響。Shrihari and Raji (2012)表示,受到獨特性需求的影響,若同 意大部分的主流意見,消費者將會透過強調個別差異來突顯自己的特色。以圖 1 中的評論為例,該消費者給予 Canon SX210 產品 4 顆星的高分,且表示這台相機 的表現正如其它評論所寫的。然而,在評論中實際提到的意見,卻只有對網站上. 15.

(16) 的商品內容描述感到不滿意。使用現有評論探勘技術將僅會得到該評論對於「商 品內容描述」面相的意見為負向的結果。此結果不但與 4 顆星的商品總分不一致 (Inconsistent),且遺漏了該評論者對於其它面相存在、但並未表達的意見。. 圖 1 Socail Influence 僅表現個別意見. 政 治 大 以及是否具有隱而未現的意見,並藉由評論間的互相關聯修正上述現象。再透過 立. 為了改善上述問題,本研究首先偵測評論中是否存在面相與商品評分不一致、. ‧ 國. 學. 本研究提出,找尋重要面相之架構進行整體資訊的彙整。相較於現有方法,本研 究能更精準的取得消費者評論中之重要面相,並給予廠商管理建議。. ‧ er. io. sit. y. Nat. 1.3 研究方法與架構. 在本研究中,我們將提出一個適用於非結構化評論資料的自動分析架構及各. al. n. iv n C 種分析工具。我們使用全球最大的網際網路線上零售商 hengchi U. Amazon [ Jopson &. Barney, 2011] 之消費者評論進行研究,並選擇數位相機作為本研究之標的物。 數位相機屬於高涉入性產品,失敗成本高,因此消費者在進行購買決策前往往會 參考其他線上評論之意見。且 Amazon 之評論發表具有限制性,評論之發表者必 頇曾經在 Amazon 上購買此商品(如圖 2 所示)。此限制性使得 Amazon 之評論較 能代表實際購買且使用過該商品的消費者。. 16.

(17) 圖 2 Amazon 發文限制. 有別於現有方法,本架構首先藉由一致性檢測(consistency test)與至少考. 政 治 大. 量數目(Minimum Decision Number)找出包含有未表達面相的評論(詳見 3.3.1)。. 立. 並藉由獨特性假設為這些評論中的未表達面相填值(詳見 3.3.3)。最後透過本研. ‧ 國. 學. 究提出的重要面相架構 MPA 輔以決策樹與迴歸分析,彙整影響消費者對整體商品. ‧. 評價的正負面相,並總結各個世代的產品優勢與需改善之產品特色。. sit. y. Nat. 本研究的架構分為四大部分:「資料前處理」、「面相辨識與情緒偵測」、. n. al. er. io. 「不一致性改善」與「重要面相彙整」。在第一部分「資料前處理」中,本研究. i Un. v. 選取數位相機 Canon SX 系列三個世代 SX210, SX230, SX260 的消費者評論,並. Ch. engchi. 在 Amazon.com 上取得相關消費者評論資料。第二部分「面相辨識與情緒偵測」 為句子貼上各面相之標籤與判別相對應的情緒。第三部分「不一致性改善」偵測 評論的商品總分與面相評價之間是否存在不一致性的問題,並透過填值程式做出 修正。第四部分「重要面相彙整」,透過本研究分析之重要面相資訊,彙整同一 系列產品三個世代之間的比較表格,並提出相關之管理建議。. 17.

(18) 1.4 研究結果與貢獻 藉由實際分析 Amazon 上的評論資料,本研究證實是否考量不一致性、與是 否填補評論中隱而未現的意見,確實會對重要面相分析結果產生影響。在各項假 設成立的前提下,本研究所提出的重要面相彙整架構能精確的找出商品重要的優 勢及弱點面相,並能以此分析同系列商品的發展趨勢、以供廠商發展新世代商品 時作為參考。本研究的貢獻可分為三個層面: 1. 在評論探勘之領域中,本研究首先考慮了評論之間的關聯性,並以此發展填. 政 治 大. 值方法,以預測消費者隱而未現的意見、改善整體商品與各面相之間給分不. 立. 一致的現象。. ‧ 國. 學. 2. 本研究提出一分析架構,該架構填補了過去尋找重要面相研究的不足,能更. ‧. 精確的找出影響消費者購買決策的重要面相。. sit. y. Nat. 3. 本研究藉由在 Amazon 上所取得的實際評論資料及本研究所發展的 MPA 架構,. n. al. er. io. 分析 SX210、SX230,及 SX260 等三個世代數位相機的消費者評論。分析結. i Un. v. 果清楚指出該系列相機不同世代間的優勢特徵,及急需改善的商品面相。. Ch. engchi. 本論文的發現,可供日後意見探勘研究、及新世代產品發展作為參考。. 1.5 論文結構 在本論文剩下的章節裡,我們將於第二章回顧意見探勘應用於評論之面相萃 取、情緒分析,與重要面相彙整等技術的相關文獻。第三章將闡述本研究所提出 的架構與方法。對 Amazon 上實際評論資料的分析結果將於第四章呈現。最後, 我們將在第五章為本研究做出結論,並提出研究限制、及未來可能的研究方向。. 18.

(19) 第二章 文獻回顧 透過各種資料探勘技術,意見探勘將網站上大量非結構性文件,轉換為可供 分析的各項資訊,並從中粹取出有用的知識,以大幅縮短廠商整理消費者意見的 時間並提升面對變動市場的能力。近年來,在意見探勘領域,逐漸有研究探討如 何從消費者評論中找出商品的重要面相。現有偵測重要面相的方法通常包含了三 個部分:其中第一部分為「面相萃取」,取得非結構性資料中消費者主要探討的. 政 治 大 「重要面相彙整」則整合前兩部分之資料,找出消費者較重視的面相。本章的內 立 面相;第二部分為「情緒分析」,了解消費者針對各面相的情緒極性;第三部分. ‧ 國. 學. 容將詳細探討上述三個部分所使用的重要技術。. ‧. 2.1 面相萃取. y. Nat. io. sit. 面相(Aspect 或 Feature)通常是指產品的特性、元件或功能 [Zhang et al.,. n. al. er. 2012]。例如數位相機包含鏡頭、變焦、閃光燈等面相。面相萃取 (Aspect. Ch. i Un. v. Identification) 即是從使用者產生內容中自動萃取出經常被談論、關心的商品. engchi. 面相。現有面相萃取的研究,依使用技術可分為使用規則(Rule-based)、使用模 型(Model-based),以及使用統計方法等三大類。Chen et al., (2012) 對於各 種面相萃取的方法進行了詳盡的介紹及比較。本節剩餘內容將分別介紹使用這三 類方法的現有研究。 Hu and Liu (2004) 首先針對一個商品的不同面相(Features)進行評論探勘 研究。此研究透過 NLProcessor Linguistic Parser 錯誤! 找不到參照來源。 進行斷句,並利用 POS(Part of Speech)之標籤辨別評論文字的詞性,以找出評 19.

(20) 論中以名詞或名詞片語型態出現的商品面相。基於不同消費者在評論商品面相時, 使用的字詞通常會趨於一致之假設,該研究首先透過關連規則(Association Mining)找出容易一同出現的名詞或名詞片語 (Frequent Item Set)。再刪除當 中無意義或可被取代者,以留下評論中用來表示商品面相的字詞組合。 使用模型的面相萃取法藉由已標籤、註解的訓練資料及學習器訓練出各式語 言模型,並用此模型找出新目標商品的面相(Chen et al., 2012)。Feiguina 與 Lapalme (2007) 使用訓練資料及術語提取器(Terminology Extractor) 找出面 相經常出現在句子中的樣式。例如藉由樣式「the <aspect> is <adjective>」. 政 治 大. 可在句子「the speakerphone is great」中辨別出 speakerphone 為一個面相。. 立. Feiguina 與 Lapalme (2007) 首先預備一組訓練文件及藉由人工從訓練文件. ‧ 國. 學. (Training Text)中所標誌的面相訓練項目(Training Term)。在將訓練文件轉換. ‧. 成詞性序列(stream of part-of-speech tags)後,學習訓練項目最常出現的詞. sit. y. Nat. 性排列,以在新文件中找出可能的面相。. n. al. er. io. 除了上述使用文件探勘的自動化技術,部分研究使用由專家針對各個面相所. i Un. v. 列舉的關鍵字清單。然而,消費者在網路上撰寫評論時,會使用各種敘述方式表. Ch. engchi. 達同一意涵之面相。以數位相機的攝影面相為例,在圖 3 中,廠商使用(Video) 來描述攝影的功能。但在圖 4 中,消費者則使用(Recording movie)來表達此一 面相。除此之外,評論中討論攝影面相的句子,並不見得會包含攝影或其同義字。 如圖 5 中,消費者抱怨攝影時麥克風的收音效果不好,但該句子中並未出現 video 或 movie 等單字。因此,由人工所建立的面相關鍵字清單,難以全面性的 包含代表各個面相的關鍵字,因而無法完整標誌各句子所針對的面相。. 20.

(21) 圖 3 Canon SX230 之廠商產品描述. 立. 政 治 大. n. sit. er. io. al. y. ‧. ‧ 國. 學. Nat. 圖 4 Video 面相以 Recording 替代. Ch. engchi. 圖 5 描述麥克風 21. i Un. v.

(22) 鑑 於 上 述 情 況 , Wang et al, (2010) 提 出 面 相 區 隔 演 算 法 (Aspect Segmentation Algorithm),該演算法使用專家所列的面相關鍵字作為各面相之 種子詞彙,在投入各面相之「種子詞彙」與「所有評論文件」後,該演算法藉由 卡方值估算其它字詞與各面相之間的關聯,以逐次由種子詞彙擴充成全面且完整 的面相關鍵字清單。 在本研究中,為方便比較三個世代的產品,我們使用[Zhang et al., 2010] 中所列舉的數位相機面相及其關鍵字,並藉由本研究觀察及面相區隔演算法建立 完整的面相關鍵字清單。. 立. 2.2 情緒分析. 政 治 大. ‧ 國. 學. 找出消費者在意之面相後,情緒分析將進一步辨識消費者針對各面相的情緒. ‧. 為正向或負向。情緒分析為判斷消費者表達情緒極性(Sentiment Polarity)之方. sit. y. Nat. 法。根據 Mejova(2009)表示,情緒極性為文字特色之一,通常分為主觀正向與. n. al. er. io. 主觀負向。除了單純分為正向或負向外,也可進一步細分強弱程度以判斷情緒在 從負向到正向範圍內的相對應位置。. Ch. engchi. i Un. v. 其次,在情緒分析的領域中,多以形容詞為其情緒表達的依據。根據 Bruce et al. (1999)的研究表示,形容詞與主觀性(Subjective)在統計上有著顯著之 高度正相關。因此,在情緒分析時,通常以形容詞之正負向判斷消費者之意見。 此外,透過 Hu and Liu (2004)的研究表示,面相與形容詞時常緊鄰著出現。意 指以萃取出之面相為討論的主體,緊鄰的形容詞,有高度機率為消費者針對此面 相之主觀情緒。. 22.

(23) 情 緒 分 析 的 研 究 方 法 可 分 為 兩 類 : 監 督 式 (Supervised) 與 非 監 督 式 (Unsupervised)之情緒偵測。此兩種方式之最大差別,為監督式情緒偵測依照分 析之標的,使用訓練資料(Training Dataset)訓練出分類器,以分類正向與負向 之情緒,如圖 6 所示;而非監督式沒有針對標的訓練分類器,而使用既有情緒 辭典或統計方法區別情緒之正負向,如圖 7 所示。. Training Data Set. 訓練 分類器. 資料. 分類器. 立. (正向、負向). ‧ 國. 學 圖 6 監督式情緒偵測. n. Ch. engchi. sit er. io. al. 字典或 統計方法. y. ‧. Nat. 資料. 治 政 分類 大. i Un. 分類 (正向、負向). v. 圖 7 非監督式情緒偵測. 2.2.1 監督式情緒偵測 監督式情緒偵測使用已標籤的訓練資料(Training Dataset)訓練分類器,而 後透過所訓練出的分類器將目標資料分類為正向或負向。在將監督式學習法應用 於情緒偵測時,通常需要考慮:該選用那些屬性以代表整份評論、如何取得已知. 23.

(24) 情緒極性的評論作為訓練資料,以及該使用何種分類器等三個問題。以下將針對 「屬性別」、「訓練資料來源」與「分類器」等三點進行討論。 屬性別(Attribute): 情緒分析亦可視為將一份評論分類為正向或負向的分類問題。然而,不 同於一般分類問題,在分類一則評論的情緒時,較為困難的問題是: 「我 們要使用那些屬性來代表一則評論?」(Mejova, 2009)。過去研究通常 使用字詞向量(vocabulary vector)來代表一則評論。假設{f1, f2,. f3, …, fm}為所有評論所包含的 m 個不同字詞所形成的集合,ni(d)為. 政 治 大. 字詞 fi 出現在評論 d 中的頻率,則評論 d 可用向量 d := (n1(d),. 立. n2(d),…, nm(d))來表示。除了字詞出現頻率外,其它常被用來定義屬. 學. ‧ 國. 性的有:「存在與否」、「N-Gram」以及「詞性」。. ‧. 頻率或出現與否(Frequency or Presence):傳統訊息檢索系統. y. Nat. (Traditional Information Retrieval systems)已長期強調頻率. sit. . io. 之重要性,其中廣為使用之量測方式為 TF-IDF(Term Frequency -. n. al. er. i.. i Un. v. Inverse Document Frequency)[Jones, 1972]。TF-IDF 為一種統. Ch. engchi. 計方法,用來評估一個字對於一份文件之重要性。當此字詞在目標 文件中出現頻率越高,而出現在資料庫中其他文件之頻率越低時, 此字詞針對目標文章之重要性越高。然而,在 Pang et al.(2002) 的實驗結果中,只使用字詞出現與否(若某字詞曾出現在文件中, 則其在向量中的對應值為 1;否則為 0)做為屬性值的結果反而優於 使用字詞出現頻率。Wiebe et al., (2004)提到,「顯然的是,當. 24.

(25) 人們越是主觀時,則越能產生創意。」意味著低頻率在主觀文章中 之重要性日趨重要。 . N-Gram:一個字詞所表達的情緒,可能會隨著字詞前後所緊鄰的其 它字詞而有所變化,例如字詞之前有否定詞的時候。因此使用由兩 個字詞、三個字詞,甚至多個字詞所組成的項目(term)做為屬性, 可能有助於更精確的分別不同前後文下,字詞所表達的情緒。有鑑 於此,Wiebe et al., (2004)使用 N-Gram(N=1,2,3…)為屬性之單 位,其 N 值的選擇以兩大原則為基礎:第一,使用 N-Gram 之精確. 政 治 大. 度必頇大於基礎精確度;第二,在 N-Gram 的精確度必頇大於其組. 立. 合元素之最大精確度。其研究結果顯示,考慮 N-Gram 之方式能使. ‧ 國. 學. 精確度提高。. ‧. . 詞性(Part-of-Speech):研究證實,形容詞為消費者表達主觀情緒. sit. y. Nat. 時最常使用的詞性[Hatzivassiloglou and Wiebe, 2000; Benamara. n. al. er. io. et al., 2007]。且在過去十年的研究中,透過詞性找尋情緒面相. i Un. v. 的方式也已應用於情緒分析的範疇中[Mullen and Collier, 2004;. Ch. engchi. Whitelaw et al., 2005]。 ii.. 訓練資料來源: 適合用於情緒分析的訓練資料大致有兩種來源:「現成訓練資料」與消 費者評論之「星等系統(Star System)」。 . 現成訓練資料:個別研究人員或相關研究室建立了許多現成的訓練 資料,其中包含:. 25.

(26) . Congressional floor-debate transcripts:Thomas and Pang (2006)收集了政治演說的資料,並以演說者支持或反對進行中 的立法討論作為類別。. . Cornell movie-review datasets:由 Pang and Lee (2008) 提出,包含 1000 份電影評論之正面意見文件(Document)與 1000 份電影評論之負面意見文件。以及各 5331 個正負意見之 句子。. . MPQA Corpus:由不同來源所收集到的 533 筆新聞,並標誌以. 政 治 大. 個人意見或情感狀態(例如:信念、情感、揣測等)作為類別。. 立. . Multiple-aspect. restaurant. reviews : Snyder. and. ‧ 國. 學. Barzilay(2007)所提出,包含 4488 篇餐廳評論,針對食物、. ‧. 氣氛、服務、價值、與整體評價,皆具有完整的 1~5 星評分。. 星等系統:目前網路上大部分提供評論功能的網站,如 Amazon、. sit. y. Nat. . n. al. er. io. C-Net、EBay…等,皆具有為整體商品評分的星等系統。研究者可. i Un. v. 直接依據評論人所給予的星等判斷整體評論為正向或負向,不需經. Ch. engchi. 由人工判斷。因此也成為有力之訓練資料來源。 iii.. 分類器: 取得合適之訓練資料後,可以使用機器學習(Machine Learning)之演算 法訓練分類器。其中最廣為應用於情緒分析的演算法有三種,分別為 SVM (Support Vector Machines) [Pang and Lee, 2002; Dave et al., 2003; Gamon, 2004; Kudo et al., 2004; Airoldi et al., 2006]; NB (Naive Bayes) [Wiebe et al., 1999; Yu and Hatzivassiloglou,. 26.

(27) 2003;. Melville. et. al.,. 2009] 與. ME(Maximum-entropy-based. Classifiers) [Nigam et al., 1999; Pang and Lee, 2002]。其各自 有適合使用之情境,Pang and Lee (2002)的研究比較了各式分類器在 不同情境下的表現。 監督式演算法的好處在於,不需要使用額外的情緒辭典或模型,只需取得數 量足夠、已知情緒類別的評論做為訓練資料,即可產生用來分辨情緒的分類器。 然而,並非所有的情境都可取得適用的訓練資料。因此,另有一部分研究,發展 非監督式的情緒偵測演算法。. 立. 2.2.2 非監督式情緒偵測. 政 治 大. ‧ 國. 學. 非監督式情緒偵測,依其使用技術,可分為辭典與統計技術等兩大類。分述. 辭典(lexicons):. sit. y. Nat. io. 藉由人工註釋或利用外部辭典資源,情緒辭典可由擴充傳統辭典產生。. n. al. er. i.. ‧. 如下:. i Un. v. 外部辭典資源中,WordNet 為常被使用的辭典。Hu and Liu (2004)提. Ch. engchi. 出透過 WordNet 找尋形容詞種子之同義字與反義字,藉此判斷情緒之正 負向。如圖 8 所示,Fast 與 Slow 為種子形容詞,透過 WordNet 找出這 兩種極性(Polar)之相關形容詞,以標示其它形容詞之情緒正負向。. 27.

(28) 圖 8 雙極性之形容詞結構. 除了字典外,人工註釋之研究也已完成了相當完整的資料庫。其中最廣 為人知的有:. 政 治 大. . Cyc4(http://www.cyc.com). . Open Mind Common Sense5(http://openmind.media.mit.edu). . ThoughtTreasure6(http://alumni.media.mit.edu/mueller/pape. 立. ‧ 國. 學. 統計技術(statistical techniques):. sit. y. Nat. 除了使用外部辭典資源,現有研究亦經常利用統計技術估算兩字詞間的. io. al. er. ii.. ‧. rs/tt.html). v. n. 關係。例如觀察那些字詞與已知極性的字詞經常一同出現,並藉以決定. Ch. engchi. i Un. 這些字詞的情緒類別。Turney(2002)介紹了 PMI(Pointwise Mutual Information) 與. PMI-IR(Pointwise. Mutual. Information. –. Information Retrieval)兩種測量文字關聯性的方法。其中,PMI 測量 兩個文字出現在文件中的機率是否具有相關性。PMI-IR 則是一種藉助 搜尋引擎的測量方式。將兩文字同時出現、且距離相近作為搜尋條件, PMI-IR 以搜尋引擎找回的資料筆數測量兩文字間的相關性。其它類似 統計技術包括 LSA(Latent Semantic Analysis) [Landauer and Dumais,. 28.

(29) 1997]以及 NGD(Normalized Google Distance) [Cilibrasi and Vitanyi, 2007]. 在本研究中,由於 Amazon 的星等系統僅用作整體商品評分,並無法得知評 論人對於商品各個面相的態度為正向或負向。本研究使用情緒辭典判斷字詞的情 緒。再藉由整合相關字詞情緒,取得一則評論對於商品各面相的態度。. 2.3 重要面相彙整 就本研究所知,現有討論產品之「重要面相」的文獻仍然相當有限,現有研. 政 治 大. 究主要採用「頻率」與「複迴歸」等兩種方式找出重要面相。. 立. Zhang and Narayanan (2010)藉由所有評論中討論各面相句子出現「頻率」. ‧ 國. 學. 的多寡,估算各面相在消費者心目中的重要性。該方法假設被提到越多次的面相. ‧. 在消費者的心目中越重要。其定義 RFFf=∑. ,為被標籤作面相 f 之句. y. Nat. er. io. sit. 子的個數 Nf,與所有被標籤作任一面相之句子的個數的相對比例。圖 9 為 Zhang and Narayanan (2010)藉由該方法所得,數位相機與電視機的重要面相排序。. n. al. Ch. engchi. i Un. v. 圖 9 數位相機與電視之 RFF. Zhang et al., (2012)則指出,如果一個商品面相在負面評論中被提及的頻 率遠高於正面評論;或相較於其它競爭商品,該面相較常出現在負面評論,則該 29.

(30) 面相很有可能是該產品的弱點。Zhang et al., (2012)以沐浴乳為例,自化妝品 網站取得各沐浴乳品牌的評論資料。在進行面相萃取及情緒偵測後,決定每則評 論對於各個面相的正負向,並經由比對各項頻率找出商品的弱點。 上述研究皆以面相在評論中被提及的頻率判定其重要性。然而,在評論中常 出現的面相並不見得能實際左右消費者對整體商品的評價與購買決策。Yu et al. (2011)以 iPhone4 為例,指出有許多人在評論中提及不滿意「天線」這個面相, 卻無法在整體分數中顯現其不滿意的情緒,為一無差異品質。這樣的無差異品質 並無法在單純的頻率計算中突顯。. 政 治 大. Wang et al. (2010)與 Yu et al. (2011)使用迴歸模型找出各個面相的權. 立. 重並作出排序。此方法假設每篇評論皆完整的描述商品的所有面相,使得該方法. ‧ 國. 學. 僅適用於比較具有結構化的評論資料,例如許多旅館評論網站皆具體的要求使用. ‧. 者針對預設的各個面相給與意見,如圖 10 所示。然而,現有大部分網站(例如. sit. y. Nat. Amazon, facebook, …)中的消費者評論皆為非結構化資訊。在無提示與限制之. n. al. er. io. 下,消費者往往在評論中僅提及其主觀所考量到的部分面相,並不會完整的評論. i Un. v. 商品所包涵的所有面相。因此,在面對目前佔較高比例的非結構化資料時,複迴. Ch. engchi. 歸分析將因難以取得全面、無遺漏值(Missing Data)的資料而無法使用。. 30.

(31) 立 圖 10. 政 治 大 Trip Advisor 結構性給分. ‧ 國. 學. 無論使用「頻率」或「複迴歸」,現有辨別重要面相的研究皆沒有考慮評論. ‧. 間的互相影響。消費者在上網撰寫評論時,通常已先看過其它人的評論,並因此. sit. y. Nat. 影響其撰寫評論的內容及意願[Moe and Schweidel, 2012]。一則評論所沒有提. io. al. er. 及的商品面相,並不代表評論人覺得這些面相不重要、或沒有意見。評論人有可. v. n. 能為了滿足獨特性,而只表達其不同於主流評論的意見。在本研究中,我們將針. Ch. engchi. i Un. 對這個問題設計演算法,以偵測具有未表達意見的評論,並藉由評論間的關聯預 測其值。詳細內容將於下一章呈現。. 31.

(32) 第三章 研究方法 本研究方法分為四大步驟:「資料前處理」、「面相辨識與情緒偵測」、「不 一致性改善」與「重要面相彙整」。 在第一部分「資料前處理」中,本研究透過爬蟲程式抓取 Amazon 上數位相 機 Canon SX 系列三個世代 SX210, SX230, SX260 的消費者評論,共計 1435 筆。 第二部分「面相辨識與情緒偵測」細分為三道流程:面相定義、面相標籤. 政 治 大 al. (2010)提出的數位相機重要面相作為三個世代相機的主要面相,並依據 Wang 立. (Sentence Labeling)、與情緒偵測(Sentiment Analysis)。我們採用 Zhang et. ‧ 國. 學. et al, (2010) 提出的面相區隔演算法(Aspect Segmentation Algorithm)擴充 關鍵字字庫。其次,透過關鍵字比對為各個句子加上其對應的面相標籤。最後,. ‧. 使用 MPQA Opinion Corpus 之情緒詞典偵測出各個面相的情緒正負與強烈程度。. y. Nat. io. sit. 第三部分「不一致性改善」透過本研究提出之架構,偵測各篇評論是否滿足. n. al. er. 不一致性及至少考量數目(Minimal Decision Number),以找出具有隱而未現意. Ch. i Un. v. 見的待填值評論。並以本研究所提出的群組眾數(Group Majority)法填值。. engchi. 第四部分「重要面相彙整」使用第三部分改善後的資料,透過本研究建構之 GPA Model (Group-Product Aspects Model) 區別各面相之得分在不同產品總分 (1 星、2 星...5 星)下的分布狀況,以辨別消費者感受之各世代產品的重要正向、 負 向 面 相 。 最 後 , 彙 整 三 個 世 代 的 資 訊 , 放 入 本 研 究 定 義 之 MPA Matrix (Multi-Generation Product Aspect Matrix),觀察消費者感受之重要面相於三 個世代產品間的改變。. 32.

(33) 3.1 資料前處理 資料前處理包含資料抓取與資料清理。本研究使用爬蟲程式由 Amazon 原始 碼中取得 Canon SX 系列三世代 SX210、SX230、SX260 之產品評論,同時取得各 評論之總分與發表時間,如圖 11 所示。並使用人工資料清理(Data Cleaning) 之方法處理文法以及拼音錯誤。. 立. 政 治 大. ‧. ‧ 國. 學 iv n C 1 所示,我們使用句號(.)、問號(?),或驚嘆號(!)作為斷 hengchi U n. 斷句方面,如表. 圖 11 Amazon 評論範例. er. io. sit. y. Nat. al. 句標示,將一則文件層級(Document Level)的評論,經過斷句程序後成為句子層 級(Sentence Level)之資訊。表 1 的例子“This is a great point and shoot, video camera and also can be used for conventional planned photographs. It is quick between shots or shoot a series from which you can choose the best.”透過斷句將一則評論切割為兩個句子;斷字方面,使用空白( )區隔句子 中的字詞,轉換為字詞層級(Word Level)之資訊。在表 1 的例子中,我們藉由. 33.

(34) 空白將一個句子切割為數個字詞。由於篇幅有限,表格中並未列舉所有切割出來 的字詞。 表 1 斷句斷字. 原始評論. This is a great point and shoot, video camera and also can. (文件層. be used for conventional planned photographs. It is quick. 級). between shots or shoot a series from which you can choose the best.. 斷句. 1. This is a great point and shoot, video camera and also. (句子層. 立. 2. It is quick between shots or shoot a series from which. 學. ‧ 國. 級). 政 治 大. can be used for conventional planned photographs. you can choose the best. (字詞層. is. 級). a. ‧. This. n. al. er. io. sit. y. Nat. 斷字. great point. Ch. engchi. and shoot video camera…等. 34. i Un. v.

(35) 3.2 面相辨識與情緒偵測 此步驟的目的為使用情緒偵測程式,在大量評論中取得各個消費者針對預設 面相的情緒。為達到此目的,本研究以三步驟依序進行:面相辨識(Identify)、 面相標籤(Tag)、以及情緒偵測(Sentiment Analysis)。. 3.2.1 面相辨識 本研究以 Zhang et al. (2010)所提出之數位相機十大研究面相及其關鍵字. 政 治 大. (如表 2 所示)做為基礎面相及種子詞彙,並依據 SX 系列產品主打之新功能額外. 立. 增加 Video、GPS、Pictures 等三個面相。. ‧ 國. 學. 表 2 Zhang et al.定義之數位相機十大面相. ‧. 10 Most Important Product Features for Digital Camera. Nat. Resolution, pixel, megapixel. al. n Lens. y. sit. io. Resolution. Keywords. er. Aspect. iv normal n C hLens, wide angle, engchi U. range. zoom. Optical, zoom, optical zoom, digital zoom. Memory. Memory, megabytes, MB. Burst. Burst, continuous, shutter, recovery, motion, sport. Battery. Battery, batteries, power. Focus. Focus, exposure, manual, iso. LCD. LCD, screen 35.

(36) Compression. Compression, compress, jpeg. Flash. Flash, light. 定義主要面相及種子辭彙後,我們使用 Wang et al. (2010)提出的面相區 隔演算法擴充種子詞彙,其演算法如圖 12 所示。我們首先以表 2 中,代表主要 面相的詞彙作為種子詞彙,並藉由種子詞彙標誌句子所屬的面相。接著,透過卡 方值(Chi-Square Measure)測量其它詞彙與各面相之間的關聯性,並逐次將關聯 性高的詞彙加入相關的面相,以建立最後的關鍵字庫。卡方值定義如圖 13 所示。 其中,Ai 為第 i 個面相,w 為某個字詞。C1 為 w 出現在屬於 Ai 面相的句子數,C2. 治 政 為 w 出現在不屬於 A 面相的句子數,C 為屬於 A 面相且沒有出現 w 的句子數, 大 立 i. 3. i. C4 為不屬於 Ai 面相且沒有出現 w 的句子數,C 為總句子數。若詞彙 w 出現在被標. ‧ 國. 學. 誌為特定面相 Ai 的句子中的機率愈高,且出現在不屬於 Ai 的句子中的機率愈低,. ‧. 則其卡方值越高。卡方值越高,代表字詞 w 與面相 Ai 的關聯性越高、越有可能. Nat. n. al. er. io. sit. y. 適合用來代表該面相。. Ch. engchi. 36. i Un. v.

(37) 立. 政 治 大. ‧. ‧ 國. 學 圖 12 面相區隔演算法. er. io. sit. y. Nat. n. al. 圖. iv n C 13 面相區隔演算法-卡方值 hengchi U. 以圖 14 為例,「Battery」面相的種子詞彙為表 2 原始定義的 Battery、 batteries、以及 power。而透過面相區隔演算法,並使用人工再次檢視,我們 加入 Charge, Lasts, Lasting, Charged 等四個詞彙為面相 Battery 之相關詞彙。 透過以種子詞彙找出相關詞彙的方式,本研究建構出所有面相的關鍵字字庫,如 圖 15 所示。. 37.

(38) 立. 政 治 大. ‧. ‧ 國. 學. 圖 14 Battery 之相關詞彙. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 圖 15 關鍵字字庫. 3.2.2 面相標籤 建置關鍵字字庫後,本研究為在 3.1 中經過資料前處理的各個句子貼上對應 面相之標籤。舉例而言,圖 16 中評論的最後一句話:“It's a good camera & quality clear pictures, with a clear & sharp LCD screen”提到 Picture. 38.

(39) 與 LCD 兩個面相,則我們為此句子貼上“Picture”與“LCD”兩個面相標籤。需 注意的是,在本研究中,一個句子可能同時被貼一個以上之面相標籤。. 圖 16 面相標籤. 3.2.3 情緒偵測. 立. 政 治 大. ‧ 國. 學. 為各個句子貼上面相標籤後,本研究使用 3.1 資料前處理後斷字完成之資. sit. y. Nat. 面相標籤與情緒,得出一則評論中各個面相之情緒分數。. ‧. 料,使用非監督式之 MPQA Corpus 情緒字典,為字詞貼上情緒標籤。最後,整合. io. al. er. MPQA Corpus 情緒字典如表 3 所示,具有字詞、詞性、主觀之強弱程度、情. v. n. 緒極性等資訊。其中本研究定義情緒的差異為等距,且為情緒之強弱程度與情緒. Ch. engchi. i Un. 極性之組合。如表 4 所示,若情緒為強主觀與正向,則情緒分數為 5 分;反之, 若情緒為強主觀與負向,則情緒分數為 1 分;中立之情緒分數為 3 分。透過此方 法,即可藉由對照情緒字典獲得一個字詞之情緒分數。. 39.

(40) 表 3 MPQA Corpus 情緒字典. 政 治 大. 學. Positive. Neutral. 強主觀 strongsubj. 5分. 3分. 弱主觀 weaksubj. 4分. 3分. 負向情緒 Negative 1分 2分. er. io. sit. 中立情緒. Nat. 正向情緒. y. 表 4 情緒程度. ‧. ‧ 國. 立. 在本研究中,針對一則評論的一個特定面相,我們首先集合評論中標誌為該. al. n. iv n C 面相的句子,偵測這些句子中每個字詞的情緒,最後再總合所有字詞情緒決定此 hengchi U 評論對於該面相的評價。根據 Wiebe(2004)的看法與本研究的觀察,在將字詞層 級之情緒分數彙整成為文件面相層級之情緒分數時,本研究定義若出現高強度之 情緒,則取高強度情緒為此面相之情緒分數。其原因為:本研究觀察到評論者之 情緒通常時高時低,並不會一直處於高強度。而高強度情緒對於整份評論的正負 極性通常具有較決定性的影響。. 40.

(41) 表 5 為一則評論經過面相辨識與情緒偵測處理後,所得到各面相的評價。 其中,由於該評論並沒有偵測到針對 Resolution、Compression、及 GPS 等三個 面相的句子,故該評論對於這三個面相的值皆為“無(none)”。 表 5 經面相辨識與情緒偵測處理後,各面相評價實例 Review. A1. A2. A3. A4. A5. A6. A7. A9. A10. A11. A12. A13. GPS. Picture. none. 5. A8 LCD ID 1. Resolution Lens (Zoom) Memory Burst Battery Focus none. 5. 5. 5. 1. 5. 5. Compression Flash Video 5. none. 5. 5. 3.3 不一致性改善. 政 治 大 不一致性改善分為三個步驟:「填值偵測」、「填入順序」、與「填值方式」。 立. ‧ 國. 學. 我們首先以本研究所提出的 IIF(Inconsistent Identification)程式確認何則 評論需要填值,再決定填入面相之優先順序,最後藉由群組眾數(Group Majority). er. io. sit. y. Nat. 3.3.1 填值偵測. ‧. 法決定所填之值,並填入該值以改善不一致性。. al. n. iv n C 填值偵測之目的在於判斷各則評論是否需要進行填值。而判斷的依據,在於 hengchi U 評論中的面相意見與評論總分是否不一致、以及具有意見的面相個數是否滿足至 少考量數目(Minimal Decision Number)。 在本研究中,我們依據 Amazon 的星等系統及 0 的情緒偵測技術分別取得一 則評論對於整體產品及各面相 1 分到 5 分的評分。我們設定,1~2 分為負面評價、 3 分為中立評價,4~5 分為正面評價。則,我們定義當一則評論的評價滿足下列 條件時,評論的面相評分足以支持產品總分: 1. 當整體產品的評價為正面時,至少需有一個面相的評價為正面。 41.

(42) 2. 當整體產品的評價為中立時,所有具有評價的面相皆為中立、或至少存在一 個面相的評價為正面及一個面相的評價為負面。 3. 當整體產品的評價為負面時,至少需有一個面相的評價為負面。 當一則評論無法滿足上述三個條件時,我們即判定該評論的面相評價無法支持該 評論對整體產品的評分,即存在有不一致的現象。 Sheena Iyengar(The art of choosing)提到,人在做選擇時,通常具有最 少考量因素。本研究假設,每位消費者進行購買決策時,存在有一個至少考量數 目(Minimal Decision Number) n。消費者至少會考慮 n 個面相,才會決定購買. 政 治 大. 某產品。亦即,一則評論裡,至少要有 n 個面相具有意見。本研究將以情境分析,. 立. 透過模擬方式觀察在不同至少考量數目的設定下,消費者的偏好差異。. ‧ 國. 學. 根據以上描述,本研究定義滿足下列任一情況的評論需要填值。. ‧. 1. 不一致狀況:各面相的情緒分數無法支持總體分數。. Nat. sit. n. al. er. io 3.3.2 填入順序. y. 2. 有意見的面相數目低於至少考量數目 n (n = 1, 2, …. 10 )。. Ch. engchi. i Un. v. 在找出需要填值的評論後,本研究接著決定那些缺值的面相需要優先被填值。 由於消費者在發表評論前,多半已看過先前發表的評論。且過去已有研究指出, 在網路上分享商品評論的人(poster)會因為看過其它人已發表的意見,而影響其 對於商品的評價[Schlosser,2005]。根據 Shrihari and Srinivasan (2012)表 示,獨特性需求(uniqueness needs)對於評論內容具有明顯的影響。當消費者同 意所看過評論中某些面相的主流意見時,為了表現自己的獨特性,消費者在撰寫 評論時,可能省略該面相不提,僅提出與主流意見不同的看法。因此,本研究假 42.

(43) 設,在一篇評論沒有提到的所有面相中,在該評論之前越被廣泛討論,越有可能 會因為評論人的獨特性需求而被省略不提。 根據上述假設,本研究定義填值順序如下: 1. 優先針對在該評論發表前,所有評論中最常被提到的面相進行填值(以頻率計 算)。 2. 若在該評論之前沒有其它評論,或所有該評論沒提到的面相、在之前的評論 也都沒有被提到,則:優先針對在所有評論中,最常被提到的面相進行填值。. 政 治 大. 3.3.3 填值方式 GM (Group Majority Value). 立. 本研究使用 GM, Group Majority Value 決定所填入之值。本研究首先以整. ‧ 國. 學. 體產品滿意度(5 分、4 分、3 分、2 分、1 分)將所有評論分為五個群組(Groups)。. ‧. 表 6 為各世代相機、不同群組所包含的評論數目。正如上一小節所述,評論人. sit. y. Nat. 可能因為受到既有評論的影響,而隱藏與主流相同的意見,僅發表獨特意見以滿. n. al. er. io. 足自己的獨特性需求。因此,本研究假設,當評論人對某特定面相存有未表達於. i Un. v. 評論上的意見時,該意見最有可能與所在群組對該面相的主流意見相同。根據上. Ch. engchi. 述假設,本研究針對目標面相的填值方法如下:. 1. 填入該則評論發表之前的同群組評論中,目標面相評價的眾數 2. 若在該評論之前沒有其它同群組的評論,或所有之前發表的同群組評論在目 標面相上也都沒有發表意見,則:填入該評論之前發表的所有評論中,目標 面相評價的眾數。 3. 若在該評論之前沒有其它評論,或所有之前發表的評論在目標面相上也都沒 有發表意見,則:填入所有評論中,目標面相評價的眾數。 43.

(44) 若一則評論在經過填值後,依然存在有不一致的現象,或存在評價值的面相個數 依然低於至少考量數目 n,則重覆 3.3.2 及 3.3.3 的步驟,直到上述需填值的狀 況被排除。 表 6 各族群各世代之評論數目. 5分. 4分. 3分. 2分. 1分. Sx210. 178. 90. 41. 32. 24. Sx230. 226. 109. 41. 35. 29. Sx260. 416. 119. 51. 18. 26. 3.4 重要面相彙整. 立. 政 治 大. 取得改善不一致性之完整資料後,我們使用本研究所提出之 GPA Matrix. ‧ 國. 學. (Group- Product Aspects Matrix) 輔以迴歸與決策樹分析,找到重要面相。最. ‧. 後 彙 整 三 個 世 代 之 重 要 面 相 , 以 本 研 究 所 提 出 之 MPA Matrix. Nat. sit. y. ( Multi-Generations Product Aspects Matrix) 觀察消費者重視之面相的改變. n. al. er. io. 軌跡。本章節將詳細說明上述本研究在重要面相彙整步驟所使用的分析方法。. 3.4.1 GPA Matrix. Ch. engchi. i Un. v. 本研究以 GPA Matrix 整理在不同的整體產品評分下,各產品面相被評價為 正向、負向、以及中立的比例,如表 7 所示。表 7 為一未經過填值的原始資料, 故在表格的最左上角以「Raw」表示。若 GPA Matrix 所分析的為經過填值的資料, 則會依至少考量數目 n 的值,以 D1,D2,等符號表示。在表 7 中,橫軸為整體產 品的滿意度(1 分、2 分…5 分),縱軸分別為各面相之負向(N)、中立(M)、正向 (P),以及各面相的頻率(Frequency)。表格中一個欄位的值代表在橫軸整體產品 44.

(45) 滿意度的前提下,縱軸中各面相不同評價出現的頻率。以欄位(B, 2)之值 4(66%) 為例,該值代表在整體產品分數為 1 分的群組中,對面相 A2 鏡頭表示負面意見 的有 4 筆資料,占整體分數為 1 分中提到鏡頭評論的 66% 。欄位(B, 5)的值 6(25%) 則代表在整體商品分數為 1 分之評論中,提到鏡頭之人數有 6 人,佔整體商品分 數 1 分評論的 25%。其中,由於消費者評論中會提到一至多個面相,故該比例的 總和可能超過 100%。 表 7 GPA Matrix. Raw. 1. A2 Lens (N). 4(66%). A2 Lens (M). 0(0%). 2. 政 治4(66%)大 7(29%) 1(10%) 1(16%) 1(4%) 3(30%). 1(16%). 16(66%). 5 9(23%) 5(13%) 24(63%). 學. ‧ 國. 4. 6(60%). 立 2(33%). A2 Lens (P). 3. 10(31%). 6(14%). 24(26%) 38(21%). A3 Zoom (N). 2(40%). 7(53%). 3(17%). 3(6%). 5(4%). A3 Zoom (M). 1(20%). 3(23%). 4(23%). 6(12%). 11(10%). A3 Zoom (P). 2(40%). 3(23%). 10(58%). 39(81%). 88(84%). A3 Frequency. 5(20%). 13(40%). 17(41%) 48(53%) 104(58%). A5 Burst (N). 10(90%). 9(64%). 11(52%). al. 2(14%). 4(19%). 15(45%). er. io. sit. y. ‧. 6(25%). Nat. A2 Frequency. 1(3%) v i n. 10(25%). 0(0%). A5 Burst (P). 1(9%). A5 Frequency. 11(45%) 14(43%). 21(51%) 33(36%) 39(21%). A6 Battery. 2(50%). 1(33%). 1(25%). 3(21%). 8(19%). 1(25%). 2(66%). 2(50%). 1(7%). 7(17%). 1(25%). 0(0%). 1(25%). 10(71%). 26(63%). A6 Frequency. 4(16%). 3(9%). 4(9%). 14(15%) 41(23%). A7 Focus (N). 7(77%). 9(56%). 11(55%). 14(42%). 8(15%). A7 Focus (M). 0(0%). 3(18%). 2(10%). 3(9%). 3(5%). A7 Focus (P). 2(22%). 4(25%). 7(35%). 16(48%). 40(78%). n. A5 Burst (M). C h3(21%) 6(28%)U engchi. 17(51%). 5(12%) 24(61%). (N) A6 Battery (M) A6 Battery (P). 45.

(46) A7 Frequency. 9(37%). 16(50%). 20(48%) 33(36%) 51(28%). A8 LCD (N). 1(50%). 4(66%). 4(66%). 5(29%). 7(23%). A8 LCD (M). 0(0%). 0(0%). 0(0%). 0(0%). 1(3%). A8 LCD (P). 1(50%). 2(33%). 2(33%). 12(70%). 22(73%). A8 Frequency. 2(8%). 6(18%). 6(14%). 17(18%) 30(16%). A10 Flash (N) 4(66%). 12(100%) 14(66%). 26(54%). 26(40%). A10 Flash (M) 0(0%). 0(0%). 1(4%). 5(10%). 4(6%). A10 Flash (P) 2(33%). 0(0%). 6(28%). 17(35%). 35(53%). A10 Frequency. 6(25%). 12(37%). 21(51%) 48(53%) 65(36%). A11 Video (N). 0(0%). 5(55%). 6(30%). 6(16%). 9(15%). A11 Video (M). 0(0%). 1(11%). 2(10%). 6(16%). 7(12%). A11 Video (P). 3(100%). 3(33%). A11 Frequency A13 Picture. 10(7%). 0(0%). 2(7%). 6(18%). 4(5%). 8(42%). 5(18%). 18(54%). 46(68%). 111(87%). 33(80%) 67(74%) 127(71%). er. 19(79%) 27(84%). io. A13 Frequency. 6(4%). y. Nat. (P). 17(25%). 57(32%). n. a. l C 3.4.2 迴歸與決策樹分析. sit. A13 Picture. 9(27%). ‧. (M). 20(74%). 立. ‧ 國. A13 Picture. 11(57%). 學. (N). 41(71%). 3(12%). 治12(60%) 24(66%) 政 9(28%) 20(48%) 大 36(40%). hengchi. i Un. v. 除了 GPA Matrix 外,本研究同時使用迴歸與決策樹(Decision Tree),分析 填值過後之資料。 填值過後之資料。可使用 OLS 迴歸分析,然而由於各個面相之相互影響的多 重共線性(multicollinearity)影響較大,因此本研究僅以輔助的角度使用迴歸 分析之結果,再次確認各世代重要面相(X)為影響整體分數(Y)之顯著變數。 決策樹為分類模型的一種,由於擁有近似人類決策模式,以及容易解釋等優 點,決策樹為最受歡迎的分類器之一。除了用來分類資料,決策樹也相當適合用 46.

(47) 來整理、分析資料中屬性與類別之間的關係。在本研究中,我們以各面相的評價 為屬性、產品整體評分為類別,訓練決策樹。不同於一般決策樹,由於評論人對 於特定面相不發表意見可能具有特殊意涵。因此在本研究中,每個決策樹的內結 點固定分裂為三個分支。以圖 17 中的內結點為例,該內結點以變焦面相(Zoom) 的評價做為分裂屬性,且以 3.5 分做為分裂點。該結點所分裂出的前兩個分支分 別代表變焦面相的評價為{1、2、3}分,及{4、5}分的評論,而最後一個以虛線 呈現的分支則代表沒有對變焦發表意見的評論。. 學. ‧ 國. 立. 政 治 大 圖 17 決策樹分支. ‧. 此外,由表 7 的資料可觀察出,不管是那個世代,整體商品總分的分布都. sit. y. Nat. 很不帄均,整體商品評分為 5 分、4 分的評論遠多於 2 分、1 分者。此類別分布. io. al. er. 不帄均的情況,將導致決策樹傾向將一則評論分類為高分類別。然而,在實際應. v. n. 用中,低分的評論卻反而可能是廠商更需要重視的。因此,在本研究中,我們採. Ch. engchi. i Un. 用考量分類成本的決策樹(Cost-Sensitive Decision Tree),並設定越稀有的類 別(即低分評論)被分類錯誤的成本越高,以讓決策樹更傾向分辨低分的評論。. 3.4.3 MPA Matrix 本研究以多世代產品面相矩陣 MPA Matrix (Multi-Generations Product Aspects Matrix) 彙整由 GPA Matirx、迴歸分析、決策樹分析後,取得的三個 世代相機之重要面相,填入本研究提出之 MPA Matrix 中。. 47.

(48) 在表 8MPA Matrix 中,橫軸為正向面相、負向面相、次要負向面相。可檢 視各世代之主要與次要面相。並輔以產品資料,協助分析不同世代產品發展的軌 跡。 表 8 MPA Matrix. MPA SX210. 主要正向面相. 主要負向面相. 次要負向面相. A3(Zoom),. A3(Zoom),. A5(Brust). A13(Picture). A10(Flash). A7(Focus). A3(Zoom), SX230. A5(Brust), A13(Picture). 立. A3(Zoom),. None. 政 治 大. A10(Flash). None. ‧ 國. A5(Brust),. 學. A13(Picture). ‧. io. sit. y. Nat. n. al. er. SX260. A6(Battery),. Ch. engchi. 48. i Un. v. A10(Flash).

(49) 第四章 研究結果 4.1Canon Sx 系列三世代產品描述 Canon 為數位相機知名品牌,旗下的 SX 系列以輕巧、便於攜帶的隨身機為 主要目標市場,並以高倍變焦為主打特色。在 SX230 之後,也加入了許多濾鏡及 創意拍攝模式。表 9 為本研究所探討的三台相機 SX210、SX230,及 SX260 的規. 政 治 大 表 9 Canon SX 系列三世代產品規格比較表 立. 格比較表。. SX 260. 2010 年 8 月. 2011 年 2 月. 2012 年 2 月. 1410 萬像素. 1210 萬像素. 1210 萬像素. 1/2.3 吋 CCD. 1/2.3 吋 CMOS. 1/2.3 吋 CMOS. 4320x3240. 4000x3000 1920x1080@24fps 1280x720@30fps 640x480@30fps 320x240@30fps 28mm 至 392mm 14x. 4000x2248 1920x1080@24fps 1280x720@30fps 640x480@30fps 320x240@30fps 25mm 至 500mm 20x. ISO 感光值 LCD 螢光幕 電池種類 機身重量 體積 GPS 定位. 5cm(廣角端). al. n. 連拍速度. 28mm 至 392mm 14x. Ch. engchi. 5cm(廣角端). y. sit. er. io. 等效焦長 變焦能力 最近對焦距 離 光圈範圍. ‧. Nat. 1280x720@30fps 動畫解像度 640x480@30fps 320x240@30fps. 學. SX 230. ‧ 國. SX210 Amazon 上市日期 有效像素 感光元件大 小 最大解析度. i Un. v. 5cm(廣角端). F3.1-F5.9 一般速度約為 0.7fps 80~1600. F3.1-F5.9 F3.5-F6.8 一般速度約為 1fps 一般速度約 2.4fps 高速模式約為 8.2fps 高速模式約為 10.3fps 80~3200 100~3200 3.0 吋 PureColor II G LCD 螢 3.0 吋 PureColor II G LCD 螢 3.0 吋 TFT LCD 螢幕 幕 幕 NB-5L 鋰電池 NB-5L 鋰電池 NB-6L 鋰電池 215 克 215 克 224 克 106x59x32mm 106x59x32mm 106x61x32mm 無 有 有. SX210 於 2010 年 8 月在 Amazon 上市開賣,除了高達 1410 萬的有效像素外, 光學變焦也從上個世代的 12 倍增加到 14 倍,等效焦長為 28mm 至 392mm,也是 49.

(50) 當時日系廠牌中,該焦段內體積最輕巧的高倍變焦機種。但在望遠端 392mm 時, 最大光圈僅有 F5.9(T)。此外,有別於前一世代具有 2cm 的超微距能力,SX210 在廣角端的最近對焦距離僅為 5cm。因此,在近拍時較容易對焦失敗。不到 1fps 的連拍速度在拍攝動態物體時也顯得吃力。SX 系列的彈出式閃光燈設計,是在 消費者中最受爭議的面相。從 SX210 到 SX260,三台相機的閃光燈都會在開機時 自動彈出,且由圖 18Canon SX 系列三世代相機的產品圖中可見,閃光燈彈出的 位置正好是一般人左手習慣放置的位置。. 立. 政 治 大. SX230. sit. Nat. 圖 18 Canon SX 系列三世代產品圖. SX260. y. ‧. ‧ 國. 學. SX210. a. er. io. 與 SX210 的 CCD 感光元件相較,2011 年 2 月上市的 SX230,感光元件. n. v l 已改用背照式 CMOS,使得相機在較差的光源及光圈條件下能夠拍出較好的 ni Ch. engchi U. 照片。除此之外,SX230 也是該系列首度加入 GPS 功能的相機。然而,由 於 SX230 仍和 SX210 一樣使用 NB-5L 鋰電池,在未關閉 GPS 功能的情況下, 即使相機電源沒有開啟,電源消耗的速度依舊相當驚人。在連拍速度方面, SX230 一般模式下的連拍速度提升至差強人意的 1fps,並另外提供 8.2fps 的高 速模式。但在高速模式下,照片的品質會大幅下降。此外,SX230 的螢幕採用了 新的 PureColor II G 技術,並且在攝影方面提供 1920x1080 的 Full HD 解析度。 但在錄製 Full HD 影片時,畫面更新頻率僅剩每秒 24 格。. 50.

(51) 在 SX230 上市整整一年後,SX260 一口氣將變焦倍率提升至 20 倍。連 拍速度亦提升至一般模式約 2.4fps,高速模式約 10.3fps。且即使在高速 模式下,也能夠拍攝最高畫質、最高畫素的照片。SX260 的電池改用 NB-6L 鋰電池,疏緩了 SX230 電池容量不足的窘境。整體而言,SX260 改善了前 兩個世代連拍速度慢、及電池耗電快的缺點,並且進一步強化高變焦倍率 的主打特色。然而,其閃光燈依舊保留了彈出式設計,且仍然放置在一般 消費者左手慣於放置的位置。. 政 治 大. 4.2 原始資料描繪. 立. 定義關鍵字字庫與使用非監督式情緒偵測後,可獲得 Canon PowerShot SX. ‧ 國. 學. 三世代各面相之情緒分數與總分。其中,本研究從面相辨識而來的 13 個面相,. ‧. 如表 10。其中 3 個面相:解析度(A1 Resolution)、記憶體(A4 Memory)、以及. sit. y. Nat. 壓縮(A9 Compression),由於在本研究所收集到的評論中,極少提及這三個面相。. n. al. er. io. 且經咨詢專家後,確認這三個面相為目前消費者選購相機時較不會考慮的面相。. i Un. 故在本研究接下來的分析中,皆忽略這三個面相。. Ch. engchi. v. 表 10 原始定義之 13 面相 Review. A1. A2. A3. A4. A5. A6. A7. A9. A10. A11. A12. A13. GPS. Picture. A8 LCD ID. Resolution Lens (Zoom) Memory Burst Battery Focus. Compression Flash Video. 表 11 為從 SX210 的評論中抽出的前 10 筆資料,橫軸為各面相(A2~A13)與 整體分數(Score)。其中第 1 筆資料於各面相皆有情緒分數,第 3 筆資料後開始 有缺值(A5, A6, A8)。整體分數為 Amazon 上星等系統之給分,因此各筆資料皆 無缺值。. 51.

(52) 表 11 SX210 情緒偵測後原始資料. 編. A2. A3. A5. A6. A7. A8. A10. A11. A13. Scor. 號. Len. Zoo. Burs. Batter. Focu. LCD. Flas. Vide. Pictur. e. s. m. t. y. s. h. o. e. 1. 5. 5. 5. 5. 5. 5. 5. 5. 5. 5. 2. 5. 5. 1. 2. 5. 4. 5. 5. 4. 4. 3. 1. 5. none. none. 1. non. 1. 5. 1. 4. e 4. 5. 5. 5. 1. 5. 5. 1. 5. 5. 5. 5. 5. 5. 5. none. 5. 1. 5. 1. 5. 5. 6. non. 5. none. none. 5. 4. none. 5. 5. 5. 5. 5. 4. 政 治 大 5 4 5. e 5. 5. 5. 8. 1. 1. 5. 9. 5. 5. 1. 5. 5. 5. 1. 1. 1. 5. 2. 5. none. 5. 4. 3. 5. 5. 4. 5. 5. 5. 1. 5. 3. 4. 4. ‧ 國. none. ‧. 0. 立none. 學. 7. sit. y. Nat. 透過 GM 填值方式改善不一致性與使用情境分析模擬至少考量數目(Minimal. n. al. er. io. Decision Number)後,可以獲得表 12 中的 10 筆資料,在不同至少考量數目下(因. i Un. v. 篇幅限制,以 D1, D2, D3,D8,D9 為例),填值後的結果。可看到 D1,D2,D3 因前. Ch. engchi. 十筆資料較少缺值,並無填值效果,而在 D8,D9 中可看出明顯填值後的改變。在 4.3 節中我們將進一步說明,如何決定最適合本研究資料的至少考量數目。 表 12 GM 填值後結果. A5. A6. A7. Burs. Batter. Focu. t. y. s. 5. 5. 5. 5. 5. 5. 1. 2. 3. 1. 5. none. 4. 5. 5. 5. A2. A3. Lens. Zoom. 1. 5. 2. D1. A10. A11. A13. Flas. Vide. Pictur. h. o. e. 5. 5. 5. 5. 5. 5. 4. 5. 5. 4. 4. none. 1. none. 1. 5. 1. 4. 1. 5. 5. 1. 5. 5. 5. 52. A8 LCD. Scor e.

(53) 5. 5. 5. 5. none. 5. 1. 5. 1. 5. 5. 6. none. 5. none. none. 5. 4. none. 5. 5. 5. 7. 5. 5. 5. none. 5. 4. 5. 5. 5. 4. 8. 1. 1. 5. none. 5. 1. 1. 1. 5. 2. 9. 5. 5. 5. none. 5. 4. 3. 5. 5. 4. 10. 5. 5. 5. 5. 5. 1. 5. 3. 4. 4. A2. A3. A5. A6. A7. A10. A11. A13. Lens. Zoom. Burs. Batter. Focu. Flas. Vide. Pictur. t. y. s. h. o. e. 1. 5. 5. 5. 5. 5. 5. 5. 5. 5. 5. 2. 5. 5. 1. 2. 5. 4. 5. 5. 4. 4. 3. 1. 5. none. none. 5. 1. 4. 4. 5. 5. 5. 1 治none 1 政 1 5 5 大1. 5. 5. 5. 5. 5. 5. 5. 6. none. 5. none. 7. 5. 5. 8. 1. 9 10. D2. LCD. Scor e. 5. 1. 5. 5. none. 5. 4. none. 5. 5. 5. 5. none. 5. 4. 5. 5. 5. 4. 1. 5. none. 5. 1. 1. 1. 2. 5. 5. 5. none. 5. 4. 3. ‧. 5. 5. 5. 4. 5. 5. 5. 5. 5. 1. 5. 3. 4. 4. A2. A3. A5. A6. A7. Lens. Zoom. Burs. Batter. Focu. t. s. 1. 5. 5. 5. Cyh. 2. 5. 5. 1. 2. 5. 3. 1. 5. none. none. 4. 5. 5. 5. 5. 5. 5. 6. none. 7. y Vide. Pictur. o. e. 5. 5. 5. 5. 4. 5. 5. 4. 4. 1. none. 1. 5. 1. 4. 1. 5. 5. 1. 5. 5. 5. 5. none. 5. 1. 5. 1. 5. 5. 5. none. none. 5. 4. none. 5. 5. 5. 5. 5. 5. none. 5. 4. 5. 5. 5. 4. 8. 1. 1. 5. none. 5. 1. 1. 1. 5. 2. 9. 5. 5. 5. none. 5. 4. 3. 5. 5. 4. 10. 5. 5. 5. 5. 5. 1. 5. 3. 4. 4. D8. A2. A3. A5. A6. A7. A8. A10. A11. A13. Scor. al. n. D3. 5. LCD. e n g5 c h 5i. 53. er. A13. io. A11. A8. A10. sit. ‧ 國. 1. 學. 5. Nat. 立 none. A8. Flas. i U nh. v. Scor e.

(54) Lens. Zoom. Burs. Batter. Focu. t. y. s. LCD. Flas. Vide. Pictur. h. o. e. e. 1. 5. 5. 5. 5. 5. 5. 5. 5. 5. 5. 2. 5. 5. 1. 2. 5. 4. 5. 5. 4. 4. 3. 1. 5. 5. none. 1. 1. 1. 5. 1. 4. 4. 5. 5. 5. 1. 5. 5. 1. 5. 5. 5. 5. 5. 5. 5. none. 5. 1. 5. 1. 5. 5. 6. 5. 5. 5. none. 5. 4. 5. 5. 5. 5. 7. 5. 5. 5. none. 5. 4. 5. 5. 5. 4. 8. 1. 1. 5. none. 5. 1. 1. 1. 5. 2. 9. 5. 5. 5. none. 5. 4. 3. 5. 5. 4. 10. 5. 5. 5. 3. 4. 4. A2. A3. A11. A13. Lens. Zoom. Flas. Vide. Pictur. h. o. e. 1. 5. 5. 5. 5. 2. 5. 4. 4. 立Batter. Focu. 5. 5. 5. 5. 5. 5. 5. 5. 1. 2. 5. 4. 5. 3. 1. 5. 5. 5. 1. 1. 1. 5. 1. 4. 4. 5. 5. 5. 1. 5. 5. 1. 5. 5. 5. 5. 5. 5. 5. 5. 5. 1. 5. 1. 5. 5. 6. 5. 5. 5. 5. 5. 4. 5. 5. 5. 5. 7. 5. 5. 5. 5. 5. 4. 8. 1. 1. 5. n5 U e n g5 c h 1i 1. 1. 5. 2. 9. 5. 5. 5. 5. 5. 4. 3. 5. 5. 4. 10. 5. 5. 5. 5. 5. 1. 5. 3. 4. 4. io. n. al. C1h 1. 5. 4. er. ‧ 國. s. 學. y. ‧. e. t. Nat. LCD. Scor. y. Burs. sit. D9. A5. 5 治1 5 政 A6 A7 大A10 A8 5. iv. 4.3 至少考量數目決定 下面表 14 至表 19 為 Canon Powershot SX 三世代經過填值後的資料,負向 與正向情緒各列舉在不同表格。其中縱軸為使用面相區隔法定義之面相,三世代 面相皆相同,僅有 SX230 及 SX260 因增加 GPS 功能而新增 GPS 面相;橫軸為至少. 54.

數據

表 23 SX210 D5 迴歸分析  變數      係數  係數標準差  T  P  常量      1.1063  0.3128  3.54  0.001  A3    Zoom  0.28467  0.07091  4.01  &lt;0.000  A7  Focus  0.13637  0.0616  2.21  0.029  A10  Flash  0.16458  0.05067  3.25  0.001  A11  Video  0.04065  0.0612  0.66  0.508  A
表 24 SX230 D5 迴歸分析  變數      係數  係數標準差  T  P  常量      1.1063  0.3128  3.54  0.001  A3  Zoom  0.20395  0.09583  2.13  0.035  A5  Burst  0.04876  0.07663  0.64  0.525  A6  Battery  0.20248  0.04182  4.84  &lt;0.000  A10  Flash  0.01277  0.05384  0.24  0.813

參考文獻

相關文件

Reading Task 6: Genre Structure and Language Features. • Now let’s look at how language features (e.g. sentence patterns) are connected to the structure

Wang, Solving pseudomonotone variational inequalities and pseudocon- vex optimization problems using the projection neural network, IEEE Transactions on Neural Networks 17

Hope theory: A member of the positive psychology family. Lopez (Eds.), Handbook of positive

Define instead the imaginary.. potential, magnetic field, lattice…) Dirac-BdG Hamiltonian:. with small, and matrix

正向成就 (positive accomplishment) 正向目標 (意義) (positive purpose) 正向健康 (positive health).. Flourish: A visionary new understanding of happiness

Monopolies in synchronous distributed systems (Peleg 1998; Peleg

Corollary 13.3. For, if C is simple and lies in D, the function f is analytic at each point interior to and on C; so we apply the Cauchy-Goursat theorem directly. On the other hand,

Corollary 13.3. For, if C is simple and lies in D, the function f is analytic at each point interior to and on C; so we apply the Cauchy-Goursat theorem directly. On the other hand,