第二章 文獻探討
第五節 網路聲量
網路聲量的研究已漸漸成為閱聽人行為研究的主流。網路聲量的組成是由 大數據(Big data)與網路口碑。利用語意分析的技術,將所有得到的大數據(Big data)與網路口碑都資料量化,且交叉分析,得出一份精準且具有意義的資料。
在不同時間點、不同資料來源,收尋出最關鍵且最熱門的網路文章,運用「語 意情緒判斷」技術,讓每一項字詞或整段文字都有情緒分數,接著利用聲量分 析、來源分析、情緒分析,彙整出有用數據,內容有包含口碑量統計及標題數、
回應數、平均回應數與品牌的交叉分析。最後,由網友實際的網路行為進行大 數據(Big Data)技術及雲端語意分析技術,結合分析量化網路社群口碑影響力的 數據所產生的調查報告(Daily View 網路溫度計;Buzz 網路口碑研究中心,
2014)。
從個人電腦發明、網際網路到雲端,電腦科技和人們的關係愈來愈緊密,
每隔三、五年就會出現新概念。2012 年開始,「網路大數據」,也就是「Big Data」
正成為這個備受矚目的新概念、新機會。Big Data,台灣翻譯為海量資料或巨量 資料,大陸翻譯為大數據,在 2011 年正式被命名,2012 年被稱為全球「Big Data 元年」。研究機構 IDC 則預測,台灣的 Big Data 將在 2013 年全面引爆。 主要是 隨著社群媒體、手機、監視器、天文望遠鏡到衛星、生產線和各種感測器等的
據 IDC 的估測,全世界資料以每年 50%的速度增長,換而言之,也就是每兩年 就增長一倍。而且,90%是近兩年才出現的。其重要性不在於數據資料有多少,
而是人們如何應用軟硬體,從各種數據中找出線索、趨勢,以及商機。更令人 期待的是,只要資料夠多,海量資料不只能提供「後見之明」, 甚至可以預測 大自然的變化、人們的購物行為(邱莉燕、鄭婷方,2013)。紐約時報記者 Charles Duhigg(2012) 報導了一則新聞《How Companies Learn Your Secrets》,內容是這 樣的:一名高中女生收到了 Target(類似美國的大潤發)所寄給她的折價卷跟 DM,廣告主打孕婦裝及各式嬰兒用品,這名少女的父親看到後十分生氣,認為 Target 這些廣告是在鼓勵未成年少女懷孕,便氣沖沖地去找 Target 經理理論,
經理當下也只能道歉了事,而且在幾天後再度打電話拜訪說明,沒想到這名父 親反而在電話中羞愧的向經理道歉,道歉的原因是,原來他女兒已經懷孕了,
預產期在 8 月。
絕大部份機構跟公司都將大數據的特性歸類為「3Vs」或「4Vs」,資料量 Volume、資料傳輸速 Velocity、資料類型 Variety,以及後來提出的第四個 V「真 實性 Veracity」。本研究整理了 4Vs 簡單的定義跟解釋。大數據的 3Vs 定義是 目前為止最受推崇且最廣為人知的說法。3Vs 由 Gartner 的分析師 Doug Laney 最早在 2001 年時提出「3D Data Management: Controlling Data Volume, Velocity, and Variety.」,並在 2012 年 又再重新定義大數據:「Big data is high volume, high velocity, and/or high variety information assets that require new forms of processing to enable enhanced decision making, insight discovery and process optimization.」, 從那之後,便有人在 3Vs 之外陸續提出更多「V」, Veracity、Validity、 Value、
Visibility 等 , 其 中 又 以 Veracity( 真 實 性 ) 最 被 普 遍 認 同 , 然 而 形 成 新 的 4Vs(Inside 硬塞的網路趨勢觀察,2015),如圖 11。
(一)資料量(Volume):Data volume: amount of data.
由機器、網路、人與人之間的社群互動來生成。正在點擊的滑鼠、通訊來電、
簡訊、網路引擎的搜尋、線上交易等等,都正在生成累積成龐大的數據,因此 資料量很容易就能達到數 TB(Terabyte,兆位元組),更可能上看至 PB(Petabyte,
千兆位元組)或 EB(Exabyte,百萬兆位元組)的等級。
(二)資料傳輸速(Velocity):Data velocity: speed of data in and out.
資料的傳輸流動(data streaming)是快速且連續的,隨著越來越多的機器、網 際網路使用者,社群交友網站、搜尋引擎的結果每秒都在成長,每天都在輸出 更多的內容。許多資料要能即時得到結果才能發揮最大的價值。所以也有人會 將 Velocity 認為是「時效性」。
(三)資料類型(Variety): Data variety: range of data types and sources
大數據的來源種類非常繁雜且多樣化,如果一定要把資料分類的話,最簡 單的方法是分兩類,結構化與非結構化。早期的非結構化資料主要是文字,隨 著網路的發展,又擴展到電子郵件、網頁、社交媒體、視訊,音樂、圖片等等,
這些非結構化的資料造成儲存(storage)、探勘(mining)、分析(analyzing)上的困 難。
(四)真實性(Veracity): Data veracity: uncertainty of data
大數據分析中應該要對真實性這點做考慮,分析並過濾資料有偏差、偽造、
異常的部分,防止這些「dirty data」損害到資料系統的完整跟正確性,進而影 響決策。
圖 11:大數據來源
資料來源:Inside 硬塞的網路趨勢觀察
隨著近年來網際網路的蓬勃發展,閱聽人可以透過瀏覽網頁的動作,來收 集其他閱聽人所提供的產品資訊與主題討論,並賦予顧客能力來針對特定主題 進行自身經驗、意見與相關知識的分享,因而形成所謂的網路口碑 (Online Word-of-Mouth),亦稱電子口碑(Electronic Word-of-Mouth)、鼠碑(Word-of-Mouse)。
從鎖定的來源網站蒐集到的文章中,網友提及企業、品牌、產品或服務有關之 關鍵字,系統即自動計算為一個口碑。特性關鍵字是指網友使用的文字,和企 業、品牌和產品服務直接間接有關的內容。透過特性關鍵字可以了解網友對品 牌、產品服務的認知、態度和行動傾向。大多數的資料可以透過網際網路的搜 尋,但卻存在與多對於產品品質的不確定因素,某些產品屬性可以輕易且正確 地在網頁上加以描述,例如價格、成份、有效日期等,但某些產品屬性卻必須 購買並使用後才能了解,例如品質、喜好、感覺,使產品特性中保留了一部分 的不確定性。對於不確定性的降低,消費者通常依賴人際來源的口碑,尤其當 消費者有高知覺風險時更是如此(李文伶,2003;陳書林,2006)。鄭凱元 (2006) 檢驗大眾推廣及網路媒介工具,研究消費者網路活動的報導與當今網路企業的
(1)自發性 (spontaneous):由消費者使用本身方法和知識而創立和實行,例 如利用電子郵件寄發正面訊息。
(2)半自發性 (quasi-spontaneous):由消費者創立實行,但網路環境由企業所 創立,例如電子佈告欄的討論區發佈正面訊息。
(3)獨立或第三團體 (independent-or third party-sponsored):由消費者創立實 行,但網路環境由特定興趣團體、專業協會和除了銷售目的外的組織創立。例 如學校所設立的 BBS「電子佈告欄系統」 提供消費者發表正面言論。
(4)公司發起 (corporate-sponsored):由企業創立,但由受僱用和激勵的消費 者所實行,並且以公司產品和服務銷售為目的而散播說辭。例如公司雇用消費 者去監視聊天室的活動並參與討論,以確保其他消費者聽到他們的產品一致性 好的訊息,亦或在使用者團體中,發表產品正面建議、觀點和評價,以影響其 他消費者。
不只提供潛在顧客更多元的搜尋管道,相較於市場調查或郵寄問卷,企業 更能發覺顧客對於產品的潛在需求與想法。在網路的虛擬空間裡,提供意見的 人基本上是匿名的,在不需要顧及任何利害關係下,不管是正面或負面評論都 容易透過資訊傳播者主動提供真實的意見與第一手經驗的分享(陳書林,2006;
王沈銘,2007)。過去許多研究發現,人際來源資訊在影響產品選擇、新產品資 訊的擴散都是扮演不可或缺的角色。另外,實證發現,透過人際間的互動,顧 客自動與他人分享其消費經驗,成為產品的免費代言人,這種訊息被消費者認 為是更具可信度的或是最重要的資訊來源,擁有較其他訊息更強的說服力,尤 其是當消費者擁有較高的知覺風險時,更能使得口碑說服的效果更加的顯著。
(林彥平,2005)
從很早開始,口碑行銷就一直存在著,而對企業來說,口碑行銷的核心目 標永遠只有一個「Influencing Influencers」(影響具有影響力者),然而在沒有網 路時代與進入網路時代的影響力者截然不同,如下圖 12 所示:
圖 12:有無網路的口碑對照 資料來源:本研究整理
網路口碑分析權威意藍資訊《OpView 社群口碑資料庫》公布了國內首份「年 度百大網路熱議排行榜」,可以掌握 2014 年網路上最熱門的議題,分析消費趨 勢與未來商機。它是以社群大數據的分析技術,觀測全年度超過 2 億則的發言 討論,範圍涵蓋台灣流量 9 成以上的社群、討論區、部落格、BBS、粉絲團等,
取出內容中網友關注的熱門關鍵字,統計前 100 名的熱議話題,歸類成「生活 商機」、「話題事件」、「潮流現象」三大類,從不同角度分析去年整體趨勢。
因此,本研究提出了「網路聲量」的構面,來更有效解釋且符合現今網路 的發達現況。另外也整理出網路聲量的來源如下:
(1)新聞: 中央通訊社、中時電子報、Nownews、台灣新浪網、Yahoo!奇摩、
MSN、PCHOME、TVBS、自由時報、公視新聞網、蘋果日報等等。
(2)專欄:蘋果日報、財經日報、中時電子報、 Pchome 基金、全球房地產資 訊網、企業 IT 新聞、鉅亨基金網聯合新聞網等等。
(3) 社群網站:Yahoo!奇摩知識+、 IT 邦幫忙 、Facebook、YouTube 等等。
(4)論壇:Mobile 01 、 U-CAR 、手機王、 ePrice 比價王、 BabyHome 、 Fashionguide、卡提諾王國、伊莉討論區、捷克論壇、壹頻果車王、背包客棧、
台灣論壇、小老婆俱樂部、 UrCosme、 PTT、巴哈姆特等等。
(5)部落格:無名小站、痞客邦、新浪部落格、樂多日誌、優仕網部落格、Yam 天空部落、 Xuite 日誌、 Blogger Bloguide 部落格等等。
(6)社群網站
口碑量也就是品牌的網路聲量,數值越高表示越多人討論,或是曝光程度 很高。根據排行則可以看出各家品牌在網路上的討論程度或曝光程度的高低。