• 沒有找到結果。

各產業導入趨勢與應用狀況

第三章 大數據技術及各產業應用現況

第二節 各產業導入趨勢與應用狀況

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

44

(6). 以伺服器設備的型態所提供的解決方案 (7). 對於 Hadoop 的支援

像這樣的分析資料庫主要是因應大數據「量」的特性所設計,並透過 Hadoop 的支援,更強化了因應「多樣性」(非結構化資料)的處理。

串流資料(即時資料)處理 四、

大數據特性中最常談到的 3V 中,在「大量」(Volumn),「多樣性」(Variety) 二個層面雖然能透過 Hadoop、NoSQL 資料庫與分析資料庫等來獲得解決,

但另一個 V,也就是「速度」(Velocity)層面,大數據發生的頻率、更新頻 率之快,難以利用上述技術克服,對此,我們需要的是能夠即時處理源源 不絕產生之大量資料(串流資料)的串流資料處理技術。

串流資料處理技術又稱為即時資料處理技術、事件流(event stream)處理 技術或複合事件處理(CEP,Complex Event Processing),是完全迥異於關聯 式資料庫的資料處理技術39,這樣的技術並非特別新穎的技術,過去在金融 領域上相當倚重(如股票交易),現在才開始在金融領域外開始運用(如即時 交通路況監控、製造業的生產執行系統、零售業POS資料即時蒐集與分析、

電子商務網站上點擊串流資料之產品推薦等)。

第二節 各產業導入趨勢與應用狀況

各產業導入趨勢 一、

投資大數據的企業營收比那些沒有投資大數據的企業高出 12%,並且 這些企業大多認為這是大數據的功勞。而且較具有創新精神的企業,更樂 於擁抱新技術,創新企業的技術人員和資訊人員比其他企業更願意採用大

39 關聯式資料庫與資料串流技術最大差異是資料輸入後前者要寫入資料庫,後者則是放在 記憶體上處理,因此可以做到高速處理,從輸入到結果輸出間的延遲(Diff)可控制在百萬 分之一秒的水準,實現平均每秒十萬筆資料到百萬筆資料的超高速資料處裡。 [城田, 2012]

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

45

數據和行動裝置,而且嘗試的速度也比一般企業更快。 (Wagner, Foo, Zablit,

& Taylor, 2014)

雖然某些產業(如自然資源和建築)今日產生相對較少的數據,但大 數據具有橫跨各類經濟模式的潛力。一個產業的所有權形式、可用性 (availability)及競爭壓力(competitive pressures) 對大數據的採用率影響甚鉅,

因此,政策需求變化才能捕捉大數據的潛在經濟價值(如圖 三-2)。

在競爭力和面向消費者的行業,大數據是獲得市場份額和提高盈利能 力的工具,而且似乎也沒有政策干預的必要。利用大數據的第一線公司通 常在是很容易產生數據的產業,他們擁有或能夠獲得很多的資料(無論是 通過個人交易或市場購得)。對於競爭激烈的,面向消費者的行業,利用數 據獲得洞察力已成為當務之急。如零售業、金融服務業、資訊服務業(例 如,媒體和資料處理)及製造業,這些對 GDP 最大貢獻者之一。

在這些領域在利用大數據分析的一線公司,仍有相當大進步的空間。

競爭態勢將推動公司走向更廣泛,更複雜地使用大數據,即便沒有任何新 的激勵機制和政策的變化。

公共和準公共部門在缺乏競爭動態或數據分享的障礙下,沒有額外的 獎勵或行動促進下,是不太可能採用大數據的。公共部門產生了大量的數 據和一些由政府監管的範疇,它可以利用和共享,甚至更多。這些資料可 能來自與公民交易的過程中(如允許或醫療保險理賠),或由環境本身產生

(如交通信號燈,公共交通,停車,和警察部署)。但是政府僱員可能缺乏 培訓、工具,或者被鼓勵共享和利用數據。這些都需要共同努力,利用大 數據來改善政府服務。使得提供給私營部門的公共部門的數據可能還較具 有顯著的經濟影響。

同樣地,準公共部門(如衛生保健和教育)可以通過使用大數據分析創造 巨大的經濟效益和社會效益,但在許多情況下,因為利益相關者的利益不 對稱(例如,付款人和供應商或競爭的供應商),這樣的價值並未被獲取。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

46

因此必須從根本上從這些機構上重新設計其誘因機制始可以充分利用大的 數據的潛力。 (McKinsey Global Institute, Game changers: Five opportunities for US growth and renewal, 2013)

圖 三-2 美國各產業採用大數據潛在可獲得的產值

(McKinsey Global Institute, Game changers: Five opportunities for US growth and renewal, 2013)

國際研究暨顧問機構 Gartner 於 2014 年 6 月針對全球 Gartner Research Circle 的 302 位會員進行了這項調查,目的在探究企業的大數據投資計劃、

採用階段、解決的商業問題,以及資料、技術與挑戰,並且與前一年的結 果做比較,調查發現企業大數據技術方面的投資不斷增加,73%受訪企業 表示已投資、計劃在未來 24 個月內投資大數據技術,比 2013 年 64%更高。

該調查也顯示,企業紛紛開始決定投入大數據,而回答沒有打算投資巨量 資料的企業從 2013 年的 31%下降到 2014 年的 24%(如圖 三-3)。大數據投 資依然是北美領先,有 47%的企業表示已投資,較 2013 年 37.8%更高,而 所有其他地區的投資在過去 1 年也都有所成長(如圖 三-4)。 (Heudecker &

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

47

Kart, 2014)

圖 三-3 大數據投資繼續上升 (Heudecker & Kart, 2014)

圖 三-4 各地區大數據投資趨勢 (Heudecker & Kart, 2014)

大數據能協助許多產業解決各式各樣的商業問題,而連續 3 年研究當 中,提升客戶體驗與改進流程效率一直是企業試圖解決的最熱門領域,變 化最大是提升客戶體驗(如圖 三-5),尤其在交通運輸、醫療、保險、媒體 與通訊、零售及銀行等產業。另一個出現成長的領域是運用大數據來開發

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

48

資訊產品,也就是企業希望利用資料賺錢,尤其是 IT 廠商、政府和製造業。

而且也持續看到所有垂直產業在這方面大量投資或已計劃投資,其中,通訊和 媒體產業仍然領先其他產業,有 53%的受訪企業表示已投資,另有 33%計劃 投資大數據技術。

圖 三-5 大數據的業務問題按優先級

(問項為請在您的組織中的優先級來解決方面排名這些業務問題。)

先進保險公司(Progressive Corporation)提供依簽約車主的駕駛習慣,能享有 保險費折扣的「付你駕」(Pay as You Drive)保險方案,這是一種依據行車習 慣決定實際保險費的方案,是相當「個人優化」,但並非即時執行。

2. 個別優化並以即時資料處理模式

行為定位廣告、配合其行為特性發送優惠卷、即時商品精準推薦等即 是此模式,如:美國特殊保險公司安信龍解決方案公司(Assurant Solutions)

40 此處分析的方式即係指第二章第二節中所述之方式

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

50

成功開發出一套機制,將每位顧客及客服中心的客服人員定義出親和分數,

每當客戶打電話進來時,即時將客戶轉給個性應對最適合的客服人員,而 該公司因此系統,營收在六年內增加了 190%,顧客解約防止率增加 117%,

而客服人員的離職率也減少 25%。

3. 全體優化並以批次資料處理型模式

提高搜索引擎或翻譯軟體的準確度、藉由 Twitter 的推文預測股價走勢、

提高網站的優越性等即是此種模式 4. 全體優化並以即時資料處理模式

運用安裝在行車記錄器進行路況預測、以智慧電表預測電力等即是此 種模式

各產業成功案例 (Steiner, 2014) (另參閱附錄 B)

(二)

1. 預測案例

(1). 2004 年颶風尚未侵襲佛州,沃爾瑪已經開始迅速將草莓夾心餅 (Pop-Tart)往颶風行經方向的商店送,因為大數據分析的結果顯 示那些過去已受侵襲災區的銷售情形,預知人們渴望夾心餅的 油膩安慰。

(2). Harrah’s Casino 擅於預測顧客能夠忍受輸掉多少錢,仍一再回來 消費,他們稱這個數字為「痛苦臨界點」,當系統預測到某為顧 客今晚的痛苦臨界值是 900 美元,當資料顯示其快輸到 900 元 時,便會有一位幸運大使驅前引導其離開機子。

(3). Inrixe 公司的 Dust Network 分析 50 萬商用車輛的速度以預測塞 車情形,它結合了交通流量、天氣、事故乃至學校上下學或演 唱會結束時間等資訊,即時提供從甲地到乙地最快捷的路徑。

(4). Epagogix 電影公司開拍電影前分析腳本的演算法,特別是大預 算的電影,2004 年針對未上市之 9 部電影進襲票房預測,9 部

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

51

電影中 6 部預測精準。

(5). Polyphonic HMI 旗下網站,該網站的演算法能分析上傳的任何 音樂檔,有潛力的歌曲就會贏得高分,相反的就得低分,該演 算法利用先進光譜去迴旋(Advanced spectral deconvolution),用 不同順序的傅立葉轉換(Fourier transforms)及數學函數,將歌曲 拆解成碎片,將曲調的旋律、節拍、音韻、音階及音的進行、

聲音飽和度、聲音亮度及抑揚頓挫等模式孤立出來,利用這些 資料構成三度空間模型,演算法經由檢視歌曲的 3D 結構而不是 聽歌曲本身,再以過去的冠軍歌曲一併疊放,受歡迎的歌曲往 往具備類似的基本架構,只要接近這群歌曲的中央,就算不保 證成功也八九不離十。該網站主持人 Mike McCready 2008 年自 行創業,開立 Music X-Ray,讓有心成名的音樂作者上傳並評分,

除了資料庫已成了世界音樂人的百科全書外,自 2010 年以來,

已經超過 5000 個成為藝人的機會轉給音樂品牌等商業機構,到 2011 年底,有 1500 多家唱片業者和專業的音樂取得者使用他的 演算法(如哥倫比亞、時代華納、EMI 等)。

(6). 2007 年洛杉磯國際機場使用了南加大電 腦 科學教授 Milind Tambe 利用演算法創造出最適合破解恐怖主義陰謀的高效率隨 機維安巡邏模式,這個演算法能檢查出恐怖分子認為那些計畫 最能透過在機場的死亡、破壞及混亂帶來損失,接著根據他預 期恐怖分子在想什麼,而做出阻擾攻擊的決定,之後因為績效 卓著,推廣至全美運輸安全管理局(TSA)用來規劃巡邏事宜及空 軍在飛機的配置與炸彈偵測犬巡邏次數。

(7). 紐約大學政治學教授 Bruce Bueno de Mesquita 運用賽局理論為 樣板,創造預測事件的演算法,中情局聘請他做了 1700 多個政 治和軍事預測,範圍擴及全球與各個地理政治狀況,其正確次

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

52

數為中情局分析師的 2 倍,2009 年,該演算法預測伊朗於 2014 年將發展出武器級的鈾,也預測出伊朗不會用那些鈾來製作炸 彈,反而會讓他的核子計畫保持用在民生用途上,以上結論目 前來看是正確的,2010 年 5 月 5 日該演算法也預測埃及總統穆

數為中情局分析師的 2 倍,2009 年,該演算法預測伊朗於 2014 年將發展出武器級的鈾,也預測出伊朗不會用那些鈾來製作炸 彈,反而會讓他的核子計畫保持用在民生用途上,以上結論目 前來看是正確的,2010 年 5 月 5 日該演算法也預測埃及總統穆