• 沒有找到結果。

第三章 大數據技術及各產業應用現況

第三節 趨勢及衍生議題

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

55

搜尋過去案例的集體資料,告知醫師未來如何診斷及治療,其 冠狀動脈繞道手術死亡率降至 1.5%(美國全國為 3%),肺炎死亡 率較全國平均低 40%,該院的治療處置是以數萬個分類,量化 並輸入電腦的案例所提供的資料,總的來說,其提高了 50 多個 臨床症狀的成功治療案例,佔該醫院病患過半數。

(3). 2010 年 Sequoia Capital 投資一家名為 AirStrip 的公司,它提供病 患的即時資料到醫師的 iPad、iPhone 等裝置,進一步的就是家 庭監控,應用程式不斷在你家裏或工作場所掃描你的生命徵象 以尋找問題的初兆到。

(4). 荷蘭飛利浦在 2011 年推出以不到 1 美元代價的 App,供人以手 機相機測量幾項生命徵象(呼吸頻率、血壓、體溫、血中含氧以 及腦震盪跡象),

(5). 23andMe及提供類似DNA詳細分析的公司,其演算法檢查各種 想都想不到的因素,產出從你的祖先到你的健康風險及醫療的 潛在反應,而只要 200 美元41

(6). 2011 年 9 月健康險巨擘 WellPoint 邀請 IBM 與哥倫比亞大學合 作的「華生醫生」(也就是在益智節目獲得勝利的 Watson 的另一 個版本),置於該公司醫師辦公室協助診斷,並提供寶貴的第二 意見,省錢是原來主要目的,但病患獲得了更快(有些原來要花 好幾天的診斷,華生只要幾秒的時間)及更正確的初期診斷好處

第三節 趨勢及衍生議題

大數據的影響不是只在矽谷,它正改變著我們的生活,本節姑且不以 大數據帶來的利益、衝擊及風險為為維度進行討論,概因於一個趨勢或現

41 改變 DNA 定序速度是在 2006 年由華爾街黑客 Nick Patterson 所撰寫的演算法所致。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

56

象涉及的當事人甚多,利益與風險因觀察面向或有差異,故本節嘗試以客 觀中立觀察大數據帶來的改變趨勢是什麼?又趨勢中所衍生待解決的議題 為何?

趨勢與現象 一、

資料價值鏈的改變

(一)

在大數據時代下,如前所述,資料之所以成為新價值來源,一大原因 在於所謂選項價值,也就是能夠做為新的用途,而在整個資料的價值鏈中,

就形成了以下三個重要的環節,而這也是大數據時代之前無法想像的。

1. 擁有資料或至少能夠存取使與資料的機構

大數據價值鏈的主要成分就是資訊本身,擁有資料者可能並非資料蒐 集者,但卻是可以自己使用資料,也可以授權給他人從中獲得價值的人,

所以大數據時代下,企業紛紛讓自己處於資訊流的中心,既能取得資料規 模,又從資料中得利,如 Visa 卡及萬事達卡,它們不只是簡單的付款作業,

而是跨足到資料蒐集領域,然後思考拿這些資料做什麼,如萬事達卡有能 力匯整分析來自 211 個國家,15 億人口的 650 億筆交易紀錄,希望能找出 商業及消費趨勢,然後該公司便能出售相關資訊,萬事達卡處於如此有利 的位置,其商業模式甚至可能放棄收取每筆交易的手續費,而成為出售分 析資訊的公司。

2. 資料科學家的技術

公司如果屬於大數據的持有人,就必須靠資料科學家從資料中提取價 值,這些資料科學家可能是個人或公司,其擁有相關專業知識或技術,能 夠進行複雜的分析,資料科學家必須在資料礦山中勞勞碌碌的地挖掘,但 挖出的鑽石還是得交給那些資料持有人。

3. 有大數據思維者

這些人的長處在於就算手邊沒有資料,或是沒有能夠處理資料的技術,

仍能夠早一步看到機會,他們看的是「可能性」,而不會受到「可行性」的

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

57

限制,如預測美國班機是否延誤的 FlightCaster.com,這是由一個 20 多歲的 年輕人分析過去十年每個航班與歷史及當下的天氣比對的預測網站,他利 用了這些公開資料提供了數百萬人渴望知道的答案,這就是具有大數據思 維的創業者。

但在大數據時代的啟蒙階段,最關鍵的價值還是在資料本身,也因此 在某種情形下,就會出現所謂「資料中介機構」(Data Intermediary),資料 持有人之所以願意讓中介機構介入,必然是有些價值必須透過中介機構才 能得以產生,如 Inrix 這家路況分析公司就是從各汽車製造商手中的資料進 行分析,當然資訊分享在過去形成網路的產業如保險業就有企業共享資訊 的先例,但這邊所述的不同處是,資料是以原物料的性質進入市場,資料 本身就是一種資產,而與之前想測量的目標不再有關,如路況資訊可以進 一步評估地方經濟的活絡程度,也可根據大型賣場附近的路況推測業績,

而在零售商公布季報之前,販賣資訊與投資基金公司決定買進或賣出。

相信在未來會有越來越多的企業發現其核心業務可從資料中學習而來,

這些獨立的資料中介機構也可能會轉移陣地,從其他地方冒出頭來 (Viktor

& Kenneth, 2013)

資料專家與傳統專家間的衝突更為劇烈

(二)

由於大數據浪潮的興起,提昇了數據分析的廣度與深度,加劇了直覺 與專業經驗敗給數據分析的情形,過去很多決策都是依據經驗與直覺的某 種組合,專家憑藉個人數十年嘗試犯錯的經驗而廣受推崇,現在一個又一 個領域中,「直覺主義者」與傳統專家都在與數據分析對抗著,如下數據分 析戰勝傳統專家的例子 (Ayres, 2008):

1. 經濟學家Orley Ashenfelter利用數據分析來評估波爾多葡萄酒的品質42

42 葡萄酒品質=12.145+0.00117*冬季雨量+0.0614*生長季平均溫度-0.0614*生長季平均溫 度-0.00386*收成季雨量 (Ayres, 2008)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

58

一舉擊敗Robert Parker一類葡萄酒專家採用的「含酒吐出」品酒法。

2. Bill James43利用數據分析打敗了傳統球探,造就了運動家隊的輝煌戰績,

乃影響波士頓紅襪隊轉向資料導向決策而取得第一次世界冠軍

3. 賓州大學法學教授 Ted Ruger 利用統計模型與傳統法律專家針對對 2002 年最高法院每位法官的投票行為所進行預測,以 75%的正確率擊 敗法律專家的 59.1%正確率。 (Theodore, Ruger W; Andrew, Martin D;

Pauline, Kim T; Kevin, Quinn M;, 2004)

4. Don Berwick於 2004 年起之「拯救十萬人活動」,利用實證醫學 44--也 就是醫生所選擇的治療方式應以最佳證據為基礎,而最佳證據應盡可 能來自統計研究—而在短短 18 個月內,計畫中的六項改革措施(均建築 於統計研究成果)估計減少死亡人數十二萬兩千三百四十二人,雖然這 個數據的來源因子不見得純然是這些措施所致,但不論怎麼看,都是 實證醫學的一大勝利。

人腦有很多認知上的缺陷與偏見,導致預測能力易遭扭曲,如高估「具 新聞性」的死亡機率(如謀殺),而低估一般致死因素的機率45,我們一旦形 成某種信念,通常便很難改變,人們總是自以為知道的比實際知道多,事 實上所進行的預測越複雜,偏頗與過度自信問題越嚴重,而數據分析不僅 能預測,還能告知預知的品質,這點與傳統專家大相逕庭,也因此越來越 多情下,人們建議傳統專家至少應該交出部分決策權,甚或是讓傳統專家 的技術知識(know-how)與數據分析協同合作,但遇有衝突時,最好還是交 給數據分析,也就是傳統專家的角色是輔佐數據分析而非主角。 (Ayres, 2008)

43 Michael Lewis 所著「魔球」(Moneyball)中所述其為棒球界主張資料導向決策的第一人

44 1992 年加拿大安大略省 McMaster University 的兩位教授 Gordon Guyatt 及 David Sackett 發表宣言呼籲醫界應採用「實證醫學」,希望統計證據能在醫學扮演更重要的角色。

45 平均來說,家中有槍枝又有游泳池時,游泳池的致死機率幾乎是槍枝的兩倍 (Steven, Levitt D; Stephen, Dubner J;, 2010)

像是亞馬遜(Amazon)、哈洛(Harrah's)、第一資本(Capital One)、波士 頓紅襪隊(Boston Red Sox)等。基本上,他們把公司轉變成分析型競爭者 而邁向勝利。 (Thomas, Competing on Analytics, 2009)

表 三-2 決策新境界

(Davenport, Make better decision, 2010)

當企業意識到資料分析的重要時,紛紛將公司轉型成分析型競爭公司 時,資料導向的決策將會取代過往的「金好膽(the Golden Gut)」決策方式,

因為這樣的決策方式生產力可以高出 6%以上。 (Mayer-Schonberger &

Cukier, 2013),而事實這樣的趨勢早已在公部門發酵。

目前美國的立法者越來越認定數據分析是檢驗政策是否可行的最佳方 式,因為採用數據分析無關黨派,而是以最中立的原則淘汰不當的政策,

不同於過去許多個案研究(Case Study)最後被束諸高閣,隨機實驗的政策較

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

60

有機會透過數據分析影響實際政策的推動,同時藉由小型的隨機前導研究 (Pilot Study),即可得知這項方案是否值得推廣,亦即是否應該將適用範圍 推至全國,目前已有三千多條州級法令明確規定政策的推動要進行數據分 析,如加長刑期對再犯率有何影響? 法官判刑傾向? 監獄究竟會讓犯罪者

「變本加厲」或「改邪歸正」?現在有許多國家運用隨機試驗來評估公共政 策的影響,例如在肯亞,以隨機試驗來證明除蟲方案,在印尼威脅進行期 前稽核(ex post auditing)可有效提升道路施工品質。

1. 美國「有教無類法案」(No Child Left Behind Act/NCLB)直接規範學校 的教學方法必須通過嚴謹的資料(有科學根據)分析始可獲得聯邦補助 2. 美國求職輔助計畫:於 1993 年由勞工部首席經濟學家凱茲(Larry Katz)

提 出 , 此 計 畫 與 過 往 計 畫 不 同 處 係 透 過 資 料 特 徵 分 析 (Statistical profiling)預測哪些人最不易自己找到工作,找到後即將合格者隨機分到 輔助組及控制組,以直接檢視輔助結果,也就是這項計畫結合了資料 導向決策中兩個主要工具-回歸分析與隨機試驗-以推行最佳的公共政 策,最後此專案證實了在條件相同情形下,交受輔導的勞工比未接受 輔導的勞工提早一周找到工作,政府每投資一元,就可以省下兩元。

3. 墨西哥總統塞狄洛(Paul Gertler)於 1997 年推動的「教育、健康與營養 計畫」(Progresa),該計畫是對窮人進行有條件的現金補助,也就是拿

3. 墨西哥總統塞狄洛(Paul Gertler)於 1997 年推動的「教育、健康與營養 計畫」(Progresa),該計畫是對窮人進行有條件的現金補助,也就是拿