• 沒有找到結果。

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

26

他部會則尚未完成相關作業。99

政府另針對敏感性資料之應用研究,推動政學合作方案。國家發展委員會協 助發掘部會應用主題,盤點各部會欲解決之業務議題,交由科技部徵集學研計畫 解決,學研所需研究經費由科技部支持。100並以學術與研究領域為資料釋出對象,

共計徵集三類議題進行試行研究,包含:「社會安全」、「經濟發展」、「環境永續」, 而下屬的相關主題則如:健康照護、治安維護、矯正教化、毒藥品防制、居住正 義、原住民生活發展、穩定物價、提升薪資、穩健財政收支、賦稅合理、自然環 境保護及災害預警等。101除開放資料政策以外,行政院成立的「大數據技術指導 小組」即為主要的巨量資料主導單位,其整合科技部、國發會、經濟部,主要任 務為針對行政院行政院重大施政議題進行巨量資料分析。102

然此一推動國家巨量資料政策的單位僅為政務編組,自 2016 年 5 月後由新 設置之另一任務單位「資料應用推動指導小組」接續大數據技術指導小組的功能。

103至於基礎環境建設方面,則推動公務機關符合去識別化相關驗證標準,及由國 研院高速網路與計算機中心建置「大資料分析平台 Braavos」:提供巨量資料共用 設施、雲端服務平臺、分析應用服務,以具技術支援之雲端服務模式,協助產官 學研各界之巨量資料硬體需求。104

第二節 巨量資料的商業應用

Netflix(網飛)是一間提供網路隨選串流影片平台的公司,與傳統 DVD 出 租店不同的地方在於,消費者以月費會員制的訂閱模式,可無限觀賞 Netflix 串 流平台上的影片。而 Netflix 在推出月費訂閱的商業模式以前,是提供實體 DVD

99 鐘嘉德、柴惠珍、高崎均、曹元良,我國大數據政策推動現況,國土及公共治理季刊,第 3

卷 4 期,頁 77-79,2015 年 12 月。

100 同前註,頁 80-81。

101 同前註,頁 81。

102 同前註,頁 81-84。

103 劉宗熹,同上註 96,頁 5。

104 鐘嘉德等,同上註 99,頁 84。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

27

租借的服務,至 2013 年為止,Netflix 共累積 3300 萬名訂閱者,並且提供數十萬 部影片供消費者觀賞,也因此累積大量的消費者的使用數據。1052013 年,Netflix 推出大獲好評的影集 House of Cards(紙牌屋),該劇第一季獲得四項艾美獎與金 球獎提名,是第一部獲得艾美獎提名的網路影集。

House of Cards 的成功並非偶然,事實上,該劇的製作過程,即是巨量資料 作為成功的商業應用的典範之一。Netflix 透過其訂閱者的資料進行分析,發現大 部分觀賞英國 BBC 頻道製作的 House of Cards 原作的訂閱者,同時也觀賞了美 國演員 Kevin Spacey 主演的電影以及美國導演 David Fincher 所執導的電影。106因 此,當 Netflix 決定買下 House of Cards 版權並拍攝美國版時,即選擇 David Fincher 作為導演,而 Kevin Spacey 則擔任該劇男主角。這種倚賴巨量資料的數據分析結 果作為影集導演、演員乃至於故事內容的選擇方法,與好萊塢過去一般的電影、

影集製作與選角的邏輯大為不同,然而 Netflix 藉由其大量訂閱者所產生的數據 累積而成的巨量資料,從中分析特定觀賞族群的觀賞偏好,而獲得巨大的成功。

如同前文所提的「相關性」與「因果關係」,Netflix 不需要知道為什麼喜歡 看 David Fincher 電影的人也喜歡觀賞 Kevin Spacey 主演的電影,而且這一類觀 影族群還同時熱愛英國 BBC 影集 House of Cards。Netflix 毋須找出這其中的因 素,它只需要精準掌握特定觀影族群對於導演、演員、故事風格的喜好。Netflix 另外也發現,用戶的「想看電影清單」與用戶「會員合約期間」呈現正相關,雖 然 Netflix 不清楚「想看電影清單」的具體數字為何,但 Netflix 透過數據了解到 若用戶在「想看電影清單」登錄了一定數量的影片,其長期續約的可能性也越高,

因此 Netflix 在用戶加入會員後,便設計出會大力推薦用戶追加影片至「想看電 影清單」的服務,並且反覆測試,監控用戶是否按照 Netflix 的意圖行動。107

105 David Carr 著,陶夢縈、陳柳譯,大數據在手,沒人比 Netflix 更了解觀眾,紐約時報中文 網,2013 年 3 月 1 日,https://cn.nytimes.com/business/20130301/c01carr/zh-hant/.

106 Andrew Leonard, How Netflix Is Turning Viewers into Puppets, SALON,

http://www.salon.com/2013/02/01/how_netflix_is_turning_viewers_into_puppets/.

107 城田真琴,同上註 58,頁 107。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

28

另外,將巨量資料技術進行商業應用的先行者 LinkedIn,該公司於 2006 年 時即已累積 800 萬名用戶,並且用戶數目持續成長中,然而,LinkedIn 當時面臨 的瓶頸是新加入用戶並不那麼積極在網站上尋找可能認識或可能產生連結的已 加入用戶,108作為一個商務人士/專業人士的社群網站,LinkedIn 認為,若用戶 無法從他們的網站找到連結(connection),便會像「抵達一場會議宴會並發現你 不認識任何人,你只能窩在角落喝飲料,那麼你可能就會離開」,109因此,LinkedIn 必須想出對策。他們首先從用戶的個人檔案所揭露的資訊下手,若用戶的個人檔 案顯示相同的學校或公司,那麼他們可能互相認識。Linked 便分析其 800 萬名用 戶的個人檔案,並且推出「你可能認識的人」(People you may know)的點擊服 務,將演算法所篩選出的三個用戶最有可能認識的人放置於以往他們用來放置廣 告的最熱門位置。110服務推出後,用戶的點擊率(click-through rate)呈現顯著性 的成長,之後,LinkedIn 再將其「三角閉合」(triangle closing)理論整合至「你 可能認識的人」的服務,所謂三角閉合理論即指:「假如你認識 A 和 B,則 A 和 B 有很高的機率也互相認識」,LinkedIn 整合此服務後,「你可能認識的人」的用 戶點擊率超過其他點擊服務的點擊率 30%,產生了數百萬計的點擊率。111對於社 群媒體公司而言,用戶是否得以建立聯繫(connection)與網絡(network)是該 社群網路服務是否能生存的最重要因素。無獨有偶,全球規模最大的社群媒體 Facebook 透過對於用戶的追蹤與分析,亦發現只要用戶能在一定期間內找到一 定人數以上的朋友,該用戶便會長期使用 Facebook,因此 Facebook 便設計特定 服務,使得用戶得在加入 Facebook 後盡快找出一定人數以上的用戶。112

除社群媒體運用巨量資料技術改善自身服務以外以外,巨量資料的應用還可 能替商業組織開創新型態的服務,如每月掌握 900 億筆搜尋紀錄及大量雙語/多 語文字內容的 Google,使其可能成為最懂得人類如何使用語言的專家,Google 的

108 Davenport & Patil, supra note 65.

109 Id.

110 Id.

111 Id.

112 城田真琴,同上註 58,頁 106-107。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

29

自動拼字檢查功能,每當使用者欲搜尋某字,卻輸入錯誤,則 Google 便會出現

「您是不是要查……」的提醒,113並預先將修正後的搜尋結果列出,該預測根據 的即是使用者在輸入錯誤關鍵字「之後再次輸入的正確關鍵字」的統計結果。114 而 Google 翻譯技術,目前可提供翻譯的語言已達 103 種,並且每天翻譯超過 1400 億字數,1152012 年時 Google 翻譯還只提供 60 種語言翻譯,116究其翻譯技術的突 破與精進,最主要仰賴的是 Google 對大量數位化文本、文字、雙語文件的儲存 與分析,這是語言學家所無法企及的儲存與分析能力,此種非以語言規則、而以 語言資料為主的根本方法與知識論差異,已使 Google 發展成為「自然語言處理」

(natural language processing, NLP)技術的領先者,最重要的原因,並非其發展 出更為聰明的演算法,而是其掌握源源不絕輸入的語言巨量資料所形成的全球語 料庫。117

另一個成功運用巨量資料的網路公司即為拍賣網站經營者 eBay,曾經 eBay 只儲存用戶在其網站活動時所產生的 1%資料,多半為結構化資料,例如消費紀 錄或商品銷售資料,118而隨著用戶數與交易數量的增長,eBay 網站每天產生約 50TB 的資料,eBay 後決定 100%儲存用戶的資料,尤其重要的資料如用戶的使 用紀錄(access log),使用紀錄不僅包含其消費紀錄等結構化資料,其中亦包含 如「只瀏覽產品但沒有購買」、「幾乎就要下標,結果仍然放棄」等非結構化資料,

119透過這類型資料的儲存及分析,大幅提升 eBay 在行銷、顧客忠誠度、財務、客 戶服務、使用者經驗的改善效率,其關鍵仍然在於巨量資料的應用。

網路公司或新創公司透過巨量資料,開發新市場或新服務,而許多已站穩市

113 Mayer-Schönberger & Cukier 著,同上註 37,頁 157。

114 城田真琴,同上註 58,頁 108。相信許多人都有與筆者相同的經驗,對於較為複雜的字彙,

許多時候僅憑約略印象拼出字母,而非正確字母,然後直接仰賴 Google 的拼字檢查程式校正。

115 Mike Schuster & Melvin Johnson & Nikhil Thorat, Zero-Shot Translation with Google’s Multilingual Neural Machine Translation System, GOOGLE RESEARCH BLOG,

https://research.googleblog.com/2016/11/zero-shot-translation-with-googles.html.

https://research.googleblog.com/2016/11/zero-shot-translation-with-googles.html

116 Mayer-Schönberger & Cukier 著,同上註 37,頁 57。

117 同前註,頁 58。

118 城田真琴,同上註 58,頁 111-112。

119 同前註,頁 111。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

30

場腳步的大型公司,也開始透過巨量資料的商業應用,創造傳統商業領域的新興 商業模式。如美國最大零售商 Walmart 很早即開始記錄所有產品的資料,如銷售 率、銷售量、存貨量,並且「即時」(real time)提供給供應商,並且,透過記錄 顧客的購買紀錄、消費總額、消費時間、消費時的天氣,120決定其在特定時間於 坪效比較高的貨架擺放特定的商品。可見,巨量資料應用亦衝擊傳統供應鏈管理

(supply chain management, SCM)的知識,資料科學(data science)、預測分析

(predictive analytics),在物流(logistics)及供應鏈管理(SCM)領域已開始發 揮影響力。121而日本的建築機械製造商小松(KOMATSU),則是透過在其銷售至 全球各地的建築機械加裝 GPS 與各種感測器,蒐集機械的所在位置、運轉時間、

狀況、燃料殘留量、耗材更換時期等原始資料(raw data),對於這些原始資料的 分析,小松可透過比較不同客戶的燃料使用量差異,給予客戶使用建議;亦可透 過售出機械的運轉狀況,預測不同區域對於機械需求的動向,藉此評估其生產線 的運作。122

巨量資料同時也影響金融業的發展,改變傳統金融業者的經營思維。以保險

巨量資料同時也影響金融業的發展,改變傳統金融業者的經營思維。以保險