第一章 緒論
第五節 研究範圍與研究流程
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
10
資料科學家
資料科學家(Data Scientist)被喻為 21 世紀最性感的工作,可以說是駭客技術 者、分析者、溝通者和值得信賴的顧問等集結於一身的專家,主要是從資料中辨 識資料並且將這些資料與可能不完整的資料進行整合並且清理資料,透過將快速 產生的資料不斷的創新和變化,資料科學家幫助決策者持續的與資料進行連結,
也因此資料科學家除了最基本的編寫程式語言能力外,其中最主要的特徵就是擁 有強烈的好奇心能夠在問題的表面下找到問題的核心,並且將其轉化成一套很明 確且可測試的假設,也就是說資料科學家想要建構出一些有效的解決方案,而非 只是提供決策者一些建議(Davenport, T. H., & Patil, D. J., 2012)。為了能夠提出有 效的解決方案,資料科學家需要擁有業務分析、產業顧問、溝通協調以及資料科 學專業的知識和技能,在面對巨量資料時能夠從資料中擷取或分析到具有價值的 資料,並且透過易懂的方式將資料分析結果呈現給不懂資料的人,找出問題解答 或是提供新的方向(吳千卉、吳宗霖,2015:11)。
第五節 研究範圍與研究流程
研究範圍
巨量資料可以依據資料所產生的來源區分成外部和內部巨量資料,內部巨量 資料係指透過政府或組織內部設置的系統或設備所產生的數位資料,而外部巨量 資料則不是從政府或組織內部設置的系統或設備所產生的與公共管理相關的數 位資料(蕭乃沂等人,2015)。而隨著網路的普及與儲存設備的價格大幅降低,
民眾對於網路使用度及可近性越來越高,且越來越多民眾願意將自己的意見與想 法分享至社群媒體(如:Facebook、Twitter…等等)中,也因此網路上的輿論逐 漸受到政府或是企業所重視(Zhang & Zhang, 2013;呂建億,2015),網路輿情 分析(Internet public opinions)即為外部巨量資料分析的一種,公部門或是私部
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
11
門期望能透過網路上的輿論進行蒐集與分析來改善公共政策或是提升企業的利 潤等。不管是公部門或是私部門都期望藉由從內部自身的系統或設備中所產生的 巨量資料或是由網路上蒐集到民意的外部巨量資料進行分析,都能夠為政府或組 織帶來更大的價值。而對於政府來說不管是外部網路民意而產生的網路輿情,亦 或是政府本身內部擁有的龐大資料,如善用這些巨量資料的價值,必能使政府在 施政上或擬訂政策上提升效能、改善其品質。但網路輿情分析與內部巨量資料分 析所需的分析的流程或是取得的來源也會有所差異,因此本研究主要是以網路輿 情及內部巨量資料做為巨量資料分析的範圍。
此外,本研究主要的研究對象為現任職的於不同政府單位的公務人員,並且 將公務人員隸屬單位分成資訊單位與資訊單位以外的一般單位(以下以業務單位 稱之),主要原因在於政府在面對巨量資料分析時會先以業務單位做為主辦單位,
而因為業務單位缺乏相關資訊處理方面的能力,因此也會邀請資訊單位來做為協 辦單位協助處理,因此面對不同的業務或是在任職的機關所碰到的巨量資料有所 不同,可能會造成而所需的巨量資料分析基本的知識和技能而會有所差異,透過 本研究能夠更深入的去瞭解在單位裡公務人員在分析巨量資料、解讀巨量資料分 析時所產生的報表,以及運用巨量資料分析所需的知識和技能。
研究流程
本研究流程如圖 1 所示,在闡述本研究背景與動機後,提出本研究之研究目 的,因本研究目的為公務人員在巨量資料分析上的知識和技能之建構加以探討,
因此,首先應針對巨量資料的相關文獻進行探討,以及對於公務人員目前具有的 核心知識和技能進行整理,並透過與資料科學家所需的知識和技能進行比對,試 圖初步的提出巨量資料分析時需具備的知識和技能與公務人員具備的核心能力 兩者之間的差異。經由文獻檢閱後,提出本研究之研究問題與研究架構。在研究 方法部分,主要透過深度訪談以及次集資料進行資料分析,來瞭解目前我國公務
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
12
人員運用巨量資料的情況,以及公務人員在分析巨量資料、解讀巨量資料分析時 所產生的報表,以及運用巨量資料分析後的成果,應具備哪些知識和技能,最後 提出結論以及建議。
圖 1 研究流程
資料來源:本研究自行繪製。
研究問題 研究背景與動機
研究目的
文獻回顧
巨量資料 公務人員
知識技能
網路輿情
內部巨量資料 巨量資料分析經驗 困難與挑戰巨量資料分析
研究方法與研究架構
深度訪談
資料分析
結論與建議
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
13