• 沒有找到結果。

第四章 巨量資料分析實務與運用

第一節 巨量資料對政府的價值

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

61

第四章 巨量資料分析實務與運用

本研究主要的研究目的是瞭解政府單位的公務人員為了善用巨量資料分析 而需要具備哪些知識和技能,為了先瞭解政府單位對於巨量資料的認知、看法,

以及運用上的必要性和價值,來證明巨量資料分析對於政府單位來說是重要的分 析方法,因此本章第一節先以探討政府單位對於巨量資料認知和價值為主。再者,

瞭解到巨量資料分析在政府單位的價值後,第二節本研究回歸到實務面,探討政 府單位在運用過程可能會面臨到的困難與挑戰,以延伸到第三節政府單位為了因 應這些困難與挑戰所提出的知識或技能,或者是在巨量資料分析過程中應該具備 哪些知識或技能,此外並與資料科學家所需的知識與技能進行比對,使本研究對 於巨量資料分析者所需的知識跟技能更加明確。最後,歸納完巨量資料分析者所 需的知識與技能後,第四節則是回到目前政府單位公務人員已經具備的知識和技 能,以及所欠缺必須要再加強或者培訓的部分,以提供未來政府部門在面對巨量 資料分析時對於公務人員所需的知識和技能有一定的理解。

第一節 巨量資料對政府的價值

巨量資料的分析與應用是近年來不管是各國公私部門發展的重要趨勢,透過 巨量資料分析及應用為經濟和社會各個層面帶來各種機會,巨量資料分析不僅促 進經濟的成長,更可以運用在預防或是預警,改善生活品質或是社會安全的提升,

也因此對於各國政府來說推動巨量資料分析應用更是一個趨勢(鐘嘉德、柴惠珍、

高崎鈞、曹元良,2015)。政府雖然近年來積極的巨量資料,包含前行政院院長 毛治國院長上任後推出「網路溝通與深化施政規劃」三支箭,以及前行政院院長 張善政院長提出應該將資料提供給民間分析,以對施政有很大的幫助,但是前行 政院院長張善政院長亦有提到各國政府雖將巨量資料應用在公共行政上,但是各 部會對於應用資料的概念還是未能普及,所以期望透過政府將資料提供給民間,

使資料能夠發揮效益(鄭國強,2016)。本研究認為在運用巨量資料前不管是政

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

62

府或是組織,以及相關利害關係人對於巨量資料的認知或者價值都要有相當的理 解,這是在運用巨量資料過程中不可或缺的觀念。此外,了解政府使用巨量資料 的原因,可以使本研究在了解政府對於巨量資料的價值有實務的理解外,也可以 利於後續本研究探討在運用巨量資料時可能會產生的困難與挑戰相互呼應,更能 夠清楚的了解巨量資料分析對於政府的重要性。

巨量資料為資料在格式與分析技術上的一種新發展

在進行巨量資料分析之前,對於巨量資料的認知是分析前主要的觀念之一,

才能夠使分析者能夠去理解資料內容以及它的特性,甚至是瞭解它的限制,來發 揮巨量資料分析的效益以及將結果良好的傳達給上級長官與大眾,也因此本研究 認為政府單位在進行巨量資料分析時,不管是巨量資料分析者或是相關利害關係 人對於巨量資料的特性都會有些許的認知。巨量資料的特性從文獻上或者是教科 書上基本會提到包含資料量大(Volume)、多變性(Variety)以及即時性(Velocity)

等等。在訪談的結果中,可以發現幾乎全部的政府單位的受訪者對於巨量資料的 定義與一般在文獻上所提到的巨量資料的特性幾乎差不多,包含了資料量大以及 資料量的複雜性等等。反觀對於外部的專家學者以及資料科學家來說,他們認為 政府單位的人員對於巨量資料的認知尚未熟悉,D1-1 受訪者有提到:

「政府單位的人員在講巨量資料的時候,他其實比較專注在巨量資料很 接近國家的母體,這樣的一個層級,而非像業界講的 size 很大,不是 TB、

PB、GB 以上」(D1-1-3)

也就是說,政府單位的人員對於在面對巨量資料的定義時,對於巨資料的特 性通常都是以字面上的意思來定義,卻忽略巨量裡面包含其他的意思,簡而言之,

政府單位的人員是以「巨量」這字面上的一詞來定義巨量資料,而忽略量大中的 複雜性,至於對於資料量大的程度以及內容則是依據研究範圍和對象來定義。且 由於本研究訪談的政府單位的對象都是擁有使用過巨量資料的經驗,也因此這些

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

63

政府單位的受訪者對於巨量資料的認知還是有一定的理解程度,如同 GM3-1、

GM3-2 和 GE5-1 等受訪者,都有提到對於本身已經有使用過巨量資料的經驗,

因此與其他政府單位的人員相較起來,對於巨量資料的認知程度也比較高,也能 理解巨量資料的特性並非像傳統在進行數據統計上統計而已,例如說 GM3-2 受 訪者就有提到:

「我覺得會有一些不同,我覺得認知上會有些不同,像我們會接觸到一 些系統廠商那我們就會知道他們會去做一些文字探勘,…,因為文字非 結構化,…。那可是我覺得現在有一些政府宣稱他有在用一些巨量資料,

他可能或許引用的技術是不太一樣的,可能像我們比較新的就知道用文 字探勘去做這些分析,那可能就是比較傳統的統計的。」(GM3-1-2)

從這些受訪者的觀察來看,可以發現雖然巨量資料的認知對於已經有使用過 或是接觸過的政府單位受訪者是有一定程度上的理解,但是對於一開始接觸或者 是對於完全沒有接觸的使用者或是相關利害關係人還是對於巨量資料的特性認 知還是有落差,所以可能會造成政府單位在運用巨量資料時,會發現還是會以偏 向結構化的數據來進行分析處理,葉瑜娟(2015)提到學界所提到的巨量資料除 了資料本身的量大之外,還包括了資料是否有具備多樣性,因此他認為政府在推 動的巨量資料的調查或是分析比較偏向於開放資料的概念,其原因在於政府的資 料大多數都有既定的格式,資料的結構較為固定,而且有些資料可能是透過人工 輸入的方式進行,並非類似像交通的即時影像,幾秒就會產生大量的資料。這也 是為什麼從外部的專家學者或者是已經有跟外部廠商或是與學術單位合作過的 政府單位的觀察中,認為政府單位對於巨量資料的認知還是稍嫌不足,而導致後 續在進行巨量資料分析時會碰到一些困難與挑戰。

比較特別的地方在於,擁有資訊背景的受訪者,如 D1-1、GI4-1 和 GI4-2 等 受訪者來說,巨量資料的出現並不是特別的,也就是說巨量資料不僅僅是只有巨 量而已,甚至巨量根本就不是主要的定義,相反的反而是主要以技術上面來做為

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

64

探討,因為巨量資料分析對於資訊單位的人員來說也是一種資料分析,因為資料 分析一直都在進行,只是因為時代的演變,技術的推進而使的原本不能用傳統技 術處理的資料得以處理,如同 GI4-2 受訪者所提到:

「他其實純粹指的意思是說,以前的技術能力無法處理的東西,然後在 現在到了一定的量級,所以叫巨量資料,但是事實上它本質就是資料,…,

我覺得那只是技術上的門檻而已。」(GI4-2-1)

巨量資料分析與應用不管對於政府或組織是一個重要的趨勢或者是對於擁 有資訊背景的人員來說只是另外一種技術提升的資料分析的應用,本研究認為最 主要還是要對於巨量資料本身或是更具體一點對資料本身的特性要有一定程度 的認知,要使用怎樣的工具以及相關的知識,才能夠將資料發揮出最大的功效,

達到政府或組織的目標。在訪談過程中政府單位的受訪者對於巨量資料的特性了 解都有一定的程度,其主要的原因在於這些受訪者都有參與過或是接觸過巨量資 料分析的過程或是研究屬性的單位,也因此對於巨量資料的特性會有一定的理解,

但是就如同外部的專家學者或者是本身政府單位的受訪者提到對於這些未接觸 過巨量資料的政府單位人員或者是剛開始進行巨量資料分析的政府單位人員,巨 量資料的認知還是不足夠的,不管是對於巨量資料的特性只以字面上意思來定義,

或者是用結構化的數據來進行分析等,這些都是因為對於巨量資料特性的不瞭解 所造成的,甚至可能會衍生到後續使用過程中的困難與挑戰。

但是本研究認為可能因為各個業務單位的機關對於巨量資料的所達到的目 的需求不同,所以在分析上也會有所不同,例如對於需要進行文字探勘的機關單 位,如果僅僅是用數據的方式呈現,可能已經沒辦法良好的符合所需求,也因此 會造成對於用傳統結構化的數據進行分析以及用文字探勘技術進行分析,甚至其 他資料分析技術對於資料認知上的差異,因為這兩者都可以稱為巨量資料分析,

透過技術上的變化與創新,使用的工具不同,因此得到的結果也會不同。此外由 於政府本身的組織特性,因此比較偏向於對於巨量資料的推動,是有需要進行像

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

65

巨量資料的機關單位或是研究單位才比較了解巨量資料的過程跟背景,但是對於 一般的公務機關,對於巨量資料的認知可能就比較不那麼熟悉也沒有那麼必要性。

但不管怎麼說政府或是組織的巨量資料分析者或者是業務承辦人,甚至是利害關

但不管怎麼說政府或是組織的巨量資料分析者或者是業務承辦人,甚至是利害關