第二章 巨量資料探勘技術 應用於測量核能發電之風險感知
第二節 研究設計
一、 分析對象
首先,透過台灣析數資訊股份有限公司研發的 eMiner 之輔助,進行網路文 本探勘。挑選特定社會議題與政策(核能發電與核四政策)進行網路與論分析,依 據資料蒐集、過濾、挖掘、分析、詮釋等過程,從巨量的網路資料中篩選出有意 義的資訊。
接著,藉由台灣析數資訊股份有限公司過去的技術與經驗,執行電腦輔助內 容分析(Computer-aided Content Analysis, CACA)。在 eMiner 的輔助之下,進行網 路文本的內容分析,依據結構化的操作程序,有助於提高內容分析的信、效度;
同時,在 eMiner 的技術之下,亦可進行各種量化與質性分析,並將分析結果視 覺化,有助於資料的意涵詮釋與重點掌握。
一、 分析對象
在巨量資料分析的架構之下,應用資料探勘技術來資訊的脈動,將有助於突 破過去資料蒐集有限的瓶頸。世界經濟論壇(World Economic Forum, 2012)就指出,
巨量資料的資訊來源可以是從個人層次從到組織層次,無論是公部門、私部門、
甚至公民社會的資料,都可以成為巨量資料的資訊來源。而在風險感知的主題之 下,本研究將巨量資料所關注的焦點放置於公民社會部分的來源,並同時蒐集網 路空間中個人、團體及媒體之相關論述作為分析之對照,以回應前述的研究問題。
在巨量資料的概念之下,本研究欲選取的資料來源如下:
11
5 Cereja Technology 調查報告,網址:http://www.cereja.co.jp/press_release20130408.pdf。
12
13
資料類型 是否蒐集 是否分析
圖片6 V V
附檔 X X
資料來源:本研究
2. 電子佈告欄論述分析
不同於上述 Web2.0 的線上社群,本研究亦選擇 Web1.0 的電子佈告欄 (Bulletin Board System, BBS)作為資料蒐集的對象,主要以國內批踢踢實業坊 (http://www.ptt.cc/bbs/index.html)為標的,依照其內容分類共有 12 大項的各類看 板(請參見以下說明)。本研究挑選其中的 F_Group—活動中心(社團, 聚會, 團體) 看板中的 C-Rights—權利之看板來進行資料蒐集,進一步聚焦在本研究議題相關 的看板,包括 NTU-CONSERVE 台大自然保育社、NTUEP 百大環保社以及
fightforland 環境議題轉錄板等。此外,亦蒐集 K_Group—國家研究院(政治, 文
學, 學術)看板中的 Academy—科學學術研究院之看板,進一步以 EarthEnviron—地球環境暨規劃學群中的 Ecophilia 環境板為對象。批踢踢實業坊之各類看板之 主題架構如下:
A_Group—市民廣場(報告站長 PTT 咬我)
B_Group—臺灣大學(臺大, 臺大, 臺大)
C_Group—政治大學(政大, 政大, 政大)
D_Group—大專院校(大學, 科大, 研所)
E_Group—青蘋果樹(高中, 國中, 國小)
F_Group—活動中心(社團, 聚會, 團體)
C-Rights - 權利(人權/保育/福利/環保)
NTU-CONSERVE 台大自然保育社
(http://www.ptt.cc/bbs/NTU-CONSERVE/index.html)
NTUEP 百大環保社 (http://www.ptt.cc/bbs/NTUEP/index.html)
6 必須說明的是,圖片內容可能會因為臉書定期的系統更新,導致連結的失效而有所變化。
14
fightforland 環境議題轉錄板
(http://www.ptt.cc/bbs/fightforland/index.html)
G_Group—視聽劇場(偶像, 音樂, 廣電)
H_Group—戰略高手(遊戲, 數位, 程設)
I_Group —卡漫夢工廠(卡通, 漫畫, 動畫)
J_Group—生活娛樂館(生活, 娛樂, 心情)
K_Group—國家研究院(政治, 文學, 學術)
Academy - 科學學術研究院
EarthEnviron - 地球環境暨規劃學群
Ecophilia 環境板(http://www.ptt.cc/bbs/Ecophilia/index.html)
L_Group—國家體育場(汗水, 鬥志, 膽識)
依據 eMiner 所提供之功能,本研究針對上述看板之內容進行蒐集與分析。
表 2-5 電子佈告欄蒐集與分析的資料類型
資料類型 是否蒐集 是否分析
Po 文 V V
回應 V V
資料來源:本研究
3. 新聞報導分析
新聞報導也是代表公民社會意見的重要管道。雖然,本研究原先預計同時將 不同屬性的媒體一併納入,但,在 eMiner 資料採集功能的限制之下,暫時放棄 蒐集各大入口網站之即時新聞與用戶回應,僅以國內四大發行量之報社之線上新 聞報導加以分析,相關媒體名稱如下:
15
表 2-6 線上新聞資料庫名單
類別 屬性 新聞媒體名稱
媒體報導 有實體報紙
聯合新聞網 中時電子報 自由新聞網 蘋果日報 資料來源:本研究
依據 eMiner 所提供之功能,本研究可以針對國內四大新聞媒體之報導之本 文進行蒐集與分析。
表 2-7 新聞媒體蒐集與分析的資料類型
資料類型 是否蒐集 是否分析
Po 文 V V
回應 X X
資料來源:本研究