第三章 研究設計
第二節 資料蒐集
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
31
圖 7:內容分析研究步驟
資料來源:修改自王石番(1992)及盧麗淑(2007)。
首先,在資料範圍方面,本研究以次級資料進行本研究資料的界定及蒐集,
並根據次級資料的資料形態,建立抽樣程序及選定正式樣本。接續建構初步類目 項目及分析單位(Units of Analysis),分析單位是將一段特定內容,歸入預先建構 好的分析類目(Holsti, 1969:116)。本研究以單篇內容作為分析單位,依循前述的 步驟對部份樣本進行前測。當前測的編碼結果符合信度檢測標準後,便進入正式 編碼。
第二節 資料蒐集
一、次級資料介紹
所謂次級資料分析(Secondary Data Analysis)意指研究者基於前人的研究基礎 或運用現有的大型資料庫(如官方統計數據或學術資料庫)來進行研究問題的探
資料範圍的界定
決定分析樣本
建構類目
界定分析單位
製作編碼表及前測
正式編碼
資料分析
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
32
究。本研究以行政院國家發展委員會於 2014 年委託政治大學蕭乃沂教授所主持 的「政府應用巨量資料精進公共服務與政策分析之可行性研究」進行次級資料分 析。該計畫分別針對政府內部巨量資料及政府外部巨量資料作為輿情的探究,本 研究僅針對此計畫中政府外部網路輿情的個案作為後續資料分析的範圍,故政府 內部的公共服務資料庫不在本研究的資料蒐集範圍。
針對外部網路輿情方面,蕭乃沂等(2014)以「自由經濟示範區」(以下簡 稱示範區)作為分析主題,有關示範區政策的個案本研究將於下一節介紹。為了 探詢網路上民眾對於公共議題的看法及行為模式(如聲量及情緒),該計畫運用 網路輿情分析的技術,在各類型網路來源(包括新聞網站、論壇、部落格、社群 媒體等)進行資料的撈取。
首先,在前述第二章第二節網路輿情實作的操作流程下,技術協力夥伴根據 政策主管機關所提供的關鍵詞表(如表 5),進入其建置的網路輿情分析平台(如 圖 8),撈取符合關鍵詞的公開言論,如下圖所示此平台包含查詢條件、來源、主 題及維度7。
表 5:自由經濟示範區關鍵詞表
主題關鍵字 衍生關鍵字
(自由經濟示範區|自由 經濟|自*區|示範區&)
特別條例、自經區*條例、自由貿易港、自貿 港、示範事業、實體園區、指定試點、TPP、
RCEP、法規鬆綁、制度創新、空白授權、單一 窗口、租稅優惠、市場開放、外國人才、陸 資、斷開鎖鍊、悶經濟逆轉、世界航道、土地 徵收、區段徵收、環評、外勞、圈地、炒地 皮、服貿後門、一中三部曲、online、網路*座 談、國發會、經濟部、懶人包、溝通*會、
hackpad、釋疑書、爭議書
7 維度是一種在主題資料範圍下,去尋找更想關注事件之第二階層資料。以自經區主題為例,
其主題下可再進一步切割成七大子議題(如經貿、物流、醫療、農業、教育、金融等),需求單 位可依照其所需的查詢條件進行設定。
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
34
圖 8:網路輿情分析查詢平台
資料來源:蕭乃沂等(2014)。
接續,依據設定的查詢條件,產出符合示範區主題的原始資料(Raw Data),
包含監測主題、標題、內容、來源、來源網站、主文/回文、發佈時間、討論串總 則數、正負情緒、原始網站連結及作者等(如圖 9)。其中,監測主題是指在資料 庫的系統中,主題設定的名稱;標題為一篇文章中網民所下的標題;內容為一篇 文章中網民所寫的內容;來源則可分為新聞網站、社群網站、討論區、部落格四 類,四類來源又可進一步依照其來源網站8來細分;主文是指網民所發表的原始 言論,它是依照關鍵詞的設定撈取,前述四類來源皆含主文;回文則是指針對主 文的內容,由其他網民所回覆的言論,回文不全然依照關鍵詞來撈取,凡是與主 文相關的回文皆會被系統所挑選,但在聲量及情緒的計算上,僅有與關鍵詞有關
8 來源網站是指來自四類來源的網站及頻道(討論版),部分代表性的網站如下:以新聞網站為 例,包含 yahoo 新聞、yam 天空、聯合新聞網、Sina 新聞、MSN 新聞、Pchome 新聞等;以社 群網站為例,包含 Facebook 公眾訊息、Facebook 關鍵意見領袖、FB 粉絲團、ptt 八卦及其他版 面、Youtube 關鍵字搜尋、Plurk 搜尋、Yahoo!知識+等;以討論區為例,包含 Mobile01、卡提 諾王國、伊莉討論區、捷克論壇、SOGO 論壇、Fashionguide 等;以部落格為例,包含痞客邦 PIXNET、Udn 部落格、PcHome 部落格、中時部落格、樂多日誌 Blog 等。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
35
的回文才會列入計算,四類來源中僅有社群網站及討論區含回文,新聞網站及部 落格則不包含;發佈時間是指一篇文章發出於網路的時間點;討論串總則數是指 總回文的統計;正/負情緒為網民撰寫內容之正/負面情緒強度,數值介於 0~1 之 間,大於 0.3 表示此篇言論具有正/負面情緒顯著;最後提供文章之原始作者及網 址的連結。有關原始資料的各項欄位說明,整理如表 6。資料撈取的期間為 2014 年 3 月 17 日至 2014 年 11 月 24 日,總共撈取 47,251 筆資料。
圖 9:撈取符合自經區主題的文章內容
資料來源:蕭乃沂等(2014)。
表 6:原始資料的各項欄位說明
原始資料欄位 欄位說明
監測主題 此欄位為在系統中,主題設定的名稱顯示。如:自由經 濟示範區,可取名為示範區或自經區,主要為辨識用 途。
標題 此欄位為一篇文章中網民下的標題名稱。
內容 此欄位為一篇文章中網民寫的內容。
來源 此欄位之項目分為四類:討論區、社群網站、部落格、
新聞之媒介來源。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
36
表 6(續)
來源網站 此欄位為一篇文章之網站與頻道名稱(討論版)。 主文 此欄位為一篇文章是屬於網民所發表的原始言論,與自
經區有關的關鍵詞才會被撈取。
回文 此欄位為一篇文章是屬於其他網民根據主文所回覆的言 論,凡是符合關鍵詞所撈取的主文底下的回文都包含在 內,但在聲量及情緒的計算則以有關鍵詞的回文才列入 計算。
發佈時間 此欄位為一篇文章發出於網路的時間點(原網站提供之時 間),提供年/月/日/小時/分鐘/秒數之訊息。
討論串總則數 此欄位為該討論串的總回應數(總回文統計)。 作者 此欄位為一篇文章作者是誰之名稱。
正面強度 此欄位為一篇文章網友撰寫內容之正面情緒強度數據,
介於 0~1 之間,大於 0.3 表示正面情緒顯著。
負面強度 此欄位為一篇文章網友撰寫內容之負面情緒強度數據,
介於 0~1 之間,大於 0.3 表示負面情緒顯著。
原始連結 此欄位為一篇文章之原始網路的連結(網址)。
資料來源:本研究整理自蕭乃沂等(2014)。
綜上所述,該演算法的操作方式是以關鍵詞進行網路上公開言論的撈取,然 而,對於未公開或設有隱私設定且與示範區主題相關的言論,則無法被系統撈取,
此為該次級資料的限制之一;再者,即便是網路上的公開言論內容,也與主題相 關,但不在該系統設定的關鍵詞範圍內,仍然無法被系統撈取,此為該次級資料 的限制之二;最後,次級資料的限制三,則為演算法系統本身所發生的兩類誤判 情形(如表 7),其一是相關性的誤判,也就是系統將不相關的言論誤判為相關,
進一步影響情緒的誤判;其二是單純情緒的誤判,包括:第一類為不顯著情緒被 系統認定為顯著的正向或負向情緒,反之亦然;第二類為顯著的正向情緒被判定 為顯著的負向情緒,反之亦然;第三類為情緒與立場的錯誤解讀(蕭乃沂等,2014)。 進言之,在原始次級資料的限制下,本研究僅能針對系統所撈取的言論進行分析。
其它未被系統撈取的言論則不在本研究的資料範圍。此外,有關情緒的誤判,本 研究僅針對第三類情緒與立場的部份進行探究(粗框),其他兩類不在分析範圍。
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
38
的範圍,期透過示範區推動制度改革及法規鬆綁,宣示我國致力推動開放的決心,
加速推動臺灣朝向「自由經濟島」的目標邁進。根據政府推行的政策規劃內容,
主要的內容包含:核心理念及目標、推動策略及創新重點。以下將各推動內容分 述如下:
(一) 核心理念及目標
示範區以「自由化」、「國際化」與「前瞻性」作為三大核心理念,示範區是 臺灣邁向新一波經濟自由化的先行先試區,最終目標是由部分示範進而全國適用,
讓臺灣逐步向自由經濟島邁進。
(二) 推動策略
為加速國內法規鬆綁及改善營運環境,政府將以突破法規框架、創新管理機 制等思維提出相關推動策略,包括:(1)促進人員、商品與資金自由流動、(2)開放 市場接軌國際、(3)因應國際租稅競爭、(4)推動跨國產業合作、(5)提供便捷土地 取得、(6)建置優質營運環境以及(7)並行雙軌示範機制。
(三) 創新重點
為擴大示範區的範疇,行政院於 2013 年 12 月 19 日第 3377 次院會通過「自 由經濟示範區規劃方案(修正案)」。配合示範區規劃方案之調整,推動五大創新 重點,包含:(1)智慧物流:透過創新關務機制及雲平台等資訊服務,提供最佳物 流服務)、(2)國際健康:於區內設立國際醫療專辦機構及生技研發機構,帶動生 技、藥品、復健、養生等健康產業發展、(3)農業加值:善用國內農業技術,致力 產品創新加值,以 MIT 品牌行銷國際,使農業從「農產品」擴大為「價值鏈」、
(4)金融服務:透過業務分級與差異化管理方式,放寬金融機構業務範圍,對非居 住民及本國專業投資人提供各項金融服務,有助於發展財富與資產管理業務以及 (5)教育創新:透過設立實驗性質大學或學院,促進教育創新發展。
此外,本研究根據示範區的推動歷程(如表 8),以了解該政策整體實行情 形。首先,示範區於 2011 年已列入總統馬英九的黃金十年政策願景中,並且於 2013 年 8 月由行政院啟動第一階段推動計畫。2014 年 3 月初立法院進行草案的
此外,本研究根據示範區的推動歷程(如表 8),以了解該政策整體實行情 形。首先,示範區於 2011 年已列入總統馬英九的黃金十年政策願景中,並且於 2013 年 8 月由行政院啟動第一階段推動計畫。2014 年 3 月初立法院進行草案的