• 沒有找到結果。

第一章 導論

1.4. 預期貢獻

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

10

力來擷取蒐集、過濾、管理、收藏以及做進一步的處理,這樣的資料被稱為「巨 量資料(Bid Data)」,每一個環節對於研究者來說都是極大的挑戰。

1.3. 研究目的

在網路時代中,僅透過電話媒介做訊息通報是不夠周全的方式,尚有許多以 新興媒體平台溝通與資訊交換的方法,然而,有鑑於人力能夠處理訊息之數量的 限制性,在本研究中,希望透過觀察 2009 年莫拉克八八風災期間於網路和救災 應變中心收集的資料,發展工具比較與分析災難事件中不同性質來源資料集間的 異同與特性。並針對各資料集內容抽取特徵資訊,以機器學習的方式建立各項分 類模組,探索自動化分類災難資訊的可能性,以期能初步過濾資料為不同類別,

輔助人力上的不足,協助進行資訊過濾和處理,未來能將自動化工具使用於發展 社群新媒體平台感測器。

1.4. 預期貢獻

政府機構防救災體系應變政策之決定,需要事先得到足夠的防救災必要資訊 才能做出判斷,發揮協調、聯繫、指揮調度和搶救的機能,而利用人力蒐集建立 救災資料的方式,已經無法負荷今日的防救災勤務即時反應的功能[7]。存在網 路上的災情資訊和政府的防救災體系沒有足夠的連結,以致現階段防災救災應變 中心只能處理 119 急救專線建立的訊息,無法處理新興媒體上即時的資訊內容。

若發展自動化訊息分類,便能將網路上的資訊初步以機器過濾,減少人力資源並 解決資訊過多無法負荷的窘境。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

11

第二章

相關研究

2.1. 災難期間的傳播活動

人們在災難期間的傳播活動具體而言可以分為四點 [2]:

(1) 資訊蒐集和傳播

人們透過媒體尋求近況,聯繫親人朋友,特別在通訊管道中斷之際,行動電 話和網際網路等個人媒體發揮了聯繫作用。

(2) 物資徵集和流向

人們利用新媒體向社會大眾徵集物資,或透過線上討論平台,調整救災物資 流向和數量,確保物資能用在正確的地方不致於產生救災資源的落差。

(3) 組織人力和任務派遣

重大災難發生的時候,往往產稱新的團體或組織參與救災行動,透過媒體協 調和指揮救災志工,進行策略編組和調度派遣。

(4) 抒發心情與表達支持

危機事件下,人們需要情感撫慰的資訊以消弭焦慮或恐慌,透過新媒體平台 抒發慰問之情或表達救災看法和見解。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

12

2.2. 災難發生後資訊傳達問題(瞬間巨量)

災難發生後社會內部通常會發生重大失序,人們需要相關資訊以確認自己或是親 友的安危,此時卻也是資訊最匱乏的狀態。由於能源中斷、設施毀損或指揮結構 失靈等因素,使得相關訊息無法正常的被傳送,人們因而設法透過其他管道來發 佈訊息,訊息經過重複的傳遞在短時間內造成龐大的訊息數量,使得原本負載過 重的系統因此而癱瘓[8]。

災難時期訊息的瞬間巨量成長、資訊匱乏和資訊過載,讓平時主要的資訊流 通傳播媒介面臨極大的挑戰,當巨量的災情訊息湧入防救災單位、新聞機構和網 路新媒體平台,形成無法處理的資訊數量是,災難的危機處理便轉化成為資訊的 危機處理。

2.3. 備援頻道和浮現型頻道

備援頻道(Backchannels)是用來描述災難發生當下,人們使用網路上各種新興 科技頻道從事緊急應變的現象,在頻道中的使用者同時具有發言和傾聽的參與。

在南加州大火的社群媒體使用研究[9]中發現,雖然官方在大火發生時不認同社 群媒體(Social Media)分享的資訊內容,視備援頻道上的內容為錯誤資訊或是 謠言。但在災難中,社群媒體卻是促成大規模群眾參與的重要關鍵,人們藉由線 上論壇、即時通訊、部落格、為網誌或線上共筆系統進行聯繫和傳遞訊息。

浮現型頻道(Emergence Channels)為災難中才浮出抬面的媒體頻道,這類 媒體在災難前並不存在,災難事件發生後,既有的媒體未能適時地提供足夠的資 訊,為因應資訊流通的情境需要而浮現出來,和備援頻道相對照。此類頻道使用 的媒體技術形式,足夠支持災難資訊傳播使用,參與者多半是自發性動員而來。

當危機狀況解除以後,這類頻道即回復原先的角色或是淡出而消失。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

13

2.4. 網際網路在災難中的角色

近年來引起大眾注意的許多災難事件中,網際網路都扮演過去其他傳統媒體沒有 的功能,人們利用各種新興網路技術的新媒體頻道來傳遞龐大災難資訊。在顧佳 欣的文章[10]中指出:網際網路本身在莫拉克八八風災中扮演資訊傳達、資源募 集調配的重要角色。如何以資訊傳播科技使資訊暢通,是災害發生時的關鍵。網 際網路的「互動性」和「資訊空間」可以讓偵測環境的功能更為接近民眾的個人 資訊需求[11]。線上社群網路和社交媒體的特點之一是他們對於信息傳播的潛力。

他們在訊息擴散的技術創新,已被有經驗的社會學家研究多年[12]。

網路現已成為平民化的傳播工具,任何的組織不需要昂貴的器材和專業的製 作團隊,就可以上網發布訊息及傳遞聲音影像,而且握有較多的內容掌控權,發 布新聞訊息時也不必耽心被媒體簡化或曲解。透過網路,受到災情影響的人們,

也可以簡單地將他們的經驗與需要放到網站上,和其他地方的受害者一起分享他 們的想法,甚至是和救援單位溝通。過去幾年中,社群訊息網路工具(如:Twitter)

已經在災難時期被用來作為一種溝通工具,這類工具可以跨越國家、時區和文化 讓人們分享訊息和知識,參與者可以找尋資料和驗證事件資訊,分享災區和失蹤 人口等有關的詳細資訊[13]。

2.5. 過去文字訊息分類

在這個知識爆炸的時代,整個世界處處都充滿了「文字」。巨大的文字數量人類 已無法有效的去解析這些內容。而這問題也已經引起自然語言處理(Natural Language Processing)和機器學習(Machine Learning)這些領域的研究人員注意。

過去有從簡短的文字訊息學習分類的問題,曾經有研究利用各種機器學習的演算 法(像是 Naive Bayes、SVM、Logistic Regression 和 Decision Trees),來解決識 別簡短訊息的垃圾訊息問題[14],或是針對一些線上問題的對話內容(如 Yahoo

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

14

Answers 或 Google Answers)進行分類比對[15]。亦有利用部落格的文本內容,

自動抽取關鍵字和階層式分類改善文章註解的方式[16],或是對醫療方面的文字 訊息分類,協助非洲偏遠地區的醫療問題[17]。

近年來網路和簡易手持行動運算設備的日趨成熟,簡化了人們對於事件的參 與並增加對事件內容討論的可近性。因此也提高了學者對於災難發生時,人們在 網際網路上所發佈傳遞的文字訊息分析的興趣,Cornelia 在其文章中提出了 EMERSE(Enhanced Messaging for the Emergency Response SEctor)架構系統,

EMERSE 系統包含了四個元素:(1)自動的訊息分類(2)一個 iPhone 的應用程 式(3)撈取 Twitter 資料元件(4)機器翻譯,收集 Twitter 上的資料在經過機器 的語言翻譯後來分類災難發生時 Twitter 上的資訊[18]。

過去的訊息分類研究中,雖有針對簡訊或網路訊息分類,但缺乏災難事件下 針對未翻譯的原生語言,同時具有跨不同性質資料集比較的經驗。這次我們的研 究,則在單一莫拉克颱風八八水災事件下,收集了三種頻道來源共五個資料集的 資訊內容,進行跨性質的資料集分析與訊息分類實驗。

Fire Department

Model Research

Collection Analysis Application

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

16

3.1. 資料來源

莫拉克(Morakot)為 2009 年太平洋第 8 號颱風,是一個中度颱風,本身的颱風 強度並不強大,但在 8 月 9 日至 8 月 11 日三日期間內帶來了罕見的驚人雨量,

符合了極端氣候的特性,單高雄市山區即帶來超過 2,500 毫米的雨量,如此雨量 等同於三日內降下一年的雨量。莫拉克在短時間內狹帶超量雨水集中於台灣南部 地區,形成大規模水災重創南部地區,也帶來少見的資訊洪流。

水患的災民與其親友於此次水災中,在無法得知足夠資訊的恐慌焦慮下,只 能四處求援,因而癱瘓了部分應變中心的通訊系統。在既有管道壅塞的情形下引 發資訊氾濫,這現象引起一些網路使用者與技術人員的注意,在相互引導下組織 動員,自發性成立災情資訊頻道,提供莫拉克災情相關的資訊內容張貼和討論。

如本文開頭第一章導論中第一節網際網路的特性所述,網路是一個共同的資 訊空間,資料可能會存放在網際網路某個儲存節點上,所以資訊可以累積與整合 不容易流失,但災難發生時,網路上爆發的瞬間巨量資料,可能使得原本不存在 的浮現型頻道因應情境誕生。通常此類頻道在災難結束後,會隨之恢復為原來的 角色或淡出網路消失。所以蒐集此類頻道的資料具有時效性,當災難結束後,我 們就不容易蒐集到較完整的資料,僅能透過搜尋方式找到部分已被封存在搜尋引

圖 1、自動分類系統概觀

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

17

擎資料庫的內容。

本研究中所選擇使用的資料,即為 2009 年發生在南台灣地區的莫拉克八八 風災的頻道資料,經主事者同意授權下,利用程式將既有頻道(屏東及台南縣市 119 報案電話記錄)和網路上備援頻道(ADCT 數位文化 Twitter 資料)及浮現頻 道(XDite、Ricks)等五個資料來源,整理儲存在資料庫中,以做為本次研究的 基本資料集。

3.2. 系統設計與概觀

圖 2 為本研究的系統設計概觀與流程,包括撈取網路社群資料、文字辨識、文字 轉碼等資料前處理步驟,並將資料儲存至資料庫中保存。而後進行專家文本分類、

移除干擾符號、中文斷詞處理和去除停用詞(Stop Words)等資料前處理。在進

移除干擾符號、中文斷詞處理和去除停用詞(Stop Words)等資料前處理。在進

相關文件