• 沒有找到結果。

第二章 文獻探討

第三節 文字探勘意涵及相關研究

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

教育相關政策中,法規面於2016 年公布《辦理學校型態原住民實驗教育補助要 點》提及補助事項,確保經費來源,並在全臺部分縣市中紛紛成立原住民課程 發展協作中心,以因應原住民教育中需保留之文化獨特性,以加強交流平台,

促進協力合作。

四、活動推廣實驗教育理念

實驗教育的創新思維需透過建立共識以利推廣與發展,因此在辦理各項培 育、輔導與訪視活動的過程中皆同時以凝聚共同理念與核心價值為目標,促進 合作的共識。除上述實驗教育中心辦理的活動外,亦針對共識的建立辦理共識 營,凝聚具有共同理念之教育者、家長等參與其中,並同時舉辦多項推廣講 座、成果發表、論壇、國際研討會等,以增加實驗教育在我國的曝光度。也透 過邀請國外學者交流將實驗教育與國際接軌,以更多元角度及立場探討實驗教 育政策的面向,透過交流促進實驗教育的推廣。

五、建立共享資源平台

實驗教育為較新穎之教育政策,在剛接觸到時往往因不了解而有許多疑 問,因此需要有完善的引導管道,以及意見交流探討的機會,才能在家長行使 教育選擇權時、學校轉型或創立實驗教育機構時,更有效建立或推行實驗教 育。因此教育部委託臺灣實驗教育推動中心提供實驗教育手冊與計畫書範本、

指標檢核表以利學校端、審議端等了解檢核內容。並且在交流諮詢方面建立人 才資料庫,以供諮詢管道,讓有疑問的單位能夠依循其立場、身分等尋求適當 的協助。

第三節 文字探勘意涵及相關研究

本節共分為兩部分,首先探討文字探勘之意涵,包含其背景、意義與價 值;第二部分則是整理文字探勘之應用,包含文字探勘之目的與其應用的範圍 與限制。

特點(Boyd & Crawford, 2012; Wang, 2017)。而文字探勘技術起源於大數據資料 分析下的資料探勘技術,隨著現今資訊量不斷的擴大,資訊取得的方便,資料

Ananiadou 等人(2010)提及文字探勘的主要目的是發現隱藏在文本中的知 識,並以簡潔的形式將提取的知識呈現給使用者。Aggarwal 和 Zhai(2012)文

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

字探勘涉及超越文本訊息範圍的資訊,近一步幫助使用者分析並消化訊息,以 促進決策的制定。因此文字探勘的一大重點分析在於運用文本資料的分析,透 過字詞的拆解與歸納,能夠使分析者快速且有效的了解大量文本中所提取的訊 息,以更簡潔清楚的概念呈現,並以資料處理後所提取之資訊重整、歸納,發 掘文本資料所未直接呈現的訊息概念,並基於處理大量資料後所得之資訊,用 以辨識出新穎的見解或鞏固已有的資訊(Kwartler, 2017),也使得無法透過觀察 的而得知的訊息與知識可以獲得論證(陳世榮,2015),並加以提供決策者參 考。

三、文字探勘的價值

Ngai 和 Lee(2016)提及文字探勘能夠大量的處理現今政論消息或社交媒 體訊息,因而擴大了公民對政策的影響力,同時也促進決策者能夠聽見公民的 聲音。近期一些研究發現,文字探勘能夠透過與公民在網際網路上的互動提取 有助於決策的附加訊息(Chun, Shulman, Sandoval & Hovy, 2010)。Kwartler

(2017)認為文字探勘係一種對文本進行有意義的提煉過程,目的在於幫助決 策者,並使分析師、資料科學家較容易地理解大量的文本,並確保內部決策者 的可信度。因此文字探勘之第二項重要意義在於透過提取網路平台之文字訊 息,挖掘上述資料提取後所獲得之隱含資訊,加以分析以提供決策者作為政策 制定之建議,將原先看似為質性的資料轉化為量化的資訊,有效作為實證數 據,使論證結果與決策制定更具說服力與公信力。

貳、 文字探勘之應用

一、文字探勘的應用範圍與步驟

文字探勘所能運用的範圍廣泛,凡具有文資資料之領域不論是學術文章或 是短篇評論,皆能蒐集運用加以分析,因此可謂適用於各樣的科學領域中。

Kwartler(2017)認為,文字探勘技術適合許多的學科,其中包含私人用途以及

圍定義為七部分:第一為搜尋與資訊檢索(information search),屬於前端的資 料搜尋,包含搜尋引擎與關鍵詞的定義與搜索;第二為文字的聚類,常運用各 種聚類方法將字詞歸納與分組;第三為文字分類,運用資料採集的分類基礎來 標記範例模型,用以分組與歸類;第四為網路挖掘,運用網際網路進行電子文 本的資料挖掘;第五為資訊抽取(information extraction),從非結構資料文本 中提取相關資訊,並歸納其事實與關聯;第六為自然語言處理(natural

language processing),將語言視為有意義的符號系統,運用現有的軟體科技加 以從語法、語意中歸類其本質結構與所表達的意涵;第七為概念提取,文字探 勘過程中所提取的字詞加以分類歸納後,常運用關聯分析並加以解釋。

Fayyad、Pitatesky-Shapiro、Smyth 和 Uthurasamy(1996)指出文字探勘通常運 用五步驟完成,其中包含數據的蒐集、數據清理、數據轉換、數據挖掘以及結 論分析並給予解釋。

二、文字探勘的前景與應用優勢

透過自動從非結構化文本中檢索知識,文字探勘技術可以進一步將結果以 視覺化圖示呈現,讓使用者可以有更明確且集中的重點搜索,並能以更有效的 方式,即時檢索文本中所提取的相關信息(Ananiadou et al., 2010)。文字探勘使 用科技軟體中的自動化技術,能夠加快處理大量的資訊速度,有效的節省了人 力與時間的成本,並且同時能夠克服主觀判斷的失誤(陳世榮,2015)。隨著 資訊科技的蓬勃發展與不斷精進,文字探勘技術可謂具有前景的研究方法之 一,且 Kwartler(2017)認為有些問題幾乎完全基於文本,因此若不使用這些

方法將無法有效的執行分析。但 Aggarwal 和 Zhai(2012)也指出,最先進方法 仍有不足而到受到部分限制,因此無法在自然語言處理的過程裡中非常準確的