• 沒有找到結果。

第四章 知識標註學習系統

第五節 系統操作畫面

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖 4 - 4 知識標註學習系統(KALS)與知識萃取機制運作流程示意圖

第五節 系統操作畫面

本節將以系統實際運作的畫面來說明 KALS 的主要功能,包括操作介面、標 註範圍的選取、新增與瀏覽標註、瀏覽討論與回應、標註建議、以及說明。

一、 閱讀文章與 KALS 操作介面

當實驗對象以網頁瀏覽器開啟安裝了 KALS 的閱讀文章之後,KALS 會逐步 地在閱讀文章的靜態網頁上載入工具列、進行初始化可標註範圍等動作。圖 4 - 5 為 KALS 開啟了各種功能的畫面,包括上方的工具列、左方的標註工具、右下角 的標註建議工具、閱讀文章上的標註範圍選取提示、與閱讀文章上以各種顏色標 示的標註範圍。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖 4 - 5 閱讀文章與知識標註學習系統介面

二、 選取標註範圍

在進行新增或是瀏覽其他人的標註之前,實驗對象必須先選取指定的標註範 圍。KALS 標註範圍的選取係透過選取提示工具進行。當實驗對象的滑鼠移至要 選取的文字上時,黑色白字的選取提示工具就會顯示在該文字上方,如圖 4 - 6a 所示。實驗對象便可藉由點選選取提示工具來確定標註範圍的起點,而此時被選 取的文字也會被藍色的框線包圍。接著實驗對象再以同樣的方式選取標註範圍的 終點,如圖 4 - 6b 所示。當標註範圍的起點與終點都確定之後,KALS 會將標註 範圍以藍色框線標示起來,並在該範圍底下帶出標註工具供實驗對象進行新增、

瀏覽標註等動作,如圖 4 - 6c 所示。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

(a) 選擇開始範圍 (b) 選擇結束範圍

(c) 確定標註範圍 圖 4 - 6 選擇標註範圍流程

三、 新增與瀏覽標註

標註的新增、編輯、刪除、瀏覽他人標註、瀏覽討論、加入喜愛清單等動作,

皆以如圖 4 - 7 所示的標註工具進行。標註工具上方是針對選取的標註範圍進行 新增與編輯標註內容的編輯器,實驗對象可以從中選擇標註類型。而筆記欄則能 夠讓實驗對象撰寫具有樣式的文字內容,也能插入圖片或影片。標註工具的下方 則為與選取範圍重疊的所有標註列表。根據 Wolfe(2002)的建議,KALS 的標註 列表採用回覆討論串式架構。列表中的標註依照順序排序,由上而下分別是實驗 對象自己的標註、實驗對象喜愛清單的標註以及其他人的標註。標註的排序會依 照「標註分數」的高低遞減,「標註分數」較高的標註會優先排在上方顯示。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖 4 - 7 標註工具介面

四、 瀏覽討論與回應

在標註工具中,實驗對象可以針對感興趣的指定標註進行瀏覽討論與回應的 動作。圖 4 - 8 為瀏覽討論與回應的操作畫面,上方是標註選取範圍附近的閱讀 文章內容,而文章內容之下為該標註的討論列表;下方則是撰寫回應的編輯器,

其功能與標註工具當中的編輯器大同小異。

圖 4 - 8 瀏覽討論與回應

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

五、 標註建議

當實驗對象新增標註之後,KALS 的「知識萃取機制」會判斷是否要提供標 註建議給實驗對象。圖 4 - 9 是「知識萃取機制」顯示的標註建議內容,上方是 實驗對象自己的標註,中間的訊息則是標註技巧建議與優質標註內容推薦,而下 方則是標註建議回饋的選項。面對標註建議的提示,實驗對象可以選擇贊成建議,

將自己的標註刪除、並移至標註推薦的位置(如果有標註推薦的情況下);或著 是不贊成建議,隱藏標註建議的提示;此外,實驗對象也可以不理會標註建議,

直接關掉標註建議工具,讓標註建議保持在未確認的狀態。而實驗對象在稍後依 然可以在標註工具中開啟未確認的標註建議並進行回饋。

圖 4 - 9 標註建議工具介面

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

六、 說明

在 KALS 工具列上提供了說明工具的功能,如圖 4 - 10 所示。在說明工具中 收錄了 KALS 所有操作介面的說明,並以 FAQ 的形式提供常見問題的解惑。當 實驗對象在操作上有任何的問題、或是想要找尋欲使用功能,都能夠馬上開啟說 明工具來參考。

圖 4 - 10 說明工具介面

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y 第五章 知識萃取機制設計

本研究於「知識標註學習系統」(Knowledge-based Annotation Learning System,

以下簡稱 KALS)中所發展的「知識萃取機制」係考量標註特徵與標註共識等六 項考量因素,結合專家評估制定的標註重要度模糊隸屬函數與因素權重集,以模 糊綜合評判推論出代表標註重要度的「標註分數」與「標註因素分數」發展而成。

根據「標註分數」是否達到建議門檻分數,「知識萃取機制」將會進行標註技巧 建議與篩選出優質標註進行推薦,最後將綜合而成的「標註建議」回饋給讀者。

而「標註分數」較高的標註,也會在閱讀文章上以紅字的形式標亮,此為標註指 引的功能。

以下各節將說明「知識萃取機制」在運作上的各個細節。

第一節 模糊綜合評判

本研究採用之「知識萃取機制」推論「標註分數」的方法為「模糊綜合評判」。

相較於傳統綜合評判,模糊綜合評判是參考各因素的模糊隸屬函數,搭配因素權 重集,計算出模糊集合評價集。最後再經過重心法做解模糊化的動作,而推論出

「標註分數」。

許多社會科學領域的研究使用「模糊綜合評判」作為評鑑的指標(吳柏林,

2005)。而相較於大多數機器學習方法,「模糊綜合評判」在計算上具有不需事 前訓練、運算成本低、能夠快速得到結果等優勢。本研究在設計模糊綜合評判的 因素集、權重集、模糊隸屬度的過程中,也因為納入了專家的專業意見,使得此 方法具有專家效度。

一、 參數設定

在使用「模糊綜合評判」時,需要配合因素集、論域、權重集、評價集以及 模糊隸屬函數五種參數。分別說明如下:

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

(一) 因素集

這是影響「標註分數」推論的各項因素所組成的一個集合,亦即「知識萃取 機制」所考量的各項因素。本系統的因素集為「標註範圍共識」、「標註喜愛共識」、

「標註範圍長度」、「標註範圍位置」、「標註範圍詞性」與「標註策略類型」這六 項因素。後面章節中會再詳細說明這六項因素。

(二) 論域

因素集中的每一項因素皆會發生不同的情況,因素可能產生情況的集合稱之 為「論域」,而每一種情況就是該論域的「因子」。以「標註範圍位置」因素為例,

其論域為「段落開頭第一句」、「段落開頭第二句」、「段落結尾倒數第一句」、「段 落結尾倒數第二句」與「除了以上位置之外的其他位置」。而其中「段落開頭第 一句」則是該論域的一項因子。

(三) 權重集

這是反映各因素的重要程度,以 0 到 1 的量化數值表示。權重越大,對於「模 糊綜合評判」的結果影響也會越大。各項因素的權重會經過正規化,使得各因素 的權重總和為「1」。權重集的建立採用專家評估法,以「知識萃取機制專家評估 問卷」的統計結果來設定。詳細設定過程在後面章節中會加以介紹。

(四) 評價集

這是對於標註各因素可能做出的各種評價結果集合。本系統的評價集設計為

「低重要」(1 分)、「中重要」(2 分)、「高重要」(3 分)三種。各名義評價皆有 對應的量化數值,使得「模糊綜合評判」的結果可以經由解模糊得到一個明確的 數值,也就是「標註分數」。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

表 5 - 1 標註策略類型說明

標註策略類型 說明

重要 標示文章中重要的段落。要熟知這篇文章,就必須要熟讀的部份

困惑 標示您對文章內文產生困惑的地方。

質疑 標示您質疑文章內文是否正確的地方。

舉例 記錄或補充與文章內容的相關資料、舉例。

摘要 用自己的話來歸納文章的摘要內容,像是註明原因、影響、特色等等。

二、 標註範圍長度、詞性與位置

根據讀者標註的資料,KALS 會分析三種標註特徵,包括「標註範圍長度」、

「標註範圍詞性」以及「標註範圍位置」。標註範圍是讀者想要為文章中特定內 容進行標註的範圍位置,標註範圍在其他研究中多以錨點(anchor)稱之。以圖 5 - 2 的標註範圍示意圖為例,讀者對文章中該段落的第一句話進行標註,在圖中 係以粗框線表示標註的範圍。

從標註範圍中可分析出的三種標註特徵,分別敘述如下:

 標註範圍長度:計算標註範圍內的字數,排除無意義的空白或換行,便可得 到標註範圍長度。以圖 5 - 2 的狀況為例,標註範圍長度為 23 個字。

 標註範圍詞性:標註範圍中的文字可以再進一步分析其詞性。本研究採用中 央研究院發展的中文斷詞系統 CKIP(Ma & K. J. Chen, 2003)來進行詞性的分 析,以取得標註範圍中各斷詞後分詞的詞性。以圖 5 - 2 標註範圍的文字「標 註在教育的應用上,國內外均有豐碩的研究成果」為例,此一句子就包含了 名詞、副詞、及物動詞、不及物動詞與感嘆詞。

 標註範圍位置:以標點符號來切割段落內的句子,就可以判斷出標註範圍所 在的位置。在圖 5 - 2 的例子中,標註範圍位置為開頭第一句。

圖 5 - 2 標註範圍示意圖

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

三、 標註範圍共識

標註共識係來自社群指引支援(social navigation support)的概念,統計眾多讀 者在同一篇文章中進行標註所產生的共識。在 KALS 中,標註共識分成標註範圍 共識與標註喜愛共識兩種。

標註範圍共識係指眾多讀者在同一個範圍進行標註,文章的該範圍便成為一 種眾人的「焦點」。以圖 5 - 3 的標註範圍共識為例,讀者 A 跟讀者 C 都針對「e-GBL 遊戲式學習平台」這個字進行標註,因此他們的標註範圍便產生了共識。KALS 的標註範圍共識採用人數計算,以圖 5 - 3 的例子來看,編號 2 讀者 B 的標註因 為沒有其他讀者與其產生共識,因此標註範圍共識為 0 人;編號 1 讀者 A 標註 的標註範圍共識有讀者 C 這 1 人,而編號 3 讀者 C 的標註也擁有標註範圍共識 讀者 A 這 1 人。即使讀者 A 對於同樣範圍的「e-GBL 遊戲式學習平台」進行重 複的標註,也不會重複記入標註範圍共識當中。

此外,以回應方式撰寫的標註會被視為與被回應的標註位於同樣的標註範圍,

因此也會被記入標註範圍共識之中。而當讀者對於包含「推薦標註」的標註建議

因此也會被記入標註範圍共識之中。而當讀者對於包含「推薦標註」的標註建議