決定關鍵詞彙介陎 - 第四章系統功能及介陎 - 中國近現代思想及文學史資料庫檢索系統

4. 第四章系統功能及介陎

4.2 決定關鍵詞彙介陎

國

立政治大學

‧

Na tiona

l Ch engchi University

圖 4.8 摘要內容在文章中的標註（II）

4.2 決定關鍵詞彙介陎

使用者在利用一般檢索模式或邏輯檢索模式檢索出符合檢索條件的文獻列表後，使用者就能從文獻列表中選擇欲擷取「準詞彙」的文獻摘要集合，如圖 4.9 所示，文獻列表中有被擷取出摘要的文獻都能提供讓使用者勾選，使用者勾選完所有想要擷取「準詞彙」

的文獻摘要後，就可以到畫陎最下方按確定並送出，如圖 4.10 所示。

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

圖 4.9 文獻摘要勾選（I）

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

圖 4.10 文獻摘要勾選（II）

使用者勾選完欲擷取「準詞彙」的文獻摘要集合並送出後，接著系統會詢問使用者欲擷取的最大「準詞彙」長度，系統能提供擷取的「準詞彙」長度為二字詞到八字詞，

也就是說在擷取「準詞彙」時，最少要從由兩個字所組成的二字詞開始擷取，而最多能擷取到由八個字所組成的八字詞，如圖 4.11 所示，在此例中使用者決定欲擷取的最大「準詞彙」長度為 5，所以系統在擷取「準詞彙」時，會由二字詞擷取到五字詞，使用者決

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

定好欲擷取的最大「準詞彙」長度後，系統便會利用 PAT Tree 的程式，從使用者所選擇欲做「準詞彙」擷取的文獻摘要集合內容，開始擷取「準詞彙」。

圖 4.11 決定欲擷取的最大「準詞彙」長度

擷取好「準詞彙」後，系統便會建立出「準詞彙」列表供使用者檢視，如圖 4.12 所示，列表中會列出每個「準詞彙」和其詞頻，詞頻即為每個「準詞彙」在使用者選擇的所有文獻摘要集合內容裡，總共出現過的次數，「準詞彙」列表的排序標準預設是照

「準詞彙」的長度作排序，從二字詞依序顯示到使用者設定的最長字詞，使用者可以從

「準詞彙」列表中決定哪些是與自己欲研究的歷史觀念或議題相關的專業關鍵詞彙。

圖 4.12 「準詞彙」列表介陎（I）

‧

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

圖 4.13 「準詞彙」的前後文章段落列表

圖 4.14 標註「準詞彙」和檢索詞彙的文獻摘要內容

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

圖 4.15 「準詞彙」列表介陎（II）

另外，系統還提供了照「準詞彙」的詞頻作排序的功能，使用者只頇點選「照詞頻排序」的按鈕，如圖 4.16 所示，即可切換成照「準詞彙」的詞頻作排序，「準詞彙」列表中會從詞頻高的「準詞彙」依序顯示到詞頻低的「準詞彙」，如圖 4.17 所示，且能透過此按鈕隨時切換兩種排序標準。系統也提供了讓使用者下載「準詞彙」列表的功能，

使用者點選「下載準詞彙列表」的按鈕後，如圖 4.16 所示，即能將「準詞彙」列表裡的每個「準詞彙」和其詞頻下載成 csv 檔案，如圖 4.18 所示。

圖 4.16 照詞頻排序和下載「準詞彙」列表之按鈕介陎

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

圖 4.17 「準詞彙」列表介陎（III）

圖 4.18 下載成 csv 檔案的「準詞彙」列表

另外，系統的過濾詞機制讓每個使用者帳號有專屬於個人的過濾詞集，並且能夠針對個人的過濾詞集做新增或刪除，系統會利用過濾詞集裡的所有過濾詞對「準詞彙」做過濾，排除掉含有過濾詞之「準詞彙」。使用者點選「過濾詞設定」後就能看到目前個人的過濾詞列表，如圖 4.19 所示，系統會排除掉含有過濾詞之「準詞彙」，若想要新增

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

過濾詞則可以點選「新增過濾詞」的按鈕，就可以開始新增想要的過濾詞，如圖 4.20 所示，每次可新增 5 個過濾詞，按下確定送出後系統會先和使用者確認欲新增的過濾詞有哪些，如圖 4.21 所示，使用者若覺得沒問題後，按下確定，就會在個人的過濾詞列表中加入欲新增的過濾詞，如圖 4.22 所示。若想取消的話則點選「重新輸入」的按鈕可以重新輸入過濾詞。

針對使用者專屬於個人的過濾詞集，系統還有提供刪除過濾詞的功能，使用者點選

「刪除過濾詞」的按鈕後，會先看到目前個人帳號底下的過濾詞集，接著即可勾選列表中之過濾詞進行刪除，如圖 4.23 所示；另外，系統也有提供刪除關鍵詞彙的功能，使用者點選「刪除關鍵詞彙」的按鈕後，會先看到目前個人帳號底下已決定好的所有關鍵詞彙之列表，接著即可勾選列表中之關鍵詞彙進行刪除，如圖 4.24 所示。

圖 4.19 設定過濾詞介陎

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

圖 4.20 新增過濾詞介陎

圖 4.21 確認欲新增的過濾詞介陎

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

圖 4.22 過濾詞新增完成

圖 4.23 刪除過濾詞的介陎

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

圖 4.24 刪除關鍵詞彙的介陎 4.3 繪製時序分佈圖介陎

系統提供使用者繪製兩個類型的時序分佈圖：字數時序分佈圖、關鍵詞彙時序分佈圖。

使用者可以根據欲繪製的分佈圖類型點選其按鈕，如圖 4.25 所示。文獻集合字數分佈圖會繪製出文獻集合在每個年份下的文獻總字數相對於文獻集合裡的全部文獻總字數之比例。如圖 4.26 所示。

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

圖 4.25 選擇時序分佈圖類型之按鈕介陎

圖 4.26 文獻集合的字數分佈圖（II）

圖 4.27 摘要集合的字數分佈圖（II）

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

摘要集合字數分佈圖會繪製出文獻摘要集合在每個年份下的摘要總字數相對於文獻摘要集合裡的全部摘要總字數之比例，如圖 4.27 所示。關鍵詞彙的時序分佈圖則會先請使用者決定計算的時間基準和分析的方法，如圖 4.28 所示，接著再選擇是想針對單一關鍵詞彙或是兩個關鍵詞彙所組成的關鍵詞組來進行分析，如圖 4.29 所示，畫陎上方會顯示使用者目前繪製分佈圖的時間基準和分析的方法。

圖 4.28 繪製分佈圖的設定介陎

圖 4.29 選擇分析關鍵詞彙或關鍵詞組的設定介陎

針對單一關鍵詞彙進行分析時會先請使用者從已決定好的關鍵詞彙之列表中，選擇想分析的關鍵詞彙，如圖 4.30 所示，接著就會讓使用者決定是想直接查看分佈圖或是將分佈圖的時間分佈數據下載成 csv 檔案，另外也能重新選擇想分析的關鍵詞彙，如圖 4.31 所示，繪製出的分佈圖如圖 4.32 所示，將分佈圖的時間分佈數據下載成 csv 檔案的內容如圖 4.33 所示。

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

圖 4.30 關鍵詞彙列表介陎

圖 4.31 欲分析的關鍵詞彙之列表

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

圖 4.32 單一關鍵詞彙的時序分佈圖

圖 4.33 下載成 csv 檔案的單一關鍵詞彙時間分佈數據

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

針對關鍵詞組進行分析時，則會先請使用者決定想分析的關鍵詞組，其共同出現次數至少要幾次，如圖 4.34 所示，此範例中使用者指定想看共同出現次數在 20 次以上的關鍵詞組，系統即會列出共同出現次數在 20 次以上的關鍵詞組列表，如圖 4.35 所示。

圖 4.34 設定共同出現的最低次數介陎

圖 4.35 關鍵詞組列表介陎

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

使用者可以點選每個關鍵詞組所屬的「修改」連結，系統即會列出該關鍵詞組在文獻集合或文獻摘要集合裡陎曾經共同出現時的所有文章段落，如圖 4.36 所示，使用者可以對認為不具意義的共同出現次數進行勾選並刪除，而列表內的共同出現段落可以點選進去，系統會標註出該共同出現段落在整篇文章內容中的位置，如圖 4.37 所示。

圖 4.36 關鍵詞組共同出現的文章段落列表介陎

圖 4.37 關鍵詞組共同出現的段落在整篇文章內容中的標註

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

在修改完關鍵詞組的共同出現次數後，使用者選擇好想分析的關鍵詞組，接著就能決定是要直接查看分佈圖或是將分佈圖的時間分佈數據下載成 csv 檔案，另外也能重新選擇想分析的關鍵詞組，如圖 4.38 所示。繪製出的分佈圖如圖 4.39 所示，將分佈圖的時間分佈數據下載成 csv 檔案的內容如圖 4.40 所示。

圖 4.38 欲分析的關鍵詞組之列表

圖 4.39 關鍵詞組的時序分佈圖

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

圖 4.40 下載成 csv 檔案的關鍵詞組時間分佈數據

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

5. 第五章系統演進與使用者評估

在本章會針對我們的檢索系統，說明系統開發設計的演進以及使用者在實際使用過系統後的評估，5.1 節介紹系統演進；5.2 節介紹使用者對系統的評估結果；5.3 節整理出使用者對系統的建議。

5.1 系統演進

為了讓文史研究者真正能透過本系統輔助進行文史研究，而不是只單從資訊科學的角度去設計系統的各項功能，卻忽略了文史研究者實際的需求，所以我們在系統設計階段，

與文史研究者就系統功能陎進行了多次的溝通討論，以下會說明我們的系統在各個不同階段中，功能設計的演進過程。

在系統最初設計的階段，我們暫時只有從資訊科學的角度來建構整個系統的基本架構，所以只有一些初步的輪廓，大部份的功能都還不完善，且對於文史研究的輔助性還不顯著。檢索功能只提供了一般檢索模式，使用者無法利用多個檢索詞彙的邏輯組合對文獻進行檢索，只能檢索出曾經有在同個摘要視窗大小中一起出現檢索詞彙的文獻，並且尚無法讓使用者自行決定欲擷取的摘要視窗大小，只能強制擷取前後 50 字的文章段落；在決定關鍵詞彙相關功能的部份，也不能設定欲擷取的最大「準詞彙」長度，而是固定擷取二字詞到五字詞，過濾詞的部份固定只過濾特定的漢文語法虛詞：之、乎、且、

‧

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

建議 4：在「準詞彙」列表內，可以考慮將每個「準詞彙」照詞性排序，如：名詞、動詞、形容詞等。

回答：這部份難度較高，因為要先對每個「準詞彙」進行詞性的判斷，這需要進行到文法剖析的層次，加上系統提供檢索的資料都是歷史文獻，目前比較沒有能夠針對歷史文

在文檔中中國近現代思想及文學史資料庫檢索系統 - 政大學術集成 (頁 81-0)

決定關鍵詞彙介陎

4. 第四章 系統功能及介陎

4.2 決定關鍵詞彙介陎

國

立 政 治 大 學

‧

‧ 國

立 政 治 大 學

‧

‧ 國

立 政 治 大 學

‧

‧ 國

立 政 治 大 學

‧

‧

‧ 國

立 政 治 大 學

‧

‧ 國

立 政 治 大 學

‧

‧ 國

立 政 治 大 學

‧

‧ 國

立 政 治 大 學

‧

‧ 國

立 政 治 大 學

‧

‧ 國

立 政 治 大 學

‧

‧ 國

立 政 治 大 學

‧

‧ 國

立 政 治 大 學

‧

‧ 國

立 政 治 大 學

‧

‧ 國

立 政 治 大 學

‧

‧ 國

立 政 治 大 學

‧

‧ 國

立 政 治 大 學

‧

‧ 國

立 政 治 大 學

‧

‧ 國

立 政 治 大 學

‧

‧ 國

立 政 治 大 學

‧

‧ 國

立 政 治 大 學

‧

‧

‧

‧

‧

‧

‧

‧

‧

‧ 國

立 政 治 大 學

‧

4. 第四章系統功能及介陎

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學