4. 第四章 系統功能及介陎
4.2 決定關鍵詞彙介陎
國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
67
圖 4.8 摘要內容在文章中的標註(II)
4.2 決定關鍵詞彙介陎
使用者在利用一般檢索模式或邏輯檢索模式檢索出符合檢索條件的文獻列表後,使用者 就能從文獻列表中選擇欲擷取「準詞彙」的文獻摘要集合,如圖 4.9 所示,文獻列表中 有被擷取出摘要的文獻都能提供讓使用者勾選,使用者勾選完所有想要擷取「準詞彙」
的文獻摘要後,就可以到畫陎最下方按確定並送出,如圖 4.10 所示。
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
68
圖 4.9 文獻摘要勾選(I)
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
69
圖 4.10 文獻摘要勾選(II)
使用者勾選完欲擷取「準詞彙」的文獻摘要集合並送出後,接著系統會詢問使用者 欲擷取的最大「準詞彙」長度,系統能提供擷取的「準詞彙」長度為二字詞到八字詞,
也就是說在擷取「準詞彙」時,最少要從由兩個字所組成的二字詞開始擷取,而最多能 擷取到由八個字所組成的八字詞,如圖 4.11 所示,在此例中使用者決定欲擷取的最大「準 詞彙」長度為 5,所以系統在擷取「準詞彙」時,會由二字詞擷取到五字詞,使用者決
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
70
定好欲擷取的最大「準詞彙」長度後,系統便會利用 PAT Tree 的程式,從使用者所選擇 欲做「準詞彙」擷取的文獻摘要集合內容,開始擷取「準詞彙」。
圖 4.11 決定欲擷取的最大「準詞彙」長度
擷取好「準詞彙」後,系統便會建立出「準詞彙」列表供使用者檢視,如圖 4.12 所示,列表中會列出每個「準詞彙」和其詞頻,詞頻即為每個「準詞彙」在使用者選擇 的所有文獻摘要集合內容裡,總共出現過的次數,「準詞彙」列表的排序標準預設是照
「準詞彙」的長度作排序,從二字詞依序顯示到使用者設定的最長字詞,使用者可以從
「準詞彙」列表中決定哪些是與自己欲研究的歷史觀念或議題相關的專業關鍵詞彙。
圖 4.12 「準詞彙」列表介陎(I)
‧
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
72
圖 4.13 「準詞彙」的前後文章段落列表
圖 4.14 標註「準詞彙」和檢索詞彙的文獻摘要內容
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
73
圖 4.15 「準詞彙」列表介陎(II)
另外,系統還提供了照「準詞彙」的詞頻作排序的功能,使用者只頇點選「照詞頻 排序」的按鈕,如圖 4.16 所示,即可切換成照「準詞彙」的詞頻作排序,「準詞彙」列 表中會從詞頻高的「準詞彙」依序顯示到詞頻低的「準詞彙」,如圖 4.17 所示,且能透 過此按鈕隨時切換兩種排序標準。系統也提供了讓使用者下載「準詞彙」列表的功能,
使用者點選「下載準詞彙列表」的按鈕後,如圖 4.16 所示,即能將「準詞彙」列表裡的 每個「準詞彙」和其詞頻下載成 csv 檔案,如圖 4.18 所示。
圖 4.16 照詞頻排序和下載「準詞彙」列表之按鈕介陎
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
74
圖 4.17 「準詞彙」列表介陎(III)
圖 4.18 下載成 csv 檔案的「準詞彙」列表
另外,系統的過濾詞機制讓每個使用者帳號有專屬於個人的過濾詞集,並且能夠針 對個人的過濾詞集做新增或刪除,系統會利用過濾詞集裡的所有過濾詞對「準詞彙」做 過濾,排除掉含有過濾詞之「準詞彙」。使用者點選「過濾詞設定」後就能看到目前個 人的過濾詞列表,如圖 4.19 所示,系統會排除掉含有過濾詞之「準詞彙」,若想要新增
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
75
過濾詞則可以點選「新增過濾詞」的按鈕,就可以開始新增想要的過濾詞,如圖 4.20 所示,每次可新增 5 個過濾詞,按下確定送出後系統會先和使用者確認欲新增的過濾詞 有哪些,如圖 4.21 所示,使用者若覺得沒問題後,按下確定,就會在個人的過濾詞列表 中加入欲新增的過濾詞,如圖 4.22 所示。若想取消的話則點選「重新輸入」的按鈕可以 重新輸入過濾詞。
針對使用者專屬於個人的過濾詞集,系統還有提供刪除過濾詞的功能,使用者點選
「刪除過濾詞」的按鈕後,會先看到目前個人帳號底下的過濾詞集,接著即可勾選列表 中之過濾詞進行刪除,如圖 4.23 所示;另外,系統也有提供刪除關鍵詞彙的功能,使用 者點選「刪除關鍵詞彙」的按鈕後,會先看到目前個人帳號底下已決定好的所有關鍵詞 彙之列表,接著即可勾選列表中之關鍵詞彙進行刪除,如圖 4.24 所示。
圖 4.19 設定過濾詞介陎
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
76
圖 4.20 新增過濾詞介陎
圖 4.21 確認欲新增的過濾詞介陎
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
77
圖 4.22 過濾詞新增完成
圖 4.23 刪除過濾詞的介陎
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
78
圖 4.24 刪除關鍵詞彙的介陎 4.3 繪製時序分佈圖介陎
系統提供使用者繪製兩個類型的時序分佈圖:字數時序分佈圖、關鍵詞彙時序分佈圖。
使用者可以根據欲繪製的分佈圖類型點選其按鈕,如圖 4.25 所示。文獻集合字數分佈圖 會繪製出文獻集合在每個年份下的文獻總字數相對於文獻集合裡的全部文獻總字數之 比例。如圖 4.26 所示。
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
79
圖 4.25 選擇時序分佈圖類型之按鈕介陎
圖 4.26 文獻集合的字數分佈圖(II)
圖 4.27 摘要集合的字數分佈圖(II)
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
80
摘要集合字數分佈圖會繪製出文獻摘要集合在每個年份下的摘要總字數相對於文 獻摘要集合裡的全部摘要總字數之比例,如圖 4.27 所示。關鍵詞彙的時序分佈圖則會先 請使用者決定計算的時間基準和分析的方法,如圖 4.28 所示,接著再選擇是想針對單一 關鍵詞彙或是兩個關鍵詞彙所組成的關鍵詞組來進行分析,如圖 4.29 所示,畫陎上方會 顯示使用者目前繪製分佈圖的時間基準和分析的方法。
圖 4.28 繪製分佈圖的設定介陎
圖 4.29 選擇分析關鍵詞彙或關鍵詞組的設定介陎
針對單一關鍵詞彙進行分析時會先請使用者從已決定好的關鍵詞彙之列表中,選擇 想分析的關鍵詞彙,如圖 4.30 所示,接著就會讓使用者決定是想直接查看分佈圖或是將 分佈圖的時間分佈數據下載成 csv 檔案,另外也能重新選擇想分析的關鍵詞彙,如圖 4.31 所示,繪製出的分佈圖如圖 4.32 所示,將分佈圖的時間分佈數據下載成 csv 檔案的內容 如圖 4.33 所示。
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
81
圖 4.30 關鍵詞彙列表介陎
圖 4.31 欲分析的關鍵詞彙之列表
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
82
圖 4.32 單一關鍵詞彙的時序分佈圖
圖 4.33 下載成 csv 檔案的單一關鍵詞彙時間分佈數據
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
83
針對關鍵詞組進行分析時,則會先請使用者決定想分析的關鍵詞組,其共同出現次 數至少要幾次,如圖 4.34 所示,此範例中使用者指定想看共同出現次數在 20 次以上的 關鍵詞組,系統即會列出共同出現次數在 20 次以上的關鍵詞組列表,如圖 4.35 所示。
圖 4.34 設定共同出現的最低次數介陎
圖 4.35 關鍵詞組列表介陎
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
84
使用者可以點選每個關鍵詞組所屬的「修改」連結,系統即會列出該關鍵詞組在文 獻集合或文獻摘要集合裡陎曾經共同出現時的所有文章段落,如圖 4.36 所示,使用者可 以對認為不具意義的共同出現次數進行勾選並刪除,而列表內的共同出現段落可以點選 進去,系統會標註出該共同出現段落在整篇文章內容中的位置,如圖 4.37 所示。
圖 4.36 關鍵詞組共同出現的文章段落列表介陎
圖 4.37 關鍵詞組共同出現的段落在整篇文章內容中的標註
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
85
在修改完關鍵詞組的共同出現次數後,使用者選擇好想分析的關鍵詞組,接著就能 決定是要直接查看分佈圖或是將分佈圖的時間分佈數據下載成 csv 檔案,另外也能重新 選擇想分析的關鍵詞組,如圖 4.38 所示。繪製出的分佈圖如圖 4.39 所示,將分佈圖的 時間分佈數據下載成 csv 檔案的內容如圖 4.40 所示。
圖 4.38 欲分析的關鍵詞組之列表
圖 4.39 關鍵詞組的時序分佈圖
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
86
圖 4.40 下載成 csv 檔案的關鍵詞組時間分佈數據
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
87
5. 第五章 系統演進與使用者評估
在本章會針對我們的檢索系統,說明系統開發設計的演進以及使用者在實際使用過系統 後的評估,5.1 節介紹系統演進;5.2 節介紹使用者對系統的評估結果;5.3 節整理出使 用者對系統的建議。
5.1 系統演進
為了讓文史研究者真正能透過本系統輔助進行文史研究,而不是只單從資訊科學的角度 去設計系統的各項功能,卻忽略了文史研究者實際的需求,所以我們在系統設計階段,
與文史研究者就系統功能陎進行了多次的溝通討論,以下會說明我們的系統在各個不同 階段中,功能設計的演進過程。
在系統最初設計的階段,我們暫時只有從資訊科學的角度來建構整個系統的基本架 構,所以只有一些初步的輪廓,大部份的功能都還不完善,且對於文史研究的輔助性還 不顯著。檢索功能只提供了一般檢索模式,使用者無法利用多個檢索詞彙的邏輯組合對 文獻進行檢索,只能檢索出曾經有在同個摘要視窗大小中一起出現檢索詞彙的文獻,並 且尚無法讓使用者自行決定欲擷取的摘要視窗大小,只能強制擷取前後 50 字的文章段 落;在決定關鍵詞彙相關功能的部份,也不能設定欲擷取的最大「準詞彙」長度,而是 固定擷取二字詞到五字詞,過濾詞的部份固定只過濾特定的漢文語法虛詞:之、乎、且、
‧
‧
‧
‧
‧
‧
‧
‧
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
96
建議 4:在「準詞彙」列表內,可以考慮將每個「準詞彙」照詞性排序,如:名詞、動 詞、形容詞等。
回答:這部份難度較高,因為要先對每個「準詞彙」進行詞性的判斷,這需要進行到文 法剖析的層次,加上系統提供檢索的資料都是歷史文獻,目前比較沒有能夠針對歷史文
回答:這部份難度較高,因為要先對每個「準詞彙」進行詞性的判斷,這需要進行到文 法剖析的層次,加上系統提供檢索的資料都是歷史文獻,目前比較沒有能夠針對歷史文