• 沒有找到結果。

自動化主題分析於圖書資訊領域之應用

N/A
N/A
Protected

Academic year: 2021

Share "自動化主題分析於圖書資訊領域之應用"

Copied!
108
0
0

加載中.... (立即查看全文)

全文

(1)國立臺灣師範大學圖書資訊學研究所 圖書資訊學在職專班碩士學位論文. 指導教授:曾 元 顯 博士. 自動化主題分析於圖書資訊領域之應用 Automatic Subject Analysis in Library and Information Science in Taiwan. 研究生:湯 秋 蓉 撰. 中 華 民 國 九 十 八 年 八 月 i.

(2) 自動化主題分析於圖書資訊領域之應用 Automatic Subject Analysis in Library and Information Science in Taiwan 關鍵詞:主題分析,自動歸類,主題歸類,群聚分析 Keywords: Subject Analysis, Cluster Analysis 中文摘要: 本研究旨在利用資訊自動化歸類的主題萃取系統,以臺灣地區圖 書資訊學領域的學位論文與期刊文獻為研究範疇,進行研究主題的自 動化歸類。 研究文件收錄國家圖書館「全國博碩士論文資料庫」中 9 所大學 院校圖書資訊學系所共 912 篇學位論文,以及「中文期刊篇目影像系 統」中圖書資訊學期刊 15 種共 3,128 筆期刊文獻。透過主題萃取系 統的文件共現字主題歸類分析,採取不限定分類架構、體系表的方 式,以自由詞彙的方式取得研究主題,將學位論文歸類出 14 個研究 主題,以及期刊文獻歸類出 17 個研究主題。 研究發現自動主題分析可達到與人工歸類相同的分析成效,減輕 人工歸類的工作量負擔;可以讓此學門初入門的研究人員對於此領域 可以迅速且透徹的瞭解;可以讓後續研究者對圖書資訊學未來研究方 向、研究發展重點的有所參考;亦可以即時反應新興研究主題。. ii.

(3) 目次 第一章 緒論.................................................................................................. 1 第一節 研究動機..........................................................................................1 第二節 研究目的與問題..............................................................................2 第三節 研究範圍與限制..............................................................................3 第四節 名詞解釋..........................................................................................5 第二章 文獻分析.......................................................................................... 7 第一節 臺灣地區圖書資訊學研究範疇之文獻探析..................................7 第二節 主題分析之研究方法....................................................................17 第三節 主題分類表之制定........................................................................20 第四節 自動歸類方法................................................................................31 第三章 研究設計與實施............................................................................ 34 第一節 研究架構........................................................................................34 第二節 研究工具........................................................................................35 第三節 研究對象........................................................................................36 第四節 研究實施步驟................................................................................39 第四章 研究結果與分析............................................................................ 48 第一節 學位論文之自動歸類研究結果....................................................48 第二節 期刊文獻之自動歸類之研究結果................................................67 第三節 主題分析研究結果之比較............................................................93 第五章 研究發現與建議............................................................................ 97 第一節 研究發現........................................................................................97 第二節 研究建議........................................................................................99 參考書目......................................................................................................... 100. i.

(4) 表次 表 2-1 臺灣地區圖書資訊學相關研究 ............................................................ 7 表 2-5 臺灣地區圖書資訊學學位論文研究主題分析結果 .......................... 13 表 2-6 臺灣地區圖書資訊學期刊文獻研究主題分析結果 .......................... 15 表 2-7 施孟雅提出之圖書資訊學研究主題分類架構表 .............................. 22 表 2-8 楊美華提出之圖書資訊學文獻類目表 .............................................. 23 表 2-9 鄭麗敏使用之圖書資訊學期刊論文研究主題分類表 ...................... 27 表 2-10 吳美美期刊文獻研究主題分類表 .................................................... 28 表 2-11 羅思嘉等人建立之主題分類表 ........................................................ 28 表 3-1 臺灣地區圖書資訊學學位論文數量統計一覽表 .............................. 36 表 3-2 臺灣地區圖書資訊學期刊文獻出版刊名變更表 .............................. 37 表 4-1 自動歸類之學位論文研究主題一覽表 .............................................. 65 表 4-2 學位論文研究主題與自動歸類群組號碼一覽表 .............................. 66 表 4-3 學位論文研究主題時間序列斜率數據一覽表 .................................. 67 表 4-4 期刊文獻研究主題與自動歸類群組號碼一覽表 .............................. 88 表 4-5 期刊文獻研究主題與主題關鍵詞一覽表一覽表 .............................. 89 表 4-6 期刊文獻研究主題與發表年代篇數一覽表 ...................................... 91 表 4-7 期刊文獻趨勢成長較明顯的主題一覽表 .......................................... 92 表 4-8 期刊文獻趨勢成長趨緩的主題一覽表 .............................................. 92. ii.

(5) 圖次 圖 3-1 臺灣地區圖書資訊學學位論文數量一覽表 ...................................... 41 圖 3-2 臺灣地區圖書資訊學期刊文獻數量一覽表 ...................................... 43 圖 3-3 共現字分析示意圖 .............................................................................. 44 圖 3-4 多階層歸類示意圖 .............................................................................. 45 圖 3-5 主題偵測歸類結果呈現範例 .............................................................. 46 圖 3-6 學位論文歸類結果主題地圖呈現範例 .............................................. 46 圖 3-7 主題詞彙與相關論文標題呈現範例 .................................................. 47 圖 4-1 學位論文出版數量統計 ...................................................................... 48 圖 4-2 學位論文主題歸類 S2,0.02 主題地圖示意圖 .................................. 50 圖 4-3 學位論文主題 1 之時間序列圖 ......................................................... 51 圖 4-4 學位論文主題 2 之時間序列圖 ......................................................... 52 圖 4-5 學位論文主題 3 之時間序列圖 ......................................................... 53 圖 4-6 學位論文主題 4 之時間序列圖 ......................................................... 54 圖 4-7 學位論文主題 5 之時間序列圖 ......................................................... 55 圖 4-8 學位論文主題 6 之時間序列圖 ......................................................... 56 圖 4-9 學位論文主題 7 之時間序列圖 ......................................................... 57 圖 4-10 學位論文主題 8 之時間序列圖 ....................................................... 58 圖 4-11 學位論文主題 9 之時間序列圖 ....................................................... 59 圖 4-12 學位論文主題 10 之時間序列圖 ..................................................... 60 圖 4-13 學位論文主題 11 之時間序列圖 ..................................................... 61 圖 4-14 學位論文主題 12 之時間序列圖 ..................................................... 62 圖 4-15 學位論文主題 13 之時間序列圖 ..................................................... 63 圖 4-16 學位論文主題 14 之時間序列圖 ..................................................... 64 圖 4-17 期刊文獻出版數量統計 .................................................................... 68 圖 4-18 期刊文獻歸類結果主題地圖呈現範例 ............................................ 69 圖 4-19 期刊文獻主題歸類 S1,0.1 主題地圖示意圖 .................................. 70 圖 4-20 期刊文獻主題 1 之時間序列圖 ....................................................... 71 圖 4-21 期刊文獻主題 2 之時間序列圖 ....................................................... 72 圖 4-22 期刊文獻主題 3 之時間序列圖 ....................................................... 73 圖 4-23 期刊文獻主題 4 之時間序列圖 ....................................................... 75 圖 4-24 期刊文獻主題 5 之時間序列圖 ....................................................... 76 圖 4-25 期刊文獻主題 6 之時間序列圖 ....................................................... 77 圖 4-26 期刊文獻主題 7 之時間序列圖 ....................................................... 78 圖 4-27 期刊文獻主題 8 之時間序列圖 ....................................................... 79 圖 4-28 期刊文獻主題 9 之時間序列圖 ....................................................... 80 圖 4-29 期刊文獻主題 10 之時間序列圖 ..................................................... 81 圖 4-30 期刊文獻主題 11 之時間序列圖 ..................................................... 82 圖 4-31 期刊文獻主題 12 之時間序列圖 ..................................................... 83 圖 4-32 期刊文獻主題 13 之時間序列圖 ..................................................... 84 圖 4-33 期刊文獻主題 14 之時間序列圖 ..................................................... 85 圖 4-34 期刊文獻主題 15 之時間序列圖 ..................................................... 86 圖 4-35 期刊文獻主題 16 之時間序列圖 ..................................................... 87 iii.

(6) 圖 4-36 期刊文獻主題 17 之時間序列圖 ..................................................... 88. iv.

(7) 第一章 第一節. 緒論 研究動機. 資訊科技與網路通訊技術迅速發展,全球進入資訊產業時代。資訊產品及與 數位化資源的普及應用,促使學術研究交流與傳播迅速、取得研究文獻管道變得 容易,學術研究文獻數量也有成長的趨勢。圖書資訊學既定的知識架構、主題類 目,無法確切而即時的更新研究主題資訊、發展中主題概念及整體系統知識架 構,以提供學術研究人員在短時間內得到領域知識的初步概念,迅速找出明確的 主題,做為往後研究重點與未來研究發展的參考。. 研究者在進行學術研究時,必須先對該領域之相關主題作一番前置研究與探 討,以瞭解欲進行主題的可研究性與研究方向。藉此前置研究程序,一方面可避 免與他人研究重複,造成研究成本的耗費;另一方面,可得知發展中及新興的研 究議題與方向。學術研究論文所引用的文獻可視為研究活動的學術紀錄,經由此 管道可以得知一個學門的學術研究主題及重心。透過引用文獻分析法,研究者可 以瞭解某種學科領域的發展現況、學科領域內文獻使用的特性、確知彼此間的關 聯性,以及學科領域研究的未來發展趨勢等優點(陳光華、陳雅琦,2001)。. 而隨著時代的不同,各時期的研究典範、研究取向、研究趨勢也有所不同, 因此,有必要仔細地檢視國內的圖書資訊學研究。要深入瞭解領域的研究發展, 其方法之一就是對該領域所發表的文獻進行分析與分類。透過對發表文獻的分析 與分類,歸納出該研究領域的研究範圍、議題以及在不同階段的發展重心(羅思 嘉、陳光華、林純如,2001)。無論任何學科領域,學術文獻是記錄領域主題知 識的主要媒介。因此透過恰當的文獻評量與分析,我們得以鑑往知來,瞭解過去 研究者的研究結果及重點,思考研究方向或預測未來趨勢。. 檢視過往臺灣地區圖書資訊學研究文獻,發現多數研究對象取材範圍受限於 時間及人力因素的考量,只能以統計抽樣法取樣部分文獻或閱讀題名的方法進行 1.

(8) 學科引用與主題類表的分析,無法進行文獻深入的分析探討。而電子化全文資料 大量增加及其取得環境的改變,資訊計量學可以分析大量的文獻集合,可以直接 利用電腦量測、統計並分析全文,跳脫以前只能分析句子的局面而躍昇至以全文 為分析的範疇(蔡明月,2004)。. 因此,本研究擬以臺灣地區圖書資訊學領域為研究範疇,利用資訊自動化歸 類的模式,歸類臺灣地區圖書資訊學的研究主題,期望找出以適當的自動化歸類 解讀分析方法,達到與人工歸類相同的分析成效,減輕人工歸類的工作量負擔; 並期望對此學門初入門的研究人員可以有迅速且透徹的瞭解,並且讓後續研究者 對圖書資訊學未來研究方向、研究發展重點的有所參考。. 第二節. 研究目的與問題. 鑒於人工審視分類的分析方法易流於主觀意識,或受限於人力與時間不足的 因素,難以有持續性及一致性的進行分析整理工作。本研究擬運用一套自動化分 析模式與方法,進行圖書資訊學研究主題與發展趨勢分析。透過研究資料(文件 集)的自動化分析模式,可以做一全面性地、持續性地長期觀察圖書資訊學領域 的研究主題與發展趨勢。運用自動分析模式,也可以印證學者專家的研究脈絡, 讓出入門者或是本身為非圖書資訊學領域的研究者,對於圖書資訊學的研究主題 與發展趨勢提供快速且有整體性的基本參考。. 本研究試圖採用自動化方法,探討臺灣地區圖書資訊學研究主題。本研究以 全國博碩士論文資訊網收錄的圖書資訊學學位論文及期刊文獻資訊網之中文期 刊篇目索引影像系統收錄的期刊文獻資料為研究對象,擬透過自動化主題判斷與 歸類方式產生研究主題詞彙,瞭解圖書資訊學研究主題與可能的發展趨勢,也可 以與人工審視分類研究主題比較研究結果的差異。針對臺灣圖書資訊學的研究主 題分析與發展趨勢,本論文目的與待答問題如下:. 一、 瞭解圖書資訊學領域文獻的研究主題. 2.

(9) 藉由自動化模式,以詞彙歸類方式,分析出圖書資訊學研究領域之學位論文 及期刊文獻的關鍵詞詞彙、依據自動萃取的關鍵詞,將文件歸類,推測研究主題, 以期對臺灣圖書資訊學領域的研究主題有所瞭解,主要研究問題如下: 1、 探討自動萃取主題的歸類特性為何? 2、 以自動化模式分析得到的研究主題為何?. 二、 探討圖書資訊學領域的研究變化 藉由自動化主題歸類的模式,探討圖書資訊學研究領域之學位論文及期刊文 獻的研究主題年代分布、主題發展曲線,以期對臺灣圖書資訊學領域研究主題的 未來研究方向、研究發展重點的有所瞭解,主要研究問題如下: 1、 研究主題的發表篇數其年代分佈為何? 2、 研究主題的趨勢演變為何?. 三、 比較自動歸類與人工歸類之主題分析研究結果 透過自動化分析歸類得出的主題分析結果與以往人工審視歸類文獻主題分 析研究結果作一比較,探討自動化歸類與人工審視歸類所得出的文獻研究主題的 差異。以下列點陳述主要研究問題: 1、 自動歸類分析與以往研究者以人工分類方式所取得的研究主題各為何? 2、 研究主題分析的異同為何?. 第三節. 研究範圍與限制. 中華民國九十五年圖書館年鑑中對於臺灣圖書資訊學研究之文獻分析,以專 書、學位論文、期刊文獻及政府研究計畫報告等四種資料類型做為分析對象(楊 美華,2007)。四種資料類型中,以期刊文獻較具有學術研究成果新穎性與多元 性的特質,學科研究的變化與趨勢可由期刊發表文章題名變化中窺探出端倪;而 期刊亦為研究論文較常被引用的文獻類型之一。因此,本研究設定以臺灣地區圖 書資訊學範疇所發表的學位論文與期刊文獻為研究範圍。 3.

(10) 一、 學位論文部分 學位論文分為博士論文與碩士論文兩種。博士論文以臺灣大學博士班博士論 文為研究範圍。碩士論文以臺灣地區有開設圖書資訊學相關研究所課程的碩士論 文為研究範圍。共有9所大學院校系所(國立臺灣大學、輔仁大學、淡江大學、 國立政治大學、國立中興大學、世新大學、國立臺灣師範大學、國立交通大學、 中國文化大學)。. 學位論文收錄原則與限制,如下: 1、 資料內容方面,是以學校之學年度為主,起迄時間目前為45~95學年度 的學位論文為研究範圍。 2、 資料來源方面, 87 學年度以前各校所轉送到國家圖書館的的Dos 版論 文摘要建檔磁片有數量不全、資料內容格式錯誤或損壞等問題,本研究 僅以檔案完整的學位論文為研究範圍。 3、 僅列入以中文書寫之論文為研究範圍。 符合上述項目之學位論文資料,即為本研究進行臺灣地區圖書資訊學主題分析的 研究範圍。. 二、 期刊文獻部分 根據楊美華於民國95年發表的「圖書資訊學研究」一文中,對於臺灣地區期 刊文獻出版狀況的彙整結果,圖書資訊學領域的相關期刊約有37種,其中目前仍 有持續出版的約有33種,國家圖書館「中文期刊篇目影像系統」收錄有29種,開 放電子全文下載的有23種。楊美華(民95)選定了15種圖書資訊學期刊作為分析 對象。本研究與其做相同的選擇,以該15種期刊為研究範圍。. 期刊題名分別為大學圖書館、中華民國圖書館學會會報、佛教圖書館館刊、 美國資訊科學與技術學會台北學生分會會訊、國立中央圖書館臺灣分館館刊、國 立成功大學圖書館館刊、國家圖書館館刊、教育資料與圖書館學、資訊傳播與圖 4.

(11) 書館學、圖書與資訊學刊、圖書資訊學刊、圖書館學刊(輔大)、圖書館學與資訊 科學、臺北市立圖書館館訊、檔案季刊。. 期刊收錄原則與限制,如下: 1、 舉凡期刊收錄的研究性文章列入研究範圍。 2、 期刊刊名若有更名或同一出版者更名後另起卷期者,歸為同一刊物,列 入研究範圍。 3、 期刊中的廣告、謝辭、新聞、編者的話、信函、書目、會議消息、會議 記錄、大事記、出版消息等非研究性文章,不列入研究範圍。 4、 僅列入以中文書寫之文章為研究範圍。 符合上述項目之文獻資料,即為本研究進行臺灣地區圖書資訊學主題分析的研究 範圍。. 第四節. 名詞解釋. 一、 自動歸類(Clustering) 自動歸類作法可分為詞彙歸類(term-based clustering)與文件歸類(documentbased clustering)。. 詞彙歸類是計算各詞彙之間的相似度(例如:各詞彙共同出現在同一文件的 統計量),將相似的詞彙連結在一起。其優點是歸類後的類別標題可由這些詞彙 直接讀取,而其缺點是詞彙之間的非遞移性(non-transitivity)容易造成錯誤的 歸類結果。文件歸類則計數任意兩文件的主題相似度(或詞彙重複程度),再將 相似的文件連結成一類。其優點是比較能夠偵測文獻的主題分佈,缺點是類別的 主旨標題不易自動選定(曾元顯,2004)。. 二、 人工歸類 本研究將研究者在進行主題分析的研究過程中,以人工審視題名或文獻內 5.

(12) 容,給予分類類別,歸類出研究主題的方式進行主題分析定義的人工歸類為:。 研究者與協助人員以人工檢視題名及文獻內容的方法,將研究對象的主題找出, 並分類入參考用的分類表中。. 6.

(13) 第二章. 文獻分析. 本研究以全國博碩士論文資訊網及中文期刊篇目影像系統收錄的圖書資訊 學學位論文及期刊論文為研究對象,試圖以自動化分析模式與人工審視歸類之研 究主題,比較自動歸類與人工歸類的研究分析結果,期望找出以自動化歸類的方 法即可達到人工審視歸類方法的專業權威可信度,以減輕人工歸類的工作量負 擔。本章文獻分析將分為四個部分進行探討,首先就臺灣地區圖書資訊學研究範 疇之論文,做一整理探析。第二部分就主題分析之研究方法,做一概略介紹。第 三部分就主題分類表之制定,做一概略探索。第四部份就自動歸類方法,做一概 略介紹。. 第一節. 臺灣地區圖書資訊學研究範疇之文獻探析. 本節針對臺灣地區以圖書資訊學領域為研究範疇所發表之研究文獻,進行整 理論述。臺灣地區對於圖書資訊學門進行領域研究主題分析的相關研究有18篇, 如表2-1。. 表2-1 臺灣地區圖書資訊學相關研究 編號 主要作者. 論文名稱. 出版年. 1.. 施孟雅. 從專業期刊文獻分析我國臺灣地區的圖書館學研究. 民 80. 2.. 李德竹. 我國圖書館學教師研究趨勢及資訊需求之調查研究. 民 81. 3.. 林巧敏. 中國圖書館學會會報論著之計量分析. 民 82. 4.. 鄭麗敏. 近二十年來臺灣地區圖書館學與資訊科學期刊論文引用參考文獻特性分析. 民 83. 5.. 李碧鳳. 近五年來臺灣地區圖書館學與資訊科學期刊論文引用文獻錯誤之研究. 民 84. 6.. 陳旭耀. 臺灣地區圖書資訊學碩士論文及其引用文獻之研究. 民 85. 7.. 吳美美. 《圖書館學與資訊科學》二十五年來的主題分析. 民 88. 8.. 黃惠美. 期刊文獻作者生產力與引用關係:以臺灣地區圖書館與資訊科學為例. 民 92. 9.. 吳冠儀. 1999-2001 年海峽兩岸圖書館學核心期刊論文主題及引文之分析研究. 民 92. 7.

(14) 編號 主要作者. 論文名稱. 出版年. 10.. 林頌堅. 基於詞語抽取的圖書與資訊學研究主題分析. 民 92. 11.. 陳淑芬. 四十年來臺灣圖書資訊學碩士論文研究主題之析論. 民 93. 12.. 賴淑靜. 資訊科學引用文獻與被引用文獻之文獻分布與主題變化現象. 民 93. 13.. 梁瓊方. 臺灣圖書資訊學跨學科交流之分析:以「臺灣人文學引文索引資料庫」為例 民 93. 14.. 張瑜倫. 臺灣圖書資訊學碩士論文引用現象之研究:二○○三至二○○五年. 民 94. 15.. 劉瑞珍. 探析我國圖書資訊學期刊引用學位論文之研究. 民 94. 16.. 黃琇薇. 圖書資訊學期刊引用文獻分析研究:以 JASIST 為例. 民 94. 17.. 古育詩. 圖書資訊學與相關學科之期刊自我引用研究. 民 94. 18. 歐陽崇榮 從期刊及博碩士論文分析探討台灣圖書資訊學之研究. 民 95. * 本表表格順序,依以研究之出版年排序。. 一、 研究對象資料來源之探討 以臺灣地區圖書資訊學為研究範疇分析領域研究主題的相關研究中,研究對 象的資料類型概略可分為學位論文、期刊文獻及引文資料庫。. 研究對象以碩士論文資料的有陳旭耀(1996)的「臺灣地區圖書資訊學碩士 論文及其引用文獻之研究」、陳淑芬(2004)的「四十年來臺灣圖書資訊學碩士 論文研究主題之析論」、張瑜倫(2005)的「臺灣圖書資訊學碩士論文引用現象 之研究:二OO三至二OO五年」及歐陽崇榮(2006)的「從期刊及博碩士論文 分析探討台灣圖書資訊學之研究」等研究者。. 研究對象以期刊文獻為主的有施孟雅(1991)的「從專業期刊文獻分析我國 臺灣地區的圖書館學研究」、李德竹(1992)的「我國圖書館學教師研究趨勢及 資訊需求之調查研究」、林巧敏(1993)的「中國圖書館學會會報論著之計量分 析」、鄭麗敏(1994)的「近二十年來臺灣地區圖書館學與資訊科學期刊論文引 用參考文獻特性分析」、李碧鳳(1995)的「近五年來臺灣地區圖書館學與資訊 科學期刊論文引用文獻錯誤之研究」、吳美美(1999)的「《圖書館學與資訊科 學》二十五年來的主題分析」、黃惠美(2001)的「期刊文獻作者生產力與引用 關係:以臺灣地區圖書館與資訊科學為例」、吳冠儀(2003)的「1999-2001年 8.

(15) 海峽兩岸圖書館學核心期刊論文主題及引文之分析研究」、林頌堅(2003)的「基 於詞語抽取的圖書與資訊學刊研究主題分析」、劉瑞珍(2005)的「探析我國圖 書資訊學期刊引用學位論文之研究」及歐陽崇榮(2006)的「從期刊及博碩士論 文分析探討台灣圖書資訊學之研究」等研究者。. 研究對象以引文資料庫為主的有黃惠美(2001)的「期刊文獻作者生產力與 引用關係:以臺灣地區圖書館與資訊科學為例」、賴淑靜(2004)的「資訊科學 引用文獻與被引用文獻之文獻分布與主題變化現象」、梁瓊方(2004)的「臺灣 圖書資訊學跨學科交流之分析:以「臺灣人文學引文索引資料庫」為例」、黃琇 薇(2005)的「圖書資訊學期刊引用文獻分析研究:以JASIST為例」及古育詩 (2005)的「圖書資訊學與相關學科之期刊自我引用研究」等研究者。. 臺灣地區圖書資訊學研究範疇相關研究的研究資料類型及研究對象分析,如 表2-2所示。. 9.

(16) 表2-2 臺灣地區圖書資訊學研究資料類型分析 研究對象 資料類型. 相關研究 主要作者 陳旭耀 (編號 6). 研究對象 5 所圖書資訊學相關科系研究所發表之碩士論文 ( 台灣大學、台灣師範大學、淡江大學、文化大學 ). 陳淑芬 8 所臺灣地區圖書資訊學碩士論文 (編號 11) ( 師院、文化、師大、台大、淡大、輔大、政大、興大 ) 學位論文 (碩士論文 ). 9 所臺灣地區圖書資訊學碩士論文 張瑜倫 ( 台灣大學、台灣師範大學、淡江大學、輔仁大學、政治大學、 (編號 14) 中興大學、世新大學、師範大學、玄奘大學 ) 9 所臺灣地區圖書資訊學碩士論文 歐陽崇榮 ( 台灣大學、政治大學、台灣師範大學、中興大學、輔仁大學、 (編號 18) 淡江大學、世新大學、玄奘大學、佛光大學 ) 施孟雅 (編號 1). 臺灣地區 14 種圖書資訊學期刊. 李德竹 (編號 2). 91 位圖書館學教師著作. 林巧敏 (編號 3). 「中國圖書館學會會報」收錄之研究性論著. 鄭麗敏 (編號 4). 臺灣地區 7 種圖書館學與資訊科學期刊. 李碧鳳 (編號 5). 臺灣地區 10 種圖書館學與資訊科學期刊. 期刊文獻. 吳美美 (編號 7). 「圖書館學與資訊科學」收錄之期刊文獻. 黃惠美 (編號 8). 中文圖書資訊學文獻摘要資料庫(CLISA 資料庫)及 中華民國期刊論文影像資料庫. 吳冠儀 (編號 9). 中國大陸圖書館學類 13 種核心期刊及台灣部圖書館學類 6 種核心期刊. 林頌堅 「圖書與資訊學刊」收錄之期刊文獻 (編號 10) 劉瑞珍 黃世雄教授國科會計畫「圖書資訊學期刊排序之研究」研究成果 (編號 15) 排序前 10 名之期刊 歐陽崇榮 臺灣地區 20 種圖書資訊學相關領域期刊 (編號 18) 10.

(17) 研究對象 資料類型. 相關研究 主要作者. 黃惠美 (編號 8). 研究對象. 中文圖書資訊學文獻摘要資料庫(CLISA 資料庫)及 中華民國期刊論文影像資料庫. 引文資料庫. 賴淑靜 Web of Sciences 資料庫(SCI、SSCI 與 AHCI 等引用文獻索引資料庫) (編號 12) 之有效書目資料及引用文獻 梁瓊方 臺灣人文學引文索引資料庫 (編號 13) 黃琇薇 Ulrich''s Periodicals Directory、OCLC WorldCat 書目資料庫中 JASIST (編號 16) 古育詩 ISI 的 JCR 資料庫 6 大學科類目之引用數據 (編號 17). 11.

(18) 二、 研究面向之探討 以臺灣地區圖書資訊學為研究範疇之 17 篇論文中,研究者之研究面向可概 分主題分析、著者分析、文獻特性分析三種。. 研究面向針對文獻名稱及引用文獻篇名之主題分析研究,研究者有施孟雅 (1991)、李德竹(1992)、林巧敏(1993)、陳旭耀(1996)、吳美美(1999)、 黃惠美(2001)、吳冠儀(2003)、林頌堅(2003)、陳淑芬(2004)、梁瓊方 (2004)、張瑜倫(2005)、歐陽崇榮(2006)等人。. 研究面向針對著者著作數量、研究領域、引文現象及引文動機等相關分析, 研究者有施孟雅(1991)、鄭麗敏(1994)、黃惠美(2001)、梁瓊方(2004)。. 研究面向針對文獻數量、語文別、資料類型、學科領域、著錄格式等特性分 析,研究者有施孟雅(1991)、鄭麗敏(1994)、李碧鳳(1995)、陳旭耀(1996)、 黃惠美(2001)、吳冠儀(2003)、賴淑静(2004)、劉瑞珍(2005)、黃琇薇 (2005)、古育詩(2005)、張瑜倫(2005)。臺灣地區圖書資訊學研究範疇相 關研究的研究面向分析,如表 2-3 所示。. 表2-3 臺灣地區圖書資訊學研究面向分析 研究面向. 主題. 著者. 施孟雅、李德竹、林巧敏、陳旭 相關研究 主要作者. 耀、吳美美、黃惠美、吳冠儀、 林頌堅、陳淑芬、梁瓊方、張瑜 倫、. 文獻特性 施孟雅、鄭麗敏、李碧鳳、. 施孟雅、鄭麗敏、 陳旭耀、黃惠美、吳冠儀、 黃惠美、梁瓊方 賴淑静、劉瑞珍、黃琇薇、 古育詩、張瑜倫. 歐陽崇榮. 將研究對象(表 2-2)與研究面向(表 2-3)進行交叉分析,交叉比較的結果, 如表 2-4 所示。. 12.

(19) 表2-4 臺灣地區圖書資訊學研究對象與研究面向交叉分析. 學位論文 (碩士論文). 期刊文獻. 引文資料庫. 主題 陳旭耀(5 所研究所) 陳淑芬(8 所研究所) 張瑜倫(9 所研究所) 歐陽崇榮(9 所研究所) 施孟雅(14 種期刊) 黃惠美(7 種期刊) 吳冠儀(19 種期刊) 歐陽崇榮(20 種期刊) 李德竹(教師發表期刊著作) 林巧敏(單一期刊) 吳美美(單一期刊) 林頌堅(單一期刊) 梁瓊方. 著者. 文獻特性 陳旭耀(5 所研究所) 張瑜倫(9 所研究所). 施孟雅(14 種期刊) 鄭麗敏(7 種期刊) 黃惠美(7 種期刊). 施孟雅(14 種期刊) 鄭麗敏(7 種期刊) 李碧鳳(10 種期刊) 黃惠美(7 種期刊) 吳冠儀(19 種期刊) 劉瑞珍(10 種期刊). 梁瓊方. 賴淑靜、黃琇薇、古育詩. 三、 研究結果之探討 以臺灣地區圖書資訊學為研究範疇之研究且進行主題分析研究結果,首先依 據學位論文的資料類型進行研究主題的 4 位研究者,各研究者的研究對象、資料 數量、研究結果,以表 2-5 列表表示。. 表2-5 臺灣地區圖書資訊學學位論文研究主題分析結果 相關研究. 陳旭耀 (編號 5). 研究資料數量 民國 59 年至 84 年 12 月止 碩士論文 190 篇 引用文獻 25,818 筆. 研究主題分析結果 碩士論文主要的研究主題: 1. 圖書館行政與管理 2. 讀者服務與參考服務 3. 目錄學與版本學. 13.

(20) 相關研究. 研究資料數量. 研究主題分析結果 各類目之核心研究主題: 1. 圖書資訊服務類: 圖書資訊學綜論、圖書資訊服務。 2. 圖書資訊學綜論類: 資訊檢索、資訊尋求行為、書目計量學。. 陳淑芬. 民國 48 年至 91 年. 3. 圖書資訊服務類:. (編號 11) 碩士論文 544 篇. 機構行政管理:組織設置、人事管理主 題。 技術服務:館藏發展、館藏整理主題。 讀者服務:參考服務、使用者研究主題。 圖書資訊資源 圖書資訊服務網路化. 張瑜倫 (編號 14). 民國 92 年至 94 學年度 碩士論文 74 篇 引用文獻 740 筆. 臺灣圖書資訊學的研究生的研究主題: 資訊尋求行為 碩士論文研究主題:. 歐陽崇榮 民國 90 年至 94 年 (編號 18) 碩士論文 311 篇. 使用者群服務、資訊系統與檢索、 資訊組織、圖書館與資訊供應者類型、 管理與行政、圖書資訊學教育、 館藏發展、圖書資訊學發展 / 原理. 將 4 位研究者的研究結果綜合討論,發現圖書資訊學領域學位論文的研究主 題從較早期的研究主題「圖書館行政與管理」、「圖書館技術服務」,發展至近 期的「讀者服務」、「資訊技術服務」的研究脈絡。. 其次,臺灣地區圖書資訊學依據期刊文獻的資料類型進行研究主題分析的七 位研究者,各研究者的研究對象、資料數量、研究結果,以表 2-6 列表表示。. 14.

(21) 表2-6 臺灣地區圖書資訊學期刊文獻研究主題分析結果 相關研究. 研究對象. 研究主題. 主要作者. 資料數量. 分析結果. 民國 70 年至 79 年. 期刊文獻主要研究主題:. 施孟雅 (編號 1). 李德竹 (編號 2). 林巧敏 (編號 3). 臺灣地區 14 種期刊,. 1. 資訊科學與圖書館自動化. 期刊文獻 1,342 篇、. 2. 讀者服務. 引用文獻 2,639 筆. 3. 各類型圖書館 在期刊中以中文發表著作的研究主題:. 民國 69 年至 79 年間. 最多 - 資訊科學與圖書館自動化. 91 位圖書館學教師著作. 最少 - 圖書館法規與標準、出版事業. 民國 43 年 6 月至 82 年 6 月 中國圖書館學會會報最常探討的主題: 「中國圖書館學會會報」. 1. 資訊科學與圖書館自動化. 研究性論著 370 篇. 2. 圖書館學與圖書館事業 圖書館學與資訊科學文章主要主題: 1. 資訊組織. 吳美美 (編號 7). 2. 各國圖書館. 民國 64 年至 88 年 4 月 「圖書館學與資訊科學」 期刊文獻 416 篇. 3. 資訊檢索 4. 比較 / 國際圖書館學 5. 出版品交換/ 資源共享/ 圖書館合作 6. 圖書館史. 民國 44 年至 88 年 中文圖書資訊學文獻摘要資 臺灣地區 7 種核心期刊主要研究主題: 黃惠美. 料庫(CLISA 資料庫)及中. 1. 圖書館學與資訊科學. (編號 8). 華民國期刊論文影像資料庫. 2. 圖書館讀者服務. 期刊文獻 5,255 篇、. 3. 圖書館技術服務. 引用文獻 28,629 筆 吳冠儀 (編號 9). 民國 88 年至 90 年. 兩岸熱門的討討主題:. 期刊文獻 7,016 篇. 1. 網際網路. 引用文獻 38,293 筆. 2. 各類型圖書館. 15.

(22) 相關研究. 研究對象. 研究主題. 主要作者. 資料數量. 分析結果 圖書與資訊學刊重要的研究主題: 1. 圖書館服務與館員訓練. 林頌堅 (編號 10). 民國 85 年至 92 年 6 月. 2. 學校圖書館利用教育與資訊素養. 「圖書與資訊學刊」. 3. 圖書資訊學教育與課程. 期刊文獻 209 篇. 4. 資訊檢索與使用者研究 5. 檔案學 6. 網路與電子技術. 梁瓊方. 民國 85 年至 91 年. (編號 13). 期刊文獻 2,723 篇. 臺灣地區 20 種期刊收錄研究主題: 1. 圖書資訊技術 2. 讀者服務 期刊文獻主要研究主題:. 歐陽崇榮 (編號 18). 圖書資訊學發展 / 原理、. 民國 90 年至 95 年 3 月. 資訊組織、資訊系統與檢索、. 台灣地區 20 種期刊. 管理與行政、使用者群服務、. 期刊文獻 1,746 篇. 館藏發展、圖書資訊學教育、 圖書館與資訊供應者類型. 期刊文獻資料類型為研究對象的研究者,所提出研究主題分析的研究結果 中,施孟雅、黃惠美、林頌堅、梁瓊方、歐陽崇榮等人都有提出「讀者服務」的 研究主題;施孟雅、李德竹、林巧敏提出的研究主題「資訊科學與圖書館自動化」 、 吳美美提出的研究主題「資訊組織、資訊檢索」、黃惠美提出的研究主題「圖書 館學與資訊科學」、吳冠儀提出的研究主題「網際網路」、林頌堅提出的研究主 題「資訊檢索與使用者研究、網路與電子技術」、梁瓊方提出的研究主題「圖書 資訊技術」及歐陽崇榮提出的研究主題「資訊系統與檢索」等,8 位研究者提出 的研究主題以更大類的階層來看,都與「資訊技術」相關。由此,可以看出「讀 者服務」及「資訊技術」兩個主題與圖書資訊學領域有緊密的研究關連。. 最後,臺灣地區圖書資訊學依據引文資料庫的資料類型進行研究主題分析的 梁瓊方(2004)「臺灣圖書資訊學跨學科交流之分析:以「臺灣人文學引文索引. 16.

(23) 資料庫」為例」一文,以「臺灣人文學引文索引資料庫」收錄之民國 85 年至 91 年圖書資訊學 2,723 篇期刊論文為研究對象進行分析,研究結果發現圖書資訊學 研究者與「社會科學」、「工程技術」類的研究者較常進行合作研究;「圖書資 訊技術」、「讀者服務」兩個研究主題,比較常與其他學科進行合作研究;然而, 其研究並無針對領域文獻的篇名、摘要進行分析研究主題。. 探討各類型研究資料的研究主題分析結果,發現領域研究主題的研究結果對 於圖書資訊學領域有相當程度的指引與幫助,但更發現研究者除了林頌堅嘗試以 自動化的方式進行主題分析研究外,多數研究者是依據研究文獻名稱、分類表、 簡易統計等技巧使用,以人工審視文獻篇名、選出篇名主題、搭配分類表的方法 進行研究主題分析歸納。人工的方式在研究主題分類的客觀性及一致性、對於研 究主題的認知方面,研究者及協助分類者的主題概念不盡相同,容易產生主題分 類的誤差。. 本研究期望以資訊計量技術,透過自動歸類的方式進行主題分析探討,減少 人為因素的影響及修訂類表的時間人力成本消耗,藉由文件資料自動歸類呈現文 獻的研究主題,加速文獻主題分析的進展時程。. 第二節. 主題分析之研究方法. 主題分析,就是「資訊的分析」(Analysis of Information)即自文獻的內容 中衍生出文字或符號,形成該文獻要義之簡要描述。這種描述可用來辨識文獻、 提供查驗文獻的檢索點、指示文獻的內容、或作為文獻的替代。它主要是根據文 獻顯著的特性解悉內容,以名詞、或是形容詞與名詞的組合、或是片語或句子、 甚至數學等特殊符號,來標示文獻所揭示之重要主題。(陳明來,2002). 主題分析的過程包括了文獻判讀、主題概念的提煉、隱含主題概念的分析、 文獻主題的取捨和主題類型的確定等五個環節,而在進行主題分析時,可能會因 為主題概念分析不完全或主題選取錯誤等因素而造成主題分析結果的誤差。因 此,在進行主題分析工作時對於文獻內容分析的客觀性、主題概念專指性、概念 17.

(24) 選取的全面性和一致性等問題應先有所共識。(陳佳君,1995). 主題分析的方式可分為概要性分析(Summarization)及深入分析(Depth of Indexing)兩種。分析一筆資料可由下列各項著手:題名、摘要、目次、序言、 每章內文之首段、結論、插圖、圖表、標題等」。(王梅玲,1995). 基於上述學者對於主題分析的釋義,本節以國內外學者對於主題分析所進行 的研究方法做一概略介紹。. 一、 引用文獻分析法(Citation Analysis) 引用文獻分析法是資訊工作者常用的一種調查方法,其過程包括分析索引、 摘要、或期刊等來探討某一學科所使用或產生的文獻特性。莊道明(1995)對於 引用文獻分析法的解釋為「引用文獻分析法是一種內含豐富、易於操作、應用廣 泛的文獻計量學研究方法,常被用於對大量引用文獻進行統計,用來揭示科學期 刊、學科、單位與論文著者等各種分析物件的數量特徵與內在規律性」。蔡明月 (2002)提到「從文獻的被引用次數,可顯示出其影響後來研究的情況,研究者 經由引用與被引用之間的探究,也可獲知學科的結構、發展,及科學間的關係與 文獻傳播的歷程,甚而發展成機構、人才的評價工具」。梁瓊方(2005)提到文 獻分析可以分為兩種方式:一種是數量的計算,運用簡單的統計分析文獻、作者、 期刊被引用的次數等;另一種是文獻連結關係的分析,透過書目耦合、共被引等 方式分析文獻間的關係。. 臺灣地區發表的論文,以圖書資訊學為研究對象進行文獻主題分析的相關研 究,分析步驟多數採用:文獻編碼、建入文件管理資料庫、瀏覽所蒐集的文獻名 稱及引用文獻名稱給定主題、擬定主題分類系統、根據文獻中出現的主題與主題 分類表對照給定主題類別、利用統計分析軟體(Access、Excel、SPSS)進行研 究主題分類、整理並解釋研究結果。. 然而資訊科技與網際網路的影響,學術研究的主題變化,以人工審視分析主. 18.

(25) 題進行歸類主題分類表的方式,無法達到知識架構符合研究變化、新穎度的需 求;跨領域研究的學術數量亦非單一領域分析主題所可以含概齊全的。我們需要 找出更快速的方法幫學門找出研究主題。. 二、 領域分析法(Domain analysis) 陳奕璇與阮明淑(2006)撰文提到軟體工程師 Kang 將領域分析定義為「對 某領域既有系統及其發展歷史、領域專家的知識保存、基本理論和新興科技等相 關資進行辨別、蒐集、組織何在現之過程」。圖書資訊科學對於領域分析的觀點 為「從文獻的標題及內容中,萃取出該領域的關鍵詞群組,透過字詞群組的整併 之後,彙整出該領域所蘊含的概念與文獻架構」。. 荷蘭Leiden大學科學與技術研究中心(CWTS)的Noyons等人,長期從研究 文獻中分析與觀測科學技術的演進,發展出一套通用的方法,透過學術文獻的蒐 集、詞彙擷取與過濾、索引檔建構、共現字分析、文件分類、視覺化呈現、解讀 等步驟來分析科學與技術文獻。然而,即便文獻經過各式文字探勘的歸類處理, 並繪製成主題圖,其解讀仍不容易。若能加入更多查詢、篩選、探索與互動的機 制,應當能提升其結果的可解讀性(曾元顯、林瑜一,2006)。. 林頌堅(2003,2005)發表的研究論文,以自動化研究主題探勘方法,透過 文獻的蒐集整理、擷取關鍵詞語、叢集分析辨識主題詞、映射主題關係圖、分析 比較各主題的統計資訊、訓練詞彙穩定度、視覺化呈現主題關係、解讀等步驟來 分析計算語言學及圖書資訊學文獻。. 三、 科學計量分析法 美國Drexel大學Chaomei Chen教授,長期進行科學計量學研究,他發展出 CiteSpace分析工具,可針對從ISI的WoS(Web of Science)資料庫下載回來的資 料,利用其引用關係,進行研究前沿的辨識、引用時間序列的分析、視覺化的呈 現等探索任務,以便利知識領域的趨勢偵測(detecting emerging trends and abrupt 19.

(26) changes in a timely manner)。. 其分析步驟為:先使用最廣義的詞彙來定義知識領域,然後從WoS資料庫查 詢並下載論文。接著擷取一群出現頻率突然成長的詞彙,做為研究前沿詞彙。這 些詞彙來自於論文的標題(title)、摘要(abstract)、描述詞(descriptor)、辨 識詞(identifier)。此方法的好處是不會受到引用不足的影響。. 在資料分析方面,時間區間的指定,包括使用者指定時間區間,以便在不同 時區顯示共同出現的研究前沿詞彙、共同被引用的知識基礎、研究前沿詞彙引用 知識基礎文章等三種連結。此外,使用者可指定三種門檻:引用次數、共引用次 數與共引用係數,以便應用到三種時間區間:最早區間、中間區間以及最後區間。 此外,Chen教授還運用三角不等式原理來過濾多餘的連結,並以視覺化的呈現方 式提供使用者檢視引用網路時間脈絡圖,以分析趨勢。最後並邀請專家驗證,將 辨識出來的關鍵論文,提供原作者驗證。. Chen教授的分析方法與工具,著重在研究前沿詞彙的擷取、引用歷程的呈 現、關鍵脈絡的追蹤,而不在於整體文獻的主題歸類與摘要化分析。因此其所呈 現的網絡關係較為詳細複雜。當應用於較多文獻時,可能會造成難以分析的情況 (曾元顯、林瑜一,2006)。. 探討各主題研究的分析方法,發現主題的分析方式會依據研究目標而有所不 同,本研究期望以較少人工介入的歸類分析法,找出洽當的文件主題。. 第三節. 主題分類表之制定. 研究者進行研究主題分析時,關於分類表制定程序,可分為兩種:一是針對 所研究的學科領域發展,訂定出含概完整學科知識的分類體系表,研究者於訂定 分類體系表前,尚無確定的架構,分類體系表會依據研究對象的範圍有所變動; 另一是先瀏覽所有蒐集文獻的內容,挑選出文獻所表達的主要概念,將文獻表達 的概念依據已初步確認之主題分類表架構,歸入主題,此方法訂出的研究主題可 20.

(27) 能僅適用於小範圍學科知識的發展分析。. 一、 分類體系總表 施孟雅(1991)「從專業期刊文獻分析我國臺灣地區的圖書館學研究」的碩 士論文研究中,以制訂一含蓋整個科學領域的主題分類架構為目標,參考了「中 國圖書分類法」、教育部「大學必修科目表」及其他類似研究,提出了新的主題 分類架構,如表2-7。. 21.

(28) 表2-7 施孟雅提出之圖書資訊學研究主題分類架構表 大類. 小類 通論 02. 圖書館與文化建設 圖書館與資訊社會 04. 圖書館史 中國圖書館學會 06. 圖書館人物 國外圖書館、學會 08. 圖書館週 圖書館發展趨勢 10. 圖書館哲學、目的、功能 國外圖書館、學會 通論 02. 人事 03. 規章 04. 組織 經費 06. 建築 07. 業務統計 08. 評鑑 決策、規劃、管理方法 通論 02. 徵集 03. 分類 編目(CIP、權威控制、ISBN、標題) 典藏(淘汰) 通論 02. 閱覽 03. 流通 04. 推廣 參考服務 06. 參考資料 07. 利用指導 特殊讀者服務 讀者分析(使用研究、資訊需求) 服務新知(SDI) 通論 02. 合作採訪 03. 合作編目 合作典藏 05. 館際互借 06. 互惠閱覽 合作人員訓練 08. 館際合作組織 期刊 02. 視聽資料 03. 特藏資料 報紙、剪輯資料、小冊子 05. 檔案管理 政府出版品 07. 其他 資訊科學理論 02. 圖書館自動化通論 圖書館自動化系統 04. 資訊系統與資訊網 資訊媒體與技術 06. 機讀編目(MARC) 資訊儲存與檢索 08. 資料庫 中文資料處理 10. 資料轉換 國內外圖書館教育 02. 圖書館學系(所)課程 繼續教育 04. 圖書館利用教育 國家圖書館(呈繳制度) 02. 大學圖書館 專門圖書館與資訊中心 04. 公共圖書館 學校圖書館 06. 兒童圖書館 文化中心 08. 鄉鎮圖書館. 01. 03. 05. 一、圖書館與圖書館事業 07. 09. 11. 01. 二、圖書館行政與管理 05. 09. 01. 三、技術服務 04. 05. 01. 05. 四、讀者服務 08. 09. 10. 01. 五、館際合作 04. 07. 01. 六、特殊資料處理與利用 04. 06. 01. 03. 七、資訊科學與圖書館自動化 05. 07. 09. 01. 八、圖書館學與資訊科學教育 03. 01. 03. 九、各類型圖書館 05. 07. 十、目錄學與版本學 十一、出版事業 01. 圖書館法、標準 十二、圖書館法規與標準 03. 自動化標準. 02. 著作權法、專利法. 楊美華(2006)發表的「圖書資訊學研究」一文中,其文獻類目延續以往年 鑑的類目,將主題分為四大類,並加註主題相關檢索詞彙,如表2-8。. 22.

(29) 表2-8 楊美華提出之圖書資訊學文獻類目表 類目 (一)通論. 相關檢索詞彙 文獻 引文、引用、引用文獻、引用文獻分析、. (二)文獻計量學. 期刊文獻、書目計量學、資訊計量學. 一、文獻學. (三)書史. 圖書、印刷、書評. (四)藏書史. 藏書、古書、叢書. (五)目錄學. 目錄. (六)版本學. 版本、雕版、刻板. (七)專科文獻 1.人文科學文獻 2.社會科學文獻 3.自然科學文獻 4.生命科學文獻 (八)地方文獻 圖書館、圖書館學概論、圖書資訊、 (一)通論. 圖書資訊素養、知識管理. (二)圖書館事業 1.各國圖書館事業 2.圖書館誌. 圖書館 圖書館、資料單位、圖書館學會、. 3.圖書館暨資料單位名錄 二、圖書館學. 4.圖書館調查與統計. 中國圖書館學會 圖書館調查、圖書館統計. (三)圖書館相關法規 1.通論 2.圖書館法. 圖書館法、圖書館法令、圖書館法規. 3.著作權法及其相關問題. 著作權法、合理使用、智慧財產權. 4.送存制度. 送存圖書館、寄存圖書館、呈繳 圖書館學教育、館員繼續教育、. (四)圖書館教育. 圖書資訊學教育、在職進修. (五)圖書館行政與管理. 23.

(30) 類目 1.通論. 相關檢索詞彙 圖書館行政、圖書館管理、圖書館發展 圖書館標準、圖書館規章、圖書館規定、. 2.標準與法規. 圖書館規則 圖書館組織、圖書館編制、圖書館人員編制、. 3.組織與編制. 圖書館組織條例、圖書館員額編制 圖書館建築、圖書館設備、圖書館空間規劃、. 4.建築與設備. 圖書館傢俱 人力資源、人力管理、委外機制、BOT、. 5.人力資源管理 6.評鑑. 工作輪調、專業館員 圖書館評鑑、績效評估. (六)館藏發展 1.通論. 館藏、館藏重點、圖書代理 館藏政策、館藏特色、圖書採購、圖書徵集、. 2.館藏徵集. 選書、圖書選擇、選書小組、選書政策、 爭議性資料. 3.館藏評鑑. 館藏使用. (七)技術服務 1.通論 資源組織、資源整理、資料整理、館藏目錄、 線上公用目錄(OPAC)、書目、Dublin Core、 2.資源組織與整理 MARC、Metadata、主題編目、記述編目、 圖書分類、圖書編目、權威控制 3.主題法. 標題法、標題表、主題表、主題詞表. 4.圖書典藏與館藏維護. 典藏、館藏維護、圖書淘汰、汰書. (八)讀者服務 1.通論 參考服務、參考資源、檢索晤談、參考晤談、 2.參考資源與服務. 工具書、參考諮詢、數位參考服務. 3.讀書館利用教育. 圖書館利用、圖書館教育. 4.讀者研究. 讀者分析、讀者問題、顧客滿意度. 24.

(31) 類目. 相關檢索詞彙. (九)圖書館合作 1.通論. 館際合作、資源共享. 2.合作組織與聯盟. 圖書館聯盟、圖書館合作組織、合作館. 3.合作採訪 4.合作編目 5.館際互借與複印服務. 館際互借、館際複印、文獻傳遞. (十)圖書館推廣與輔導 1.通論 2.推廣. 圖書館推廣. 3.輔導. 圖書館輔導. 4.圖書館與閱讀活動. 讀書會、閱讀運動. 5.行銷與公共關係. 圖書館行銷、圖書館與公共關係. (十一)特殊資料 1.通論 2.視聽暨多媒體資料. 視聽資料、多媒體資料. 3.電子資源 4.政府出版品. 官書. 5.其他. 非書資料. (十二)各類型圖書館 1.國家圖書館 2.公共圖書館. 鄉鎮圖書館、縣市立圖書館、文化中心 大學圖書館、專科圖書館、研究圖書館、. 3.大學、學院及專科學校圖書館. 學術圖書館、教學資源中心 學校圖書館、中學圖書館、小學圖書館、. 4.中小學(兒童)圖書館. 兒童圖書館、圖書室、 高中圖書館、國中圖書館 資料中心、專門圖書館、資訊中心、. 5.專門圖書館暨資料中心. 議會圖書館、機關圖書館. (十三)圖書館與出版 1.通論. 圖書出版. 25.

(32) 類目 2.電子出版. 相關檢索詞彙 電子書、電子期刊、數位出版、隨選列印(POD). (一)總論. 資訊服務. (二)資訊系統. 索引典 資料查詢、資料檢索、資料探勘、資訊過濾、 資訊擷取、搜尋引擎、模糊查詢、影像檢索、. (三)資訊檢索. 語音檢索、剪檢索問題、檢索詞彙、主題查 檢 資訊搜尋、資訊需求、資訊行為、. (四)資訊尋求行為研究 三、資訊科學. OPAC(WebPAC)使用行為、瀏覽行為 線上資料庫、電子資料庫建置、隨選視訊 (五)電子資料庫 (VOD)、光碟資料庫 (六)圖書館自動化. Z39.50、轉鍵系統、分散式系統. (七)數位圖書館. 機構典藏. 1.通論. 數位圖書館、虛擬圖書館、數位化圖書館. 2.數位化典藏. 數位典藏 電子資源、網頁資訊、網站介面、. 3.網路資源. 網路資源與服務、圖書館網站. 4.網路資料中心 (八)數位學習 (一)通論. 檔案. (二)檔案教育 檔案組織、檔案管理、檔案描述、檔案分類、 (三)組織與管理. 檔案編目. 四、檔案學. 檔案收集、檔案整理、檔案採訪、檔案數位 (四)收集與整理. 化 檔案保管、檔案利用、檔案典藏、檔案流通、. (五)保管與利用. 檔案維護、檔案參考服務. (六)檔案館誌 (七)檔案館事業 (八)檔案自動化. 26.

(33) 二、 主題類目表 鄭麗敏(1994)碩士論文「近二十年來臺灣地區圖書館學與資訊科學期刊論 文引用參考文獻特性分析」的研究中,是依據文獻中的主題選擇出24種主題加以 歸類分析,如表2-9。. 表2-9 鄭麗敏使用之圖書資訊學期刊論文研究主題分類表 圖書館學與資訊科學. 醫學. 目錄學、版本學. 傳播學、語言學. 教育. 人文學、文化. 電腦科學. 哲學. 歷史、政治、地理. 雜文、傳記、遊記. 新聞學. 社會學. 各種主題. 工程技術. 管理、行政學. 法律、規章. 一般語言及文學. 自然科學. 印刷及出版. 社會科學. 商學、經濟. 心理學. 數學、統計學. 主題無法確認. 吳美美(1999)發表的期刊論文「《圖書館學與資訊科學》二十五年來的主 題分布」一文中,將《圖書館學與資訊科學》收錄之文章,將文章以大類目區分 為46項類目,予以分析主題,如表2-10。. 27.

(34) 表2-10 吳美美期刊文獻研究主題分類表 資訊組織. 各國圖書館. 資訊檢索. 出版品交換/ 資源共享/. 比較/ 國際圖書館學. 圖書館史. 圖書館合作. 圖書館教育. 圖書館自動化/ 資訊科技. 一般圖書館學. 圖書館資訊/ 讀者服務. 參考資料/ 參考服務. 圖書館哲學/ 理論. 網路/ 電腦資訊服務. 期刊. 傳記. 本國圖書館事業. 圖書館員/ 任用制度. 學校圖書館. 大學圖書館. 圖書館建築. 線上目錄/ 光碟書目資料庫. 專門圖書館. 出版 / 印刷. 書目計量. 資訊科技/ 數位圖書館. 圖書館管理. 館藏. 兒童讀者服務. 政府出版品. 會議觀察. 資訊行為/ 圖書館使用. 資訊政策. 語言/ 計算語言. 公共圖書館. 目錄學. 資訊素養. 電腦輔助教學. 閱讀. 書目控制. 著作權. 評鑑. 資訊自由. 圖書館與成人教育. 圖書館標準. 學會. 檔案保存. 三、 綜合型主題分類表 羅思嘉等人(2001)發表的「圖書資訊學學術文獻主題分類體系之研究」一 文中,採取完整學科知識的分類體系表與小範圍學科知識的主題分類表並進的方 式,建立出主題分類表,如表2-11。. 表2-11 羅思嘉等人建立之主題分類表 類目. 1. 圖書館與圖書館事業. 標目 1.1. 通論. 1.2. 圖書館與社會. 1.3. 圖書館哲學、目的、功能. 28.

(35) 類目. 標目 1.4. 圖書館發展趨勢. 1.5. 圖書館史. 1.6. 圖書訊專業學會. 1.7. 人物. 1.8. 國際關係. 1.9. 法規與標準. 1.10 館際合作與組織 1.99 其他. 2. 行政與管理. 2.1. 通論. 2.2. 人員與人事. 2.3. 規章. 2.4. 組織. 2.5. 經費. 2.6. 建築. 2.7. 業務統計. 2.8. 評鑑. 2.9. 決策與規劃. 2.10 合作人員訓練 2.11 對外關係 2.99 其他. 3. 技術服務. 3.1. 通論. 3.2. 採訪. 3.3. 主題分析. 3.4. 資訊組織. 3.5. 權威控制. 3.6. 館藏發展. 3.7. 典藏. 3.8. 合作採訪. 3.9. 合作編目. 3.10 合作典藏 3.11 合作館藏發展. 29.

(36) 類目. 標目 3.99 其他. 4. 讀者服務. 4.1. 通論. 4.2. 閱覽. 4.3. 流通. 4.4. 推廣[行銷]. 4.5. 參考服務. 4.6. 參考資源. 4.7. 利用指導與利用教育. 4.8. 特殊讀者服務. 4.9. 讀者研究. 4.10 新知服務 4.11 互惠閱讀 4.12 館際互借 4.13 資料利用 4.14 個人化服務 4.99 其他. 5. 圖書資訊理論與基礎. 5.1. 圖書館學理論. 5.2. 資訊科學理論. 5.3. 文獻計量學. 5.4. 資訊政策. 5.5. 資訊理論. 5.6. 資訊傳播. 5.7. 資訊素養. 5.8. 圖書資訊學教育. 5.9. 研究方法. 5.10 圖書館專業 5.99 其他. 6. 圖書資訊技術. 6.1. 自動化系統. 6.2. 資料庫與資訊系統. 6.3. 資訊媒體與技術. 6.4. 資訊儲存與檢索. 30.

(37) 類目. 標目 6.5. 中文資料處理. 6.6. 資料轉換. 6.7. 網際網路. 6.8. 數位圖書館. 6.9. 網頁設計. 6.99 其他. 7. 圖書語文獻. 7.1. 通論. 7.2. 出版與事業. 7.3. 目錄學. 7.4. 版本學. 7.5. 檔案學. 7.6. 各種目錄. 7.7. 私家藏書. 7.99 其他. 8. 其他(學科類別). 8.1. 人文學. 8.2. 社會科學. 8.3. 自然科學. 8.4. 生物科學. 8.5. 工程技術. 8.99 其他. 以上列出三種不同類型的主題歸類表,本研究參考楊美華(2006)發表的圖 書資訊學文獻類目表,進行自動歸類主題分析的標題標記。. 第四節. 自動歸類方法. 以自動歸類的方法進行主題關鍵詞選取的相關研究及分析方法,有根據詞彙 變化頻率統計的方式提出探勘歷史新聞的村田中禧(2002)、計算詞彙出現的文 件篇數與年代趨勢的變化來了解主題趨勢的Lent(1997)等人、運用自然語言剖 析器加上反向索引檔進行詞彙歸類找出主題類別的Noyons(1999)等人、發展出 31.

(38) CiteSpace分析工具的Chao Mei Chen(1998)及發展出 ClustanGraphics 自動分類 的軟體的 David Wishart 團隊(2003)。. 一、 層級群集方法(Hierarchical clustering) 層級群集方法的特性在於形成類似樹狀或階層狀的結構。常見的分析方法 有: (一)、. 連鎖法(Linkage methods). 單一連鎖法(single linkage),又名近鄰法,以最小的點際距離作為群集間 的距離。完全連鎖法(complete linkage),又名遠鄰法,以最大的點際距離作為 群集間的距離。平均連鎖法(average linkage),以平均的點際距離最為群集間 的距離。此演算法於已經確知分類群組時適用。. (二)、. 最小變異數法(minimum variance method). 又稱華德法(Ward’s method),將每一個資料都視為一個群集,計算群集 之內的變異數,合併變異數最小的群集,越早合併之資料表示彼此之間相似度越 高。. 二、 非層級集群方法(Non- Hierarchical Methods). (一)、. K平均值演算法(K-means Method). K-means的分析方法是將各個資料分割成K個原始集群,計算各資料到各集 群中心的距離,接著將資料分派到距離最近的那個集群,重複分派步驟,直到各 資料不必重新被分派到其他集群為止。 在一般的K-means演算法中各個資料與群組中心的距離測量方式是使用歐幾 里德距離作為基準。. (二)、. Cliques群集演算法. Cliques是一種多重分類的群集演算法,只要詞語與集合中其他各個詞語間的 相關程度都超過某一各預設值,一個詞語可以被分類到多個集合中,避免單一分 32.

(39) 類中單一連結演算法過鬆的條件,或者完整連結演算法的過於嚴格(林頌堅, 2003)。. 33.

(40) 第三章. 研究設計與實施. 本研究的目的是透過圖書資訊學領域之學位論文與期刊文獻資料,進行研究 主題分析,瞭解自動化歸類研究主題分析的結果,並試圖比較出自動化歸類研究 主題與人工歸類研究主題的異同點。. 第一節. 研究架構. 研究動機 研究目的與待答問題. 文獻探討. 研究設計與實施. 文件集 歸類群組. 資料分析與 文件集之研究主題建立. Claster 1. 自動萃選系統. Cluster 2. Cluster n. 主題地圖. 撰寫論文. 34.

(41) 第二節. 研究工具. 本研究使用的自動化歸類研究工具為曾元顯教授所設計的「主題萃取系 統」。研究進行方式是透過自動化歸類研究主題的解讀與分析方式,瞭解研究主 題並比較自動化歸類與人工歸類研究主題的差異。. 主題萃取系統介紹:. 一、 簡介 主題萃取系統是利用電腦運算、資料探勘技術與方法,可支援中文及英文資料針 對不同領域的需求,進行領域主題的發展軌跡、探勘引而未顯的資訊、輔助傳統 人工方式的不足,達到自動分類目的。. 二、 操作介面 讀取Access資料庫資料、以DOS為作業系統、Perl 為程式語言、長詞優先的 斷詞技術,進行文件歸類分析。主題萃取系統在資料匯入與指令執行後,會將執 行結果匯入純文字檔案、html 格式,系統使用者可以直接閱讀結果,進行分析 結果的解讀與報告撰寫。. 三、 系統分析資料結果 (一)、. 主題歸類分析:可以針對不同類型的變項,設定門檻值,進行文件. 關鍵詞的相似度歸類分析。系統使用者可以根據分群的資料特性,歸納 出該分群的主題。 (二)、. 提供歸類分群階層圖。可以協助系統使用者迅速建立階層概念。. 35.

(42) 第三節. 研究對象. 一、 學位論文部分 全國博碩士論文資料庫共收集學位論文全文103,126筆、博士全文影像15,761 筆及論文摘要433,107筆(96年11月24日資料)。依研究範圍檢索得到研究資料紀錄如下:. (一)、. 博士論文. 臺灣地區目前僅臺灣大學於78年設立博士班。查得全國博碩士論文資訊 網共收錄臺灣大學博士班畢業之博士學位論文 14 篇。. (二)、. 碩士論文. 臺灣地區至96學年度為止,臺灣地區共有9所大學院校開設圖書資訊學 相關研究所課程,9所大學院校分別為國立臺灣大學圖書資訊學系暨研究所 (NTU)、天主教輔仁大學圖書資訊學系(FJU)、國立臺灣師範大學圖書資訊 學研究所(NTNU)、國立政治大學圖書資訊與檔案學研究所(NCCU)、淡江 大學資訊與圖書館學系(TKU)、世新大學資訊傳播學系(SHU)、中國文化大 學資訊傳播學系(PCCU)、國立交通大學資訊學院碩士在職專班數位圖書資訊 組(NCTU)、國立中興大學圖書資訊學研究所(NCHU),查得全國博碩士論 文資訊網共收錄 898 篇碩士學位論文。 表3-1 臺灣地區圖書資訊學學位論文數量統計一覽表 300. 280. 學位論文數量統計. 250 200 146 150. 135 108. 101. 100. 70 45. 50. 25 2. 0 NTU. FJU. NTNU. NCCU. TKU. 36. SHU. NCHU. PCCU. NCTU.

(43) 二、 期刊文獻部分 期刊文獻研究樣本擬以中文期刊篇目影像系統收錄之期刊文獻為主,另以各 出版單位之期刊目錄為輔。收錄期刊文獻出版狀態及刊名變更一覽表,如表3-2 所示。. 表3-2 臺灣地區圖書資訊學期刊文獻出版刊名變更表 期刊編號. 刊名. 出版單位. 大學圖書館 1. 第 1 卷第 1 期(民 86 年 1 月起~). 刊期. 國立臺灣大學圖書館. 半年刊. 中華民國圖書館學會. 半年刊. 財團法人伽耶山基金會. 半年刊. 國立臺灣大學圖書資訊研究所. 年刊. 原題名:中華民國圖書館學會會報 第 1 期(民 43 年 3 月)-第 73 期(民 93 年 12 月) 原題名:中國圖書館學會會報 2. 第 74 期(民 94 年 6 月)-第 75 期(民 94 年 12 月) 新題名:圖書資訊學研究 第 1 卷第 1 期(民 95 年 12 月起~) 原題名:佛教圖書館館訊 第 1 期(民 84 年 3 月)-第 40 期(民 93 年 12 月). 3. 新題名:佛教圖書館館刊 第 41 期(民 94 年 6 月起~) 原題名:美國資訊科學與技術學會台北學生分會 會訊 第 1 期(民 77 年 6 月)-第 12 期(民 88 年 12 月). 4. 新題名:美國資訊科學學會臺北學生分會會訊 第 13 期(民 89 年 12 月)-第 16 期(民 92 年 11 月) 暫時停刊. 37.

(44) 期刊編號. 刊名. 出版單位. 刊期. 原題名:國立中央圖書館臺灣分館館訊 第 1 期(民 79 年 6 月)-第 17 期(民 83 年 7 月) 原題名:國立中央圖書館臺灣分館館刊 5. 第 1 卷第 1 期(民 83 年 9 月)-第 10 卷第 3 期(民 93 國立中央圖書館臺灣分館. 季刊. 年 9 月) 新題名:台灣圖書館管理季刊 第 1 卷第 1 期(民 94 年 1 月起~) 原題名:國立成功大學圖書館通訊 第 1 期(民 80 年 1 月)-第 28 期(民 86 年 10 月) 6. 新題名:國立成功大學圖書館館刊. 國立成功大學圖書館. 半年刊. 國家圖書館. 半年刊. 淡江大學資訊與圖書館學系. 季刊. 第 1 期(民 87 年 4 月起~) 國家圖書館館刊 7. 85 年第 1 期(民 85 年 6 月起~) 原題名:教育資料科學 第 18 卷第 1 期(民 69 年 9 月)-第 19 卷第 4 期(民. 8. 71 年 6 月) 新題名:教育資料與圖書館學 第 20 卷第 1 期(民 71 年 9 月起~) 資訊傳播與圖書館學. 9. 第 1 卷第 1 期(民 83 年 9 月)-第 12 卷第 1-4 期(民 95 年 6 月). 世新大學圖書資訊學系 暨圖書館. 月刊. 原題名:政大圖資通訊 第 1 期(民 81 年 5 月)-第 8 期(民 83 年 2 月) 10. 新題名:圖書與資訊學刊. 國立政治大學. 季刊. 國立臺灣大學圖書資訊學系. 年刊. 第 9 期(民 83 年 5 月)-第 67 期(民 97 年 11 月);第 1 卷第 1 期=總號 68 期(民 98 年 2 月起~) 原題名:圖書館學刊(臺大) 第 1 期(民 56 年 4 月)-第 13 期(民 87 年 12 月) 11. 新題名:圖書資訊學刊 第 14 期(民 88 年 12 月起~). 38.

(45) 期刊編號. 刊名. 出版單位. 圖書館學刊(輔大) 12. 13. 第 1 期(民 61 年 6 月)-第 32 期(民 93 年 6 月) 圖書館學與資訊科學. 國立臺灣師範大學圖書資訊學. 第 1 卷第 1 期(民 64 年 4 月起~). 研究所. 臺北市立圖書館館訊 14. 第 1 卷第 1 期(民 72 年 6 月起~) 檔案季刊. 15. 輔仁大學圖書資訊系學會. 第 1 卷第 1 期(民 90 年 12 月起~). 第四節. 半年刊. 季刊. 檔案管理局檔案季刊社. 季刊. 研究實施步驟. 一、 確定分析領域 本研究以臺灣地區圖書資訊學為研究分析領域。. 二、 選定研究範圍、蒐集文件資料集 本研究以臺灣地區圖書資訊學領域之學位論文與期刊文獻為研究對象。針對 學位論文的相關系所、15種期刊的名稱演變進行調查,以了解系所及期刊出版狀 況。. 學位論文. 經由全國博碩士論文資料庫的檢索系統,以資料庫檢索欄位「院校名 稱」、「系所名稱」、「畢業學年度」等欄位,以系統名稱 DP=「圖」、 「教育」搭配9所大學院校院校名稱進行檢索,整批下載搜尋結果的資料至 本機硬碟,接著,以人工檢視的方式比對各校系所畢業論文清單,將系統 下載錯誤及檔案格式空欄的部份,以手工鍵檔的方式補齊資料。以此方式, 39. 年刊. 臺北市立圖書館. 本研究擬採用的研究步驟,如下:. (一)、. 刊期.

(46) 下載民國62年至民國96年7月止,歷年來的學位論文研究文獻,共計912篇。. 每一篇學位論文,包含系統編號、研究生中文名、論文中文名稱、畢 業學年度、中文關鍵詞、論文中文摘要、論文參考文獻、引用文獻、論文 英文名稱、指導教授、學位類別、院校名稱、系所名稱、畢業學年度、論 文出版年度、論文頁數、英文關鍵詞、論文英文摘要、論文目次、論文開 放範圍等,共20個欄位。. 將全國博碩士論文資料庫下載的文件集,檢視整理、過濾重複資料後, 與自動萃選系統的欄位比對,對應出自動化分析需要的 6個主題分析使用 欄位,將欄位依照自動萃選系統欄位名稱轉入資料庫中,準備進行分析。 全國博碩士論文資料庫的欄位名稱與自動萃選系統欄位名稱(以英文代號 表示)、欄位意義,對應欄位資料範例,簡述如下: 系統編號(UT),例如:084FJU00447006。 畢業學年度(PY),例如:1994。 研究生中文姓名(AU),例如:康芳菁。 論文中文名稱(TI),例如:網路資源主題檢索機制之研究。 中文關鍵詞(DE),例如:檢索機制;主題檢索機制;網路資源;主題檢索。 論文中文摘要(AB),例如:本研究將以文獻分析法……. 院校名稱 中國文化大學 國立臺灣大學. 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 00 01 02 03 04 05 06 2 2 1 1. 2 1 2. 3 3. 3 4. 1. 2 3 8 10 6 9 8 6 12 14 6 17 12 12 11 10 12 12 15 16 12 12 14 22 12. 國立臺灣師範大學. 1 1. 輔仁大學. 2. 1 1. 12 10 10 41 39. 7 9 16 10 8 8 18 16 8 18 9 13. 國立政治大學. 2 4 5 8 13 15 17 17 14 10. 淡江大學. 16 11 10 21 16 12 12. 國立中興大學. 13 4 8 3 9 8. 世新大學. 11. 國立交通大學. 16 19 21 1. 40.

(47) 45. 中國文化大學. 世新大學. 國立中興大學. 40. 國立交通大學. 國立政治大學. 國立臺灣大學. 35. 國立臺灣師範大學. 淡江大學. 輔仁大學. 30 25 20 15 10 5 0 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 00 01 02 03 04 05 06 07. 圖3-1 臺灣地區圖書資訊學學位論文數量一覽表 * 學位論文文件集數量為0者,以空白表示. (二)、. 期刊文獻. 期刊文獻文件集,經由國家圖書館「中文期刊篇目索引影像系統」, 以刊名為檢索條件,整批下載搜尋結果的資料至本機硬碟,接著,以人工 建檔的方式將影像系統中無摘要資料的期刊文獻,到個出版單位的網站, 以下載或是單筆建檔的方式補足摘要。以此方式,本研究選定之圖書資訊 學15種期刊文獻,1994年至2007年7月止,共計3,128 筆。. 每一篇期刊文獻,包含篇名、並列篇名、作者、刊名、出版年、卷期 / 年月、出版者、中文關鍵詞、英文關鍵詞、類號、分類類目、中文摘要、 英文摘要等,共13個欄位。. 將國家圖書館「中文期刊篇目索引影像系統」下載的文件集,檢視整 理、過濾重複資料後,與自動萃選系統的欄位比對,對應出自動化分析需 要的 5個主題分析使用欄位,將欄位依照自動萃選系統欄位名稱轉入資料 庫中,準備進行分析。全國博碩士論文資料庫的欄位名稱與自動萃選系統 欄位名稱(以英文代號表示)、欄位意義,對應欄位資料範例,簡述如下:. 文獻篇名(SO),例如:談當前編目教育的衝擊與挑戰。 作者(AU),例如:張慧銖。 41.

(48) 期刊題名(TI),例如:國立台灣大學圖書館。 中文關鍵詞(DE),例如:編目教育。 中文摘要(AB),例如:目錄(catalog)及書目控制… …. 期刊 編號. 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006. 1. 37. 32. 34. 20. 20. 19. 18. 18. 18. 21. 20. 19. 24. 29. 28. 41. 30. 37. 28. 27. 23. 24. 21. 20. 6. 4. 6. 7. 5. 45. 38. 34. 33. 46. 31. 41. 37. 6. 17. 11. 6. 12. 16. 6. 7. 8. 7. 19. 27. 22. 21. 22. 21. 19. 14. 8. 26. 25. 29. 32. 40. 39. 31. 24. 9. 41. 34. 40. 33. 10. 6. 7. 11. 26. 28. 31. 33. 25. 28. 26. 27. 11. 7. 8. 9. 7. 16. 24. 12. 6. 6. 7. 7. 13. 20. 16. 19. 14. 16. 23. 17. 16. 14. 35. 36. 37. 33. 33. 31. 33. 29. 13. 49. 57. 47. 49. 52. 2 3. 13. 13. 10. 18. 4 5. 26. 41. 33. 35. 10. 45. 30. 25. 15. 16. 6. 60 50 40 30 20 10 0 1994. 1995. 1996. 1997. 1998. 1999. 2000. 42. 2001. 2002. 2003. 2004. 2005. 2006. 2007.

(49) 1. 大學圖書館. 2. 中華民國圖書館學會會報. 50. 3. 佛教圖書館館刊. 4. 美國資訊科學與技術學會臺北學生分會會訊. 40. 5. 臺灣圖書館管理季刊. 6. 國立成功大學圖書館館刊. 30. 7. 國家圖書館館刊. 8. 教育資料與圖書館學. 9. 資訊傳播與圖書館學. 10. 圖書與資訊學刊. 11. 圖書資訊學刊. 12. 圖書館學刊(輔大). 13. 圖書館學與資訊科學. 14. 臺北市立圖書館館訊. 60. 20 10. 19 94 19 95 19 96 19 97 19 98 19 99 20 00 20 01 20 02 20 03 20 04 20 05 20 06 20 07. 0. 15. 檔案季刊. 圖3-2 臺灣地區圖書資訊學期刊文獻數量一覽表 * 期刊文獻文件集數量為0者,以空白表示. 三、 資料彙整與詞彙過濾 針對步驟二轉入資料庫的文件集資料,進行數量量化分析與統計圖表製作, 對於文件集的年代分布、資料欄位特性有初步的了解。. 利用主題萃取系統中設定的執行指令,進行擷取關鍵詞彙、正規化詞彙(刪 除停用詞、介詞、連詞、定詞、虛詞)、瞭解資料欄位空值數量、資料欄位字數 統計、取得控制詞彙的文件列表(反向索引檔)等程序,以加速後續各種分析與 探勘的作業。. (一)、. 瞭解文件集中關鍵詞欄位內的詞彙,在標題與內文中出現的比例。. 學位論文文件集: Macro=0.3229, Micro=(375/393)=0.9542, No. of empty DE=607 期刊文獻文件集: Macro=0.1877, Micro=(724/741)=0.9771, No. of empty DE=2533. (二)、. 統計標題、摘要、關鍵詞等欄位之空值數量、字數等統計值。. 學位論文文件集: TI: EmptyRec=0, MaxWordCount=46, MinWordCount=5, Avg=20.2961 AB: EmptyRec=43, MaxWordCount=3503, MinWordCount=1,Avg=699.8257 DE: EmptyRec=32, MaxWordCount=21, MinWordCount=1, Avg=4.3377. 期刊文獻文件集: TI: EmptyRec=61, MaxWordCount=129, MinWordCount=1, Avg=16.6415 43.

(50) AB: EmptyRec=2397, MaxWordCount=753, MinWordCount=2,Avg=51.0061 DE: EmptyRec=433, MaxWordCount=13, MinWordCount=1, Avg=3.2001. 四、 自動化歸類研究主題 以文字探勘、文件自動擷取關鍵詞、詞彙歸類、關鍵詞趨勢分析等方式,首 先將出現在文字訊息中的字串擷取出來作為分析詞彙,接下來結合詞彙出現年 份,並以自動歸類的方法,選出主要的研究主題詞彙,進行分析及資料驗證。. 詞彙 T. 詞彙 2 詞彙 1. 文 件 A. 文 件 B. 圖3-3 共現字分析示意圖 (引用自:曾元顯、林瑜一(2006)。文字探勘技術在教育評鑑研究發展趨勢分析之應用。). 五、 多階層主題歸類 將「詞彙(term)」或「文件(doc)」歸類成「概念(concepts)」、「概 念(concepts)」歸類成「主題(topics)」、「主題(topics)」歸類成「次領 域(sub-domain)」,「次領域」再歸類為「大領域」,以便於分析。歸類後, 並自動擷取各類別特徵詞彙或標題詞彙,以便於判讀(曾元顯,林瑜一,2006)。. 44.

參考文獻

相關文件

,增加生活的新意;有人把碗盤碎片巧妙安排,變 成美麗的壁畫……。只要多留心生活事物,運用想 像力,你也會成為創意大師。.. 「歸納

符合前條所定雇主應於每年中央主管機關公告期間內,檢附下列文件、資

推理論證 批判思辨 探究能力-問題解決 分析與發現 4-3 分析文本、數據等資料以解決問題 探究能力-問題解決 分析與發現 4-4

所有精教 的圖書 二年級 課程統籌主任. 三年級 課程統籌主任、圖書館主任

• 中文科、常識科及圖書科協 作,以「活在資訊中」為主 題,進行本科、跨學科讀書 會,增加閱讀量,培養閱讀 興趣..

在選擇合 適的策略 解決 數學問題 時,能與 別人溝通 、磋商及 作出 協調(例 如在解決 幾何問題 時在演繹 法或 分析法之 間進行選 擇,以及 與小組成 員商 討統計研

在選擇合 適的策略 解決 數學問題 時,能與 別人溝通 、磋商及 作出 協調(例 如在解決 幾何問題 時在演繹 法或 分析法之 間進行選 擇,以及 與小組成 員商 討統計研

•在理解的 基礎上,推 斷閱讀材料 以外的內容