• 沒有找到結果。

第四章 檢索實作分析與比較

第一節 檢索實作與界面說明

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

41

第四章 檢索實作分析與比較

本研究第四章及第五章為檢索實作與檢索結果的分析與討論,第四章為分析 與比資料庫與系統的檢索界面,第五章為各資料庫與系統的檢索結果分析與比較。

本章一共分為三節,第一節為資料庫與系統的檢索實作與檢索界面說明,第二節 為資料庫與系統檢索界面功能分析與比較,第三節則為 SCIE、Scopus 與 MAS 作者檢索功能之分析。因 SCIE、Scopus 與 MAS 都有建置作者檔,其作者檢索 功能與一般進階檢索功能中的作者檢索不同,故本研究特地立一節說明。

第一節 檢索實作與界面說明

本研究以 1991 至 2011 年榮獲美國計算械學會杜林獎的 30 位得獎者姓名為 檢索詞,於各資料庫與系統之作者檢索欄位進行檢索,並根據各資料庫與系統所 提供的資料輸出方法,將檢索結果匯出後自行整理及統計。本研究的作者檢索,

亦根據各資料庫與系統所提供的作者姓名輸入格式,進行資料檢索。從第二章的 文獻探討可知,各資料庫與系統有不同的資源收錄標準,各期刊對投稿作者的姓 名著錄要求也不盡相同,因此會有相同作者不同姓名組合的情況發生。且早期因 數位資源儲存空間有限,作者姓名幾乎都採用縮寫格式進行著錄,故無法以統一 的作者姓名組合於各資料庫與系統進行檢索。此外,將作者姓名當作為檢索詞彙,

難以避免有同名同姓之問題,無法檢索到正確的資料。有鑑於此,本研究根據作 者姓名、文章題名及來源題名逐筆過濾檢索結果,以取得最正確的資料。不論是 資料的檢索或處理,本研究都根據各資料庫與系統的特性與提供的功能,決定資 料的檢索及處理方法。

本研究的檢索詞彙為作者姓名,若加上作者服務機構或研究領域為限制條件 的檢索策略,理應可以幫助使用者檢索到最正確的資料。但是,由於作者任職單

RefWorks 網路版將所選擇的資料匯出,全部資料匯出之後再轉至 Excel 再次逐筆 過濾。雖然 MAS 的檢索結果也非常多,但 MAS 可以將檢索結果一次全部匯出,

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

43

資料庫的資料檢索、檢索結果與資料輸出項目敘述如下:

(一) Science Citation Index Expanded (SCIE) 1. 資料檢索

如圖 4-1-1 所示,SCIE 的檢索可分為一般檢索(search)、作者檢索(author search)、引用文獻檢索(cited reference search)與進階檢索(advanced search)四種,

圖 4-1-2 即為 SCIE 的作者檢索頁面,因本研究所使用的檢索詞彙為作者姓名,

故直接利用作者檢索工具進行資料檢索。本研究依照 SCIE 規定的檢索格式,

在頁面左側(圖 4-1-2)的檢索欄位輸入作者姓氏,於右邊的檢索欄位輸入作者名 稱的縮寫後執行檢索。

圖 4-1-1 SCIE 一般檢索

圖 4-1-2 SCIE 作者檢索

圖 4-1-3 為 SCIE 的檢索結果,顯示項目包含文章題名、作者、來源題名、

期刊卷期、頁碼、數位資源識別碼(Digital Object Identifier, DOI)、出版年、被引 用次數、使用者所在機構與文章的摘要。左邊的限縮結果(refine results)提供可於

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

44

此檢索結果內進一步查詢的檢索欄位,其分析欄位裡所包含的限縮條件項目有 SCIE 涵蓋的學科分類(Web of Science categories)、資料類型(documents types)、研 究領域(research areas)、作者(authors)、團體作者(group authors)、編輯者(editors)、

來源題名(source titles)、叢書題名(book series titles)、出版日期(publication years)、

機構-加強版(organizations-enhanced)、贊助機構(funding agencies)、語言(language) 與國家/地區(countries/territories)13 種選項。使用者可以選擇要限制(limit)或排除 (exclude)分析欄位裡所包含的限縮項目,進一步查詢以縮小檢索結果的範圍。

SCIE 的檢索結果排序(sort by)方式非常多元,有出版日期(publication date)、處理 日期(processing date)、被引用次數(times cited)、相關性(relevance)、第一作者(first author)、來源題名(source title)及會議名稱(conference title)等 13 種。不論按照何 種排序方式,SCIE 每頁的檢索結果顯示筆數都是 3 種,有 10、25 和 50 筆,每 頁面最多可顯示的筆數為 50 筆。

圖 4-1-3 SCIE 作者檢索結果

2. 資料輸出

從圖 4-1-4 可知,SCIE 的資料輸出模式分為列印、電子郵件寄送、儲存至安 裝版或網路版 EndNote 書目管理軟體以及儲存成檔案或至其他書目管理軟體五 種。其匯出選項有儲存至其他書目管理軟體(save to other reference software)、

BibTex 格式 (save to BibTex)、HTML 格式(save to HTML)、純文字格式(save to plain text)、不同系統(Win 或 Mac)的定位分隔格式(save to tab-delimited)及不同系 統(Win 或 Mac)的定位分隔萬國碼格式(save to tab-delimited (UTF-8))8 種。使用

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

45

者可根據所使用之電腦系統類型與書目管理軟體匯出資料,本研究選擇第五種方 法,儲存為 Windows 系統定位分隔格式檔後再轉入 Excel 處理。SCIE 的資料匯 出範圍選擇有四種,第一種為作者、題名及資料來源(authors, title, source),第二 種為作者、題名、資料來源和文章摘要(authors、title、source plus abstract),第三 種為完整記錄(full record),第四種為(full record plus cited references)完整記錄加 參考文獻。除了進行資料過濾較全面之相關的資訊外,為了修正與補足資料匯出 時發生欄位錯誤與缺漏,本研究選擇第三種方式匯出完整記錄。SCIE 的檢索結 果匯出筆數選擇有三種,第一種為選擇本頁所勾選的記錄匯出、第二種為本頁所 有的記錄,第三種為一定範圍內的記錄,例如 1 至 500 筆,SCIE 一次最多可以 匯出的數量是 500 筆記錄,本研究會根據每次的檢索結果數量,決定欲要匯出的 筆數。

圖 4-1-4 SCIE 資料輸出 (二) Scopus

1. 資料檢索

Scopus 的檢索方式共有文件檢索(document search)、作者檢索、機構檢索 (affiliation search)與進階檢索四種。與 SCIE 相同,本研究亦使用 Scopus 的作者 檢索進行資料檢索。圖 4-1-5 為 Scopus 的一般檢索界面,圖 4-1-6 則為 Scopus 的作者檢索界面。Scopus 的作者姓名檢索格式與 SCIE 相同,一樣是左邊欄位為 姓,右邊欄位為名。本研究根據 Scopus 所規定的輸入格式,於右邊檢索欄位輸 入作者的名稱,於左邊欄位輸入作者姓的縮寫後執行資料檢索。Scopus 的作者 檢索頁面,比 SCIE 多出一個機構檢索的欄位;然而,為了檢索到最完整的結果,

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

46

本研究對檢索結果的唯一限制只有出版年代,不會使用機構檢索的欄位。

圖 4-1-5 Scopus 一般檢索

圖 4-1-6 Scopus 作者檢索

2. 資料呈現

圖 4-1-7 為 Scopus 的檢索結果,其以分欄式顯示文章題名、作者、日期、來 源、被引用次數、摘要、出版單位及相關文獻等項目,為五個資料庫與系統中最 清楚的呈現。左邊的限縮結果欄位可供使用者於檢索結果內進一步查詢,其分析 欄位裡所包含的限縮條件項目有年代(year)、作者名稱(author name)、學科領域 (subject area)、文件類型(document type)、來源題名、關鍵字(keyword)、機構 (affiliation)、國家、來源文獻類型(source type)與語言 10 項,使用者可以選擇要 限制或排除這些條件,以縮小檢索結果的範圍。其資料排序方式有日期的新舊 (date newest/oldest)、被誰引用(cited by)、相關性、第一作者姓名字母順序(author

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

47

A-Z/Z-A)和來源題名字母順序(source titleA-Z)七種。Scopus 的每頁檢索結果顯示 筆數有 20、50、100 及 200,共 4 種選擇。每頁可顯示的資料最多為 200 筆,是 SCIE 的 4 倍。

圖 4-1-7 Scopus 作者檢索結果

3. 資料輸出

Scopus 所提供的資料輸出方式有匯出(export)、列印、以電子郵件傳送(e-mail) 或產生書目格式(create a biliography)四種,請見圖 4-1-8。匯出格式則有儲存為文 字檔(text(ASCII format))、直接匯入 RefWorks(RefWorks direct export)、存為 RIS 格式(RIS fomat(Reference Manager, ProCite, EndNote))、BibTex 格式及逗號分隔型 取值格式(comma separated file, .csv(e.g. Excel))五種(詳見圖 4-1-9)。本研究選擇第 五種,儲存為 csv 檔,以 Excel 開啟後再轉存為.xls 檔。Scopus 所提供的 csv 檔 格式非常方便,有助於使用者節省資料匯出整理的時間。Scopus 的資料匯出範 圍有五種,分別為引用次數(citations only)、摘要格式(abstract format)、包含參考 文獻及摘要(abstract format with reference)、完整格式(complete format)及指定欄位 的匯出(specify fields to be exported)。與 SCIE 相同,本研究亦選擇完整格式匯出,

待確認欄位位置與資料都正確無誤後,才刪除不需要的欄位,保留作者、文章題 名、來源題名、文件類型等本研究所需要之欄位。Scopus 的檢索結果匯出筆數 為 1 至 2,000 筆,一次至多可匯出 2,000 筆,是 SCIE 的 4 倍。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

48

圖 4-1-8 Scopus 資料輸出 1

圖 4-1-9 Scopus 資料輸出 2 二、 開放取用系統

本研究所使用的開放取用系統共有三種,分別為 GS、MAS 及 CiteSeerX。 以下將依序逐一說明其資料檢索、資料呈現及資料輸出方式。

(一) Google Scholar(GS) 1. 資料檢索

GS 所提供的檢索功能有一般檢索與進階檢索兩種,詳見圖 4-1-10 與 4-1-11。

由於 Google 收錄的資源包羅萬象,為避免檢索到太多不相關的結果,本研究選 擇 GS 進階檢索裡的作者檢索進行資料檢索。此外,由於使用不同語言(如英文 或中文)的檢索界面,會造成檢索結果的差異性(如圖 4-1-12 和圖 4-1-13 所示),

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

49

且因本研究的檢索詞彙(作者姓名)都為英文字母,故本研究使用英文版的 GS 進 行檢索。從圖 4-1-11 中可知 GS 的進階檢索一共有九個欄位,使用者可於前四個 欄位中輸入欲查尋的文章字串,亦可以限制檢索條件,尋找文章包含所有字詞 (with of the words)、包含完全符合詞組(with the exact phrase)、包含至少一個字詞 (with at least one of the words)、不包含此字詞(without the words)、字詞出現位置 (where my words occur): 文章中任何地方(anywhere in the article)、在文章的標題 中(in the title of the article),亦可以使用作者(return articles authored by)、出版社 檢索(return articles published by),並可限制時間(return articles dated between)。為 避免檢索到太多不相關或重覆的結果,本研究以作者全名(例如:Pearl Judea)於 作者檢索欄位進行檢索,並將檢索年代設定為 1990 至 2012 年間。雖然 GS 可以 設定資料檢索結果的語言,但因 GS 每次打開新的網頁,某些項目條件須花時間 重設,且考慮到檢索結果語言的設定對本研究的檢索結果不會產生影響(如圖 4-1-12 與圖 4-1-13 所示),故在檢索時沒有特別限制檢索結果的語言。

圖 4-1-10 GS 一般檢索

圖 4-1-11 GS 進階檢索

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

50

圖 4-1-12 GS 檢索結果(英文版)

圖 4-1-13 GS 檢索結果(中文版)

2. 結果顯示

如圖 4-1-14,GS 的檢索結果顯示項目包含文章題名、檢索詞、作者、年代、

來源、摘要、被引用次數、相關文獻、所在圖書館及超連結。其資料排序方式僅 有兩種,可按照日期(sort by date)或相關性(sort by relevance)排序。左邊檢索結果 顯 示 選項 裡除 了檢 索 結 果排 序 方式 外 , 還 有文 章(articles)、法 律文獻(legal documents)、任何時間(anytime)、專利(patents)及引用次數等選項。GS 為五個資 料庫與搜尋引擎中,檢索結果排序功能位於左邊的搜尋引擎,SCIE、Scopus、

MAS 及 CiteSeerX的排序功能都在界面的右邊。由於 GS 系統的限制,無法檢視 所有的檢索結果,為避免排序方式影響檢索結果,本研究僅使用 GS 的相關性排 序方式排序其檢索結果。GS 的檢索界面語言、結果顯示方式和匯出模式都必須 在檢索前先做設定,例如,其原本每頁最多顯示的結果為 10 筆,必須在檢索前 先設定其顯示筆數為 20 筆。因本研究需逐筆過濾,每頁可顯示結果越多,對於

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

51

資料過濾時間的節省也會有所幫助,故在檢索前會將每頁的顯示筆數設定為 20 筆。

圖 4-1-14 GS 檢索結果

圖 4-1-15 GS 檢索條件設定

3. 資料輸出

GS 唯一的資料輸出方式為資料匯出,如圖 4-1-15 所示,GS 提供三種書目 軟體(EndNote、RefWorks、RefMan)和 BibTex 共四種檢索結果匯出格式。本研究

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

52

在檢索前就先將匯出格式設定為 RefWorks,故本研究的 GS 檢索結果所呈現的匯

在檢索前就先將匯出格式設定為 RefWorks,故本研究的 GS 檢索結果所呈現的匯