• 沒有找到結果。

檢索問題對資訊尋求和資訊檢索之影響

N/A
N/A
Protected

Academic year: 2021

Share "檢索問題對資訊尋求和資訊檢索之影響"

Copied!
17
0
0

加載中.... (立即查看全文)

全文

(1)

檢索問題對資訊尋求和資訊檢索之影響

An Empirical Study on Information Seeking and Information Retrieval—Focusing on the Role of Questions

黃慕萱Mu-hsuan Huang 國立臺灣大學圖書資訊學系教授

Professor, Department of Library and Information Science, National Taiwan University

E-Mail:mhhuang@ccms.ntu.edu.tw

 

陳明君Ming-chun Chen 國立臺灣大學圖書館特藏組

Special Collection Department, N T U Library

E-Mail:ivy@ms.cc.ntu.edu.tw    

摘要

本文探討光碟資料庫終端使用者之檢索問題對資訊尋求和資訊檢索之影響。本研究以國立臺灣大 學學生為研究對象,以PsycLIT光碟資料庫為檢索系統,計有52位檢索者,總共進行58次檢索。 本研究系統化地蒐集終端使用者之檢索背景、檢索問題和檢索結果,對於檢索問題進行性質上的 分析,並進而探討檢索問題對檢索結果的影響。

Abstract

(2)

undergraduate and graduate students at National Taiwan University when using PsycLIT database. 52 subjects were studied through the semester, carrying out 58 searches. This study investigates information seeking and information retrieval by analyzing the use and influence of

questions. 關鍵詞:檢索問題;資訊尋求;資訊檢索

Keywords:Question;Information seeking;Information retrieval

一、問題陳述

人們為了解決所面臨的資訊爆炸(information explosion)困境,而有資訊系統的發明;資訊系 統的功能不僅在於儲存及處理資訊,更在於讓人們以最有效率的方式獲取所需資訊,故有資訊科 技的不斷研發。然而,效率的提升僅憑系統單方面加強其儲存容量與處理速度是不足的,尚須令 系統儘量配合使用者的想法與行動來提供資訊,所以今日系統設計的指導原則逐漸由系統導向轉 為使用者導向,唯有從使用者角度所設計的資訊系統,才能充分發揮溝通的效益;因此由使用者 的角度進行有關資訊檢索之研究,已成為不可避免的趨勢。換言之,如何分析並了解使用者之資 訊需求、檢索問題、檢索過程及其對資訊尋求及資訊檢索之影響等,均為資訊檢索中刻不容緩之 重要研究議題。 檢索問題是使用者面臨的難題、資訊尋求的動機和目的,以及內在知識狀態的呈現,對於檢索者 決定要檢索什麼資料、如何進行檢索的影響很大。(註1)而檢索問題反映出檢索者已發展之有 關其資訊需求的心智模型,檢索者的認知型態影響到檢索問題的型態,同時支配著答案是否符合 檢索者的資訊需求(註2),因此必須從檢索者對問題認知的觀點研究問題的性質,檢視不同特 性的檢索問題對於資訊尋求和資訊檢索之影響。 有關檢索問題理論方面之研究,大多是純粹探討檢索問題本質的論述,以助於對問題的瞭解,進

而提升檢索效益。這類文獻並不多,除Taylor(註3)、Saracevic & Baxter(註4)對檢索問題

的界定略有論及外,尚有Derr(註5)、Graesser & Murachver(註6)(註7)等學者曾探討檢

索問題的性質與結構。其中Taylor提出資訊需求的四個層次,從內藏的資訊需求(the visceral need)、意識化之資訊需求(the conscious need)、正式之資訊需求(the formalized need)到妥 協後之資訊需求(the compromised need),雖然未經實證研究證實,但其影響相當深遠。而 Saracevic和Baxter對問題分類的研究,後續許多研究皆援例採用,作為測定不同檢索問題類型 之影響性的依據。他們區分檢索問題類型為前置問題(lead-in)、主題(subject)、題目 (query)與限制四部份,並開創依範疇(domain)、清楚程度(clairly)、專指度

(specificity)、複雜度(complexity)、及前提假定(presuppsoition)五種屬性分類問題的先 河。

關於檢索問題分類的實證方面研究,至少包括Saracevic & Kantor(註8),Iivonen(註9)及

Keyes(註10)等之作品。其中Saracevic和Kantor沿用Saracevic和Baxter的五大屬性,而

(3)

念完成型(concept completion)、因果型(causation)、聯想型(association)與非聯想型 (disassociation)五種。依據不同的分類準則,學者設計不同的研究說明不同類型問題對資訊 尋求和資訊檢索之影響。 國內目前有關資訊尋求和資訊檢索的研究,不論是理論導向或是實證導向,都已開始萌芽,但有 關過程與問題方面的研究仍稍嫌不足。在短期內,除少數文史研究外,國人學術研究可能仍以參 考國外的資料為主,因此瞭解國人檢索西文學術資料庫的行為,一直是相當值得重視的議題。有 鑑於此,本計畫以國立臺灣大學學生為研究對象,以PsycLIT光碟資料庫為檢索系統,系統化地 蒐集終端使用者之檢索背景、檢索問題和檢索結果,對於檢索問題進行性質上的分析,進而探討 檢索問題對檢索結果的影響。

二、研究設計和研究對象

本研究利用線上電子佈告欄(Bulletin Board System,BBS)及人工張貼佈告的途徑,於國立臺 灣大學校園內公開徵求資訊需求者,招募52位願意參加本研究之資訊需求者,總共進行58次檢 索,進行2次檢索之實驗對象並不多,只有4位,另有1位檢索者進行3次檢索。在本研究中,每一 位實驗對象必須填寫兩份問卷,第一份問卷是「檢索者背景問卷」,目的是調查檢索者的個人背 景資料,包括性別、學科背景、年級和資訊檢索系統之檢索經驗等。第二份問卷是「檢索問題背 景問卷」,在填寫檢索問題背景問卷前,檢索者必須口頭陳述其檢索問題,研究者以實地錄音的 方式,以期獲得較詳細而完整的資料,作為分析檢索問題範疇和前提假定個數及性質的依據。在 「檢索問題背景問卷」中,請檢索者將其檢索問題分解成幾個概念,分別列出相關的詞彙、同義 字與不想列入檢索的詞彙,再配合錄音所得之資訊需求,作為分析檢索問題複雜性和專指性之依 據。同時也蒐集實驗對象對此次檢索主題的熟悉程度和本次問題的檢索經驗等相關資料。 終端使用者在檢索之前,必須聽取研究者半小時的資料庫使用說明,為了讓所有的說明一致,研 究者根據其所撰寫之「PsycLIT光碟資料庫使用說明」,逐步介紹資料庫之內容範圍、檢索方式 和修改檢索策略之方法。主要的目的在於確定不論研究對象是否曾使用過PsycLIT,皆瞭解資料 庫的主題、收錄範圍、收錄資料類型、收錄年代、基本檢索方式和修改檢索策略的基本觀念等, 以控制因訓練方式不同所產生的變因。基本上,使用說明包括PsycLIT光碟資料庫簡介、檢索方 式介紹(包括主題檢索、作者檢索和限定欄位檢索)、修改檢索策略介紹(包括檢索結果筆數過 多與過少時之因應方法),同時舉一檢索範例加以具體說明。而後,由研究對象自行進行檢索。 在檢索過程中,研究者在旁記錄觀察的結果,檢索者必須獨立完成檢索,研究者只扮演旁觀者的 角色,即使檢索者發問,研究者也不會回答任何問題。檢索者完成檢索後,研究者利用訪談法, 確認在檢索過程中觀察發現的問題。同時透過PsycLIT光碟資料庫本身的功能抓取檢索策略與檢 索結果。 本研究一共有52位檢索者,其中男性11位(佔21%),女性41位(佔79%),女性檢索者將近4 倍於男性。而來自非心理系所的研究對象共有18位,以女性居多(共有15位),男性只有3位; 來自心理系所的研究對象共有34位,絕大多數為女性,共有26位,男性則僅有8位,而根據心理 系提供之資料,該系大學部和研究所學生男女比例將近一比一,因此可知女性參與研究之意願較 高。由表1顯示,在52位檢索者中,有32位是研究生(61.5%),包括碩士班學生26人 (50%),博士班學生6人(11.5%);有20位是大學部學生,大一和大二各有2人(各佔

(4)

3.9%),大三有4人(佔7.6%),大四則有12人(佔23.1%)。許多前人的研究顯示,線上資料 庫之終端使用者最大族群為研究生,而本研究光碟資料庫的使用者中,亦以研究生為主,超過半 數(61.5%),若以大三以上為高年級,可發現所佔比例更高達92.2%(48人),而低年級(大 一和大二)則只有7.8%(4人)。至於研究對象的學科背景,表2顯示檢索者之系別,檢索者來自 心理系所的有34人(65.4%)最為集中,其他系所則較為分散,社會系所有5人(9.7%),城鄉所有 4人(7.8%),護理系所有2人(3.8%),其餘公衛所、醫學系、生化所、語言所、圖書資訊 所、資管系和歷史系之檢索人數皆僅有1人(各佔1.9%)。造成心理系所檢索人數較多的原因, 應和PsycLIT光碟資料庫為心理學重要的專業資料庫有關,心理系所學生原本即為主要的使用 者,因此研究對象集中於心理系所學生是相當自然的現象。 表1 研究對象年級分析統計表 年 級 人 數 百分比 累計百分比 大一 2 3.9 3.9 大二 2 3.9 7.8 大三 4 7.6 15.4 大四 12 23.1 38.5 碩士班 26 50.0 88.5 博士班 6 11.5 100.0 總計 52 100.0     表2 研究對象所屬系別分析統計表 系 別 人 數 百分比 累計百分比 心理系所 34 65.4 65.4 社會系所 5 9.7 75.1 城鄉所 4 7.8 82.9 護理系所 2 3.8 86.7 公衛所 1 1.9 88.6 醫學系 1 1.9 90.5 生化所 1 1.9 92.4 語言所 1 1.9 94.3 圖書資訊所 1 1.9 96.2

(5)

資管系 1 1.9 98.1 歷史系 1 1.9 100.0 總計 52 100.0 針對檢索者資訊系統的使用經驗進行分析,本研究中有38位檢索者(73.1%)表示曾經使用過 PsycLIT光碟資料庫,但上學期使用的次數並不多,平均每人只有使用過5.04次,標準差為 6.37。至於其他光碟資料庫的使用經驗,有35位檢索者(67.3%)表示曾經使用過其他光碟資料 庫,其中以MEDLINE、SCI、SOCIOFILE和中華民國期刊論文索引光碟資料庫較多。而所有檢 索者皆使用過線上公用目錄,上一學期平均每人使用過20.81次,標準差為24.73。總而言之,上 一學期檢索者使用次數較多的是線上公用目錄,其次是PsycLIT光碟資料庫,曾使用過其他光碟 資料庫之檢索者則較少。 本研究的重點在分析終端使用者之檢索問題及其對檢索結果之影響。先從檢索問題之範疇、複雜 性、專指性與前提假定等四個構面進行分析,同時說明檢索者之該次問題的檢索經驗對主題熟悉 程度之影響,再探討檢索問題對檢索結果之影響。

三、檢索問題分析

在分析檢索問題方面,根據終端使用者口頭及書面陳述之檢索問題進行分析。依據研究對象口頭 陳述之資訊需求,分析檢索問題的範疇和前提假定的個數及性質;至於問題的複雜性和專指性則 同時根據口頭陳述的資訊需求及檢索者在「檢索問題背景問卷」中寫下的概念詞彙進行分析。 在本研究中,52位研究對象共完成58次檢索。在52位研究對象中,有4位進行2次檢索,1位進行3 次檢索。在2次檢索的4位檢索者中,僅有1位延續檢索與第1次相關主題的問題,3位檢索與第1次 不同的檢索問題;進行3次檢索的檢索者,其中2次檢索相關主題,1次檢索不同主題,因此共有2 個與第1次檢索相關的問題。仔細分析此2組問題(檢索編號4和35以及編號14和52),發現雖然 第2次檢索的主題與第1次相關,但是其問題的範疇、複雜性、專指性和前提假定之個數與性質皆 有變化,例如編號4之研究對象的問題是「跟師生間的權力互動有關的,跟權力知識相關的,也 就是師生之間的權力分析。」,而在第2次檢索時,陳述的資訊需求則為「我這次要找的主題跟 上次一樣,也是以權力為主要的概念,我想用『社會交換』的角度來看權力要怎樣定義。」(編 號35),因此進行問題範疇、複雜性、專指性和前提假定之個數與性質分析時,將此4個問題皆 視為個別的問題,共針對58個檢索問題進行分析。 (一)檢索問題之範疇分析

分析檢索問題的範疇,乃依據美國心理學會所編之“Thesaurus of Psychological Index Terms”(1997年版) 中之附錄—「內容分類系統」(Content Classification System)

歸類檢索問題之範疇。(註11)根據錄音所得終端使用者口頭陳述之資訊需求進行分析,

表3顯示,16次檢索之檢索主題(27.7%)與心理治療和預防法有關,有9次檢索主題 (15.6%)為社會心理學方面,有8次檢索主題(13.8%)為社會的過程和社會議題,有6 次檢索的檢索主題(10.3%)是生理心理學和神經科學方面,而與實驗心理學、心理的和

(6)

身體的失調與工程和環境心理學相關的主題各有4次,各佔6.9%。此外,有關溝通系統、 發展心理學與消費心理學相關範疇之檢索問題各有2次檢索,各佔3.4%,而與企業和組織 心理學主題相關之檢索則有1次,佔1.7%。為方便之後的統計分析,將檢索問題的範疇簡 化歸為四類,第一類為實驗與認知心理學(10次,17.2%),包括生理心理學和神經科學 以及實驗心理學(人);第二類為社會與人格心理學(21次,36.2%),包括社會心理 學、社會的過程和社會議題、溝通系統以及發展心理學;第三類為臨床心理學(20次, 34.6%),包括心理治療和預防法以及心理的和身體的失調。第四類為工商心理學(7次, 12%),包括工程和環境心理學、消費心理學以及企業和組織心理學。其中檢索次數較多 的範疇為社會與人格心理學及臨床心理學方面。造成此兩個範疇較多的原因相同,皆因為 心理系所中有多位檢索者同樣修專論課程,為完成學期報告而針對相關主題進行檢索。就 社會與人格心理學而言,例如有5次檢索之檢索者修臨床專論課程,探討的是壓力方面問 題,檢索問題中有關大學生與同儕的壓力(檢索編號37和46)、男女交往時面臨的壓力問 題(編號44和47)和老人對死亡的看法及其面臨的生活壓力(編號49)等,皆屬於社會與 人格心理學範疇;而就臨床心理學範疇來看,例如有3次檢索問題為慢性疾病的壓力測量 (編號17)、壓力的定義與其動力歷程(編號25)、壓力與自我效能(編號30)等,皆屬 於臨床心理學。又如有5次檢索之檢索者修團體治療方面的課程,為撰寫學期報告,檢索 兒童與青少年的團體治療(編號33)、成長團體和self-help group之差別(編號34)、住 院病人的團體治療(編號42)、藥物濫用病人的團體治療(編號45)以及團體治療中的互 動分析(編號55)等,皆屬於臨床心理學範疇。其它還有如人際衝突的調適與情緒狀態之 關係、癌症兒童的憂鬱傾向探討、憂鬱症與自殺以及心理演劇等檢索問題也是屬於臨床心 理學方面,因此呈現出檢索問題的主題以社會與人格心理學及臨床心理學範疇較多。 表3 檢索問題範疇分析表 範 疇 次數 百分比 累計百分比 實驗與認知心理學 10 17.2   生理心理學和神經科學 6 10.3 10.3 實驗心理學(人) 4 6.9 17.2 社會與人格心理學 21 36.2   社會心理學 9 15.6 32.8 社會的過程和社會議題 8 13.8 46.6 溝通系統 2 3.4 50.0 發展心理學 2 3.4 53.4 臨床心理學 20 34.6   心理治療和預防法 16 27.7 81.1 心理的和身體的失調 4 6.9 88.0 工商心理學 7 12.0   工程和環境心理學 4 6.9 94.9

(7)

消費心理學 2 3.4 98.3 企業和組織心理學 1 1.7 100.0 總計 58 100.0   (二)檢索問題之複雜性分析 另從檢索問題的複雜程度來看,根據問題呈現的概念數,進行檢索問題的複雜性分析。問 題中包含的概念愈多,則複雜程度愈高。檢索問題的複雜性分析分為兩個部份,第一部份 是在檢索之前,請實驗對象填寫「檢索問題背景問卷」,請其將檢索問題分解成幾個概 念,此部份是由實驗對象自行分析問題的複雜性;第二部份是在實驗對象完成檢索之後, 研究者根據實驗對象自行分析概念的結果,配合其口頭陳述的資訊需求,解讀問題的複雜 性。表4顯示檢索者自行分析問題複雜性的結果,檢索問題中包含一個概念的檢索有4次 (6.9%),含二個概念的檢索有12次(20.7%),檢索問題中包含三個概念的檢索最多, 有36次(62.1%),含四個概念的檢索有4次(6.9%),包括五個概念的檢索則有2次 (3.4%)。 表4 檢索者自行分析之檢索問題複雜性統計表 概念個數 次數 百分比 累計百分比 一個概念 4 6.9 6.9 二個概念 12 20.7 27.6 三個概念 36 62.1 89.7 四個概念 4 6.9 96.6 五個概念 2 3.4 100.0 總計 58 100.0   而表5是研究者分析問題複雜性的部份,檢索問題中也是含三個概念的檢索次數最多,有 26次(44.8%),其次是含二個概念的檢索,有14次(24.2%),再其次是含四個概念, 有6次(10.3%),另外是檢索問題中包含五個概念的檢索,有5次(8.6%),而含ㄧ個概 念的則有4次檢索(6.9%),含六個概念的有3次,佔5.2%。 表5 研究者分析之檢索問題複雜性統計表 複雜性 次數 百分比 累計百分比 複雜性低 18 31.1   一個概念 4 6.9 6.9 二個概念 14 24.2 31.1

(8)

複雜性中 32 55.1   三個概念 26 44.8 75.9 四個概念 6 10.3 86.2 複雜性高 8 13.8   五個概念 5 8.6 94.8 六個概念 3 5.2 100.0 總計 58 100.0   比較實驗對象自行分析和研究者分析的結果,發現檢索問題中皆以含三個概念者最多。若 用1至6代表檢索問題複雜程度由低至高,發現實驗對象自行分析問題複雜性的平均值為 2.79,標準差為0.81,低於研究者分析的結果(平均值3.05,標準差為1.21)。造成差距的 原因有兩個,一是部份實驗對象只分析出主題的概念,但研究者分析的標準則是將問題中 代表主題(檢索的中心概念)和題目(對於主題的特定觀點)的概念皆視為個別的概念, 因此分析出的概念較多,複雜程度較高。以檢索編號11為例,其口頭陳述的資訊需求為 「有關創業的資料。創業跟組織行為學、社會學、經濟學和管理學有關,包含的概念有創 業者的特質、行為、決策方式、與他人合夥,以及如何領導別人成立組織等。」,檢索者 將其問題的概念歸為一個--創業,而研究者則將題目視為個別的概念,把問題分解成六個 概念,分別為創業、創業者的特質、創業者的行為、創業者的決策方式、創業者與他人合 夥,以及創業者如何領導別人成立組織。還有另一個原因是檢索者將不同的概念歸為一個 概念,例如檢索編號8之檢索者的資訊需求為「我想查有關青少年問題,包括青少年犯 罪、對青少年的福利措施,還有單親家庭的影響,社會觀、價值觀的影響。」檢索者將其 問題分解成三個概念,第一個概念是青少年、福利和單親家庭;第二個概念包括犯罪和價 值觀;第三個概念為社會影響。但研究者在實驗對象完成檢索後,配合其口頭陳述的資訊 需求,將其問題分解成六個概念,分別為青少年、犯罪、福利、單親家庭、價值觀和社會 觀。 在之後的統計分析中,對於檢索問題之複雜性分析,採用研究者分析的結果。同時為便於 之後的統計分析,將問題的複雜性分為低、中、高,複雜性低表示包含一至二個概念(18 次。31.1%),複雜性中度表示檢索問題中包含三至四個概念(32次,55.1%),至於檢 索問題複雜性高表示其包含五至六個概念(8次,13.8%)。經由歸納後發現,各次檢索問 題之複雜程度以中度最多,低度次之,複雜性高度者最少。(見表5) (三)檢索問題之專指性分析 除從範疇與複雜性兩個角度分析檢索問題外,檢索主題的專指性亦是瞭解檢索問題性質的 一重要指標。根據錄音所得終端使用者口頭陳述之資訊需求,以及在「檢索問題背景問 卷」中實驗對象寫下的概念詞彙進行分析。首先根據口頭陳述的資訊需求分析檢索問題的 結構,將問題依前置詞、主題和題目進行分析,由於主題是檢索的中心概念,因此再從 「檢索問題背景問卷」中檢索者所填寫的概念詞彙裡,找出代表主題的概念詞彙,根 據“Thesaurus of Psychological Index Terms”(1997年版),分析主題之專指度。評估

(9)

指數由1開始,1代表該主題在“Thesaurus of Psychological Index Terms”中是最廣泛的 主題,若能再往下細分一層,則給指數2,以此類推,因此指數愈大,代表專指程度愈 高。若問題中有一個以上的主題,則將指數平均,便是該檢索問題之專指性。 表6顯示在58個檢索問題中,主題專指度為2的檢索次數最多,有24次(41.4%),專指度 為3者次之,有17次(29.3%),再次之是專指度為4者,有7次(12.1%),專指度為1的 檢索有4次(6.9%),專指度2.5有3次(5.2%),專指度1.6、3.4和3.5各有1次檢索(各佔 1.7%)。經由綜合分析,各檢索問題專指性的平均值為2.53,標準差為0.81,由此可知本 研究中實驗對象之檢索問題的專指性並不高。為便於統計分析,將專指性加以歸類,將專 指度1、1.6和2以專指性低(29次,50%)表示,將專指度2.5和3以專指性中度(20次, 34.5%)表示,而專指度3.4、3.5和4則以專指性高(9次,15.5%)表示。經由歸納後發現, 各次檢索問題之專指程度以低度最多,專指性中度次之,專指性高度者最少。 表6 檢索問題專指性分析表 專指性 次數 百分比 累計百分比 專指性低 29 50.0   1.0 4 6.9 6.9 1.6 1 1.7 8.6 2.0 24 41.4 50.0 專指性中 20 34.5   2.5 3 5.2 55.2 3.0 17 29.3 84.5 專指性高 9 15.5   3.4 1 1.7 86.2 3.5 1 1.7 87.9 4.0 7 12.1 100.0 總計 58 100.0   (四)檢索問題之前提假定個數與性質分析 本研究定義之前提假定為檢索者用「X和Y之關係」、「時間」、「X對Y之影響」、「X 是否存在」、「X在Y上之應用」、「X目前研究進行的程度」、「X的定義」、「X與Y之 差別」和「X在Y上扮演的角色」來表達其檢索問題,上述陳述方式在目前的資訊系統中, 是不能直接用來檢索的。根據錄音所得終端使用者口頭陳述之資訊需求,進行前提假定個 數與性質分析。在前提假定的個數方面,由表7得知,在58次檢索的問題陳述中,有26次 檢索(44.8%)含有前提假定,其中含一個前提假定之檢索有22次(37.9%),含兩個前 提假定之檢索有4次(6.9 %),其它32次檢索(55.2%)之檢索問題中並不包含前提假

(10)

定。而在包含前提假定的26次檢索(44.8%)中,平均每次問題中包含1.15個前提假定, 標準差為0.37。同時在總共30個前提假定中,只有其中的5個(16.7%)有關時間的前提假 定可以利用系統限制的功能進行檢索,分別為陳述想檢索的是「近期期刊上相關研究例 子」(編號9)、「1980年代以後發展情況」(編號34)、「最近十年的研究情形」(編 號52)、「較新的資料」(編號55)和「近期的文獻」(編號58),可利用限制年代的方 式進行檢索,其它的前提假定皆無法直接檢索。 表7 檢索問題中前提假定個數次數分析表 前提假定個數 次數 百分比 累計百分比 0個 32 55.2 55.2 1個 22 37.9 93.1 2個 4 6.9 100.0 總計 58 100.0   在含有前提假定的26次檢索中,共有30個前提假定,詳細分析此30個前提假定的性質,由 表8可知,有關「X和Y之關係」的前提假定最多,共有8個(26.7%),例如檢索編號2之 檢索者的問題陳述為:「情緒與人際互動、人際知覺的關係」;次多的是有關「時間」的 前提假定,共有5個(16.7%),例如檢索編號52之檢索者的問題陳述為:「我想查最近十 年心理劇的研究情形大概是哪些方向」;再次多的是提到想檢索「X對Y之影響」,共有4 個(13.3%),例如26號檢索者的陳述是:「我想查社會心理學方面,主要想瞭解社會對 個人心理的影響」。至於「X是否存在」、「X在Y上之應用」與「X目前研究進行之程 度」方面的前提假定各有3個(各佔10%),例如編號21之檢索者想檢索的是:「發展心 理學中,是否有學者以混沌理論解釋發展階段的改變」、編號27之檢索者想查的是:「女 性主義在團體中的應用」、編號50的檢索者之檢索問題為「工作記憶目前研究的情況與創 造力目前在心理學的研究情況」。而問題陳述中有關「X的定義」的前提假定有2個 (6.7%),例如「想查壓力方面資料,有關壓力的定義及其動力歷程」(編號25)。至於 有關「X和Y之差別」和「X在Y上扮演之角色」的前提假定各有1個,各佔3.3%,例如 「我想找關於團體治療裡面,成長團體跟self-help group的差別」(編號34)、「杏仁核 中麩胺酸、NMDA、多巴胺在藥物自我注射中所扮演的角色」(編號22)。 表8 檢索問題中前提假定性質分析表 前提假定性質 個數 百分比 累計百分比 X和Y之關係 8 26.7 26.7 時間 5 16.7 43.4 X對Y之影響 4 13.3 56.7 X是否存在 3 10.0 66.7

(11)

X在Y上之應用 3 10.0 76.7 X目前研究進行之程度 3 10.0 86.7 X的定義 2 6.7 93.4 X和Y之差別 1 3.3 96.7 X在Y上扮演之角色 1 3.3 100.0 總計 30 100.0   進行檢索者之該次問題的檢索經驗對主題熟悉程度之影響分析,首先根據「檢索問題背景 問卷」分析檢索者對於該次檢索問題的熟悉程度,表9顯示有3次檢索之檢索者(5.2%)表 示對該次檢索問題非常不熟悉,有12次檢索之檢索者(20.7%)表示對該次檢索問題不熟 悉,有22次檢索之檢索者(37.9%)表示對於該次檢索問題的熟悉程度是普通,有21次檢 索之檢索者 (36.2%) 表示熟悉該檢索問題,沒有檢索者表示非常熟悉該次檢索問題。若以1 至5分別代表非常不熟悉、不熟悉、普通、熟悉與非常熟悉5種熟悉程度,可得到實驗對象 對於該次問題熟悉程度的平均值為3.05,標準差為0.89。由此可知,本研究實驗對象對於 該次問題之熟悉程度並不高。 表9 檢索問題熟悉程度之次數分析表 熟悉程度 次數 百分比 累計百分比 1. 非常不熟悉 3 5.2 5.2 2. 不熟悉 12 20.7 25.9 3. 普通 22 37.9 63.8 4. 熟悉 21 36.2 100.0 總計 58 100.0   另外,分析檢索者對該次問題之檢索經驗,有24次檢索之檢索者(41.4%)在該次檢索之 前,曾使用PsycLIT光碟資料庫檢索此問題,有34次檢索之檢索者(58.6%)之前未曾用 PsycLIT檢索該問題。(見表10)再深入分析以PsycLIT檢索該次問題的經驗對於主題熟 悉程度之影響,表11為使用PsycLIT檢索該問題的經驗影響主題熟悉程度之t檢定表,由表 中的平均值來看,曾用PsycLIT檢索該次檢索問題,對於檢索主題的熟悉程度平均為3.42 (標準差為0.88),高於未曾利用PsycLIT檢索該次問題(平均值為2.79,標準差為0.81) 之檢索者,此差異已達到統計上0.01之極顯著水準。換言之,曾利用PsycLIT檢索過該次 問題者,對於主題較為熟悉。由此可知,檢索者在檢索的過程中,可經由與系統的互動及 檢索到的文獻,釐清模糊的概念,再次檢索時可對主題有更明確的掌握,也就是檢索者可 經由檢索過程和所得到的檢索結果,提升對主題的掌控程度。 表10 使用PsycLIT檢索該問題之經驗分析表

(12)

檢索經驗 次數 百分比 累計百分比 是 24 41.4 41.4 否 34 58.6 100.0 總計 58 100.0   表11使用PsycLIT檢索該問題的經驗影響主題熟悉程度之 t檢定表 檢索主題熟悉程度 平均值 標準差 t值 p值 檢索經驗         是 3.42 0.88 2.784 0.007** 否 2.79 0.81     註:**表示達到統計上0.01之極顯著水準 綜合歸納本研究中各檢索問題的性質,在範疇方面,研究對象的檢索問題以社會與人格心 理學(佔36.2%)和臨床心理學相關主題(34.6%)較多,其次是實驗與認知心理學領域 (17.2%),工商心理學方面較少,僅有12%。在問題的複雜性方面,以複雜性中度者 (含三至四個概念)最多,佔55.1%,其次是複雜性低(含一至二個概念)者,佔 31.1%,至於複雜性高(含五至六個概念)的檢索問題僅佔13.8%,複雜度的平均值為3.05 (標準差為1.21),表示研究對象之檢索問題的複雜性不高。就問題的專指程度而言,平 均專指度為2.53,標準差是0.81,代表檢索問題的專指性並不高。再從檢索問題的前提假 定個數和性質來看,58次檢索中有32次檢索的問題中沒有任何前提假定,而有26次檢索的 問題中含前提假定,其中共包括30個前提假定,以「X和Y之關係」(26.7%)、「時間」 (16.7%)與「X對Y之影響」(13.3%)的陳述方式表達檢索問題者較多。而各前提假定 中,除了和「時間」(5個,佔16.7%)有關的陳述方式可用系統限制的功能進行檢索外, 其它陳述方式在目前的資訊系統中,都不能直接用來檢索。

四、檢索問題對資訊尋求和資訊檢索之影響

本研究中所提的資訊尋求和資訊檢索,以使用者自行檢索之檢索結果描述之。首先分析各次檢索 之檢索結果,包括檢索行數、檢索筆數、相關筆數以及精確率,再分析不同範疇、複雜性、專指 性與是否包括前提假定的檢索問題對檢索結果之影響。 (一)、檢索結果分析 在檢索結果的分析方面,將針對檢索行數、檢索筆數、相關筆數以及檢索精確率進行探 討。在檢索行數方面,由表12可知,各次檢索之檢索行數平均為20.91行,標準差為 16.55。深入分析檢索者之檢索行數,最少的為5行,僅發生1次(1.7%),最多為105行, 同樣僅有1次(1.7%),差距高達100行,造成此差距的原因可能與檢索者之檢索動機及檢

(13)

索問題的性質有關,在之後分析檢索問題對檢索結果之影響時,將會深入的討論。就檢索 筆數而言,最少為2筆,最多為603筆,差距多達601筆,各次檢索之檢索筆數平均為87.98 筆,標準差為106.37,由此可知,研究對象檢索到的筆數差距極大,此現象可能和研究對 象的資訊需求與檢索技巧有很大的關聯,應該是終端使用者自行檢索之正常現象。在相關 筆數方面,平均各次檢索檢出28.1筆相關筆數,標準差為47,最少的一次僅檢出2筆相關資 料,最多的一次檢索則檢出297筆相關書目,其間的差距高達295筆之多,推斷造成此現象 的原因應與檢索情境有關。 表12 檢索行數、檢索筆數和相關筆數分析表 檢索結果 平均值 標準差 檢索行數 20.91 16.55 檢索筆數 87.98 106.37 相關筆數 28.10 47.00 在本研究中,由於無法得知資料庫中相關文獻的數目,所以分析檢索品質最直接的方式乃 由其精確率推知。一般而言,此58次檢索之精確率不高,平均值為0.4,標準差為0.25,其 中精確率最低為0.01,僅發生1次(1.7%),而完全精確率(100%)則有3次,佔整體之 5.2%。表13顯示,絕大多數(81.1%)檢索之精確率都低於0.6,其中精確率介於0.01至0.2 間的有13次檢索(22.5%),介於0.21至0.4間的有20次(34.5%),介於0.41至0.6間的檢 索則有14次(24.1%),精確率高於0.6的只有11次(18.9%)。由此可知,在本研究中, 終端使用者若欲進行高效益之檢索,尚須經過有系統之教育訓練。 表13 各次檢索之精確率分析表 精確率 次數 百分比 累計百分比 0.01-0.20 13 22.5 22.5 0.21-0.40 20 34.5 57.0 0.41-0.60 14 24.1 81.1 0.61-0.80 6 10.3 91.4 0.81-1.00 5 8.6 100.0 總計 58 100.0   (二)、檢索問題對檢索結果之影響分析 在檢索問題範疇和檢索結果之關係方面,表14顯示檢索問題範疇對檢索行數、檢索筆數、 相關筆數和檢索精確率並沒有顯著的影響。值得特別注意的是,由檢索精確率的平均值來 看,可發現檢索工商心理學領域的實驗對象之檢索精確率較高,經由交叉分析發現7次檢

(14)

索工商心理學領域之檢索者皆為研究生,其中5次的檢索目的是為完成博碩士論文,有2次 為自行研究,因此推斷由於研究生所受的專業訓練較多,且為完成博碩士論文,進行的是 專題的深入研究,對於主題掌控程度較佳,因此檢索精確率較高。 表14 檢索問題範疇與檢索結果之變異數分析表   平均值 標準差 F值 P值 變數一:檢索行數 實驗與認知心理學 27.80 28.22 1.857 0.148 社會與人格心理學 24.19 14.25     臨床心理學 14.95 8.45     工商心理學 18.29 16.11     變數二:檢索筆數 實驗與認知心理學 62.90 49.49 1.538 0.215 社會與人格心理學 122.62 145.98     臨床心理學 82.20 85.72     工商心理學 36.43 32.38     變數三:相關筆數 實驗與認知心理學 19.00 20.81 0.475 0.701 社會與人格心理學 37.19 62.93     臨床心理學 26.40 44.08     工商心理學 18.71 21.01     變數四:精確率 實驗與認知心理學 0.37 0.22 0.483 0.696 社會與人格心理學 0.40 0.28     臨床心理學 0.38 0.24     工商心理學 0.50 0.28     除了檢索問題的範疇外,表15為檢索問題複雜性和專指性與檢索結果之相關係數表,先就 問題複雜性與檢索結果之關係而言,發現檢索問題的複雜性與檢索行數間呈現正相關,且 已達到統計上之顯著水準,也就是實驗對象檢索的問題複雜性愈高,越需要從各個不同概 念進行檢索,因此檢索行數愈多。此外,研究結果顯示檢索筆數和相關筆數與檢索問題的 複雜性間呈現負相關,事實上,若能加強檢索者使用布林邏輯結合概念的能力、使用詞彙 表達概念的能力、使用檢索技巧改進檢索的能力,以及使用檢索指令的能力,相信能提高 在檢索複雜問題上之檢索效益。再由問題專指性與檢索結果之關係來看,可知檢索問題的

(15)

專指性和檢索行數間呈現負相關,也就是檢索問題愈專指,檢索行數愈少,此現象是十分 合理的。至於檢索問題的專指性和檢索筆數、相關筆數間則呈現正相關,亦是十分合理的 現象,也就是檢索問題愈專指,則檢索筆數和相關筆數則愈多。 表15 檢索問題複雜性和專指性與檢索結果之相關係數表 檢索結果 相關係數 檢索問題性質 檢索 行數 檢索 筆數 相關 筆數 精確率 複雜性 0.361** -0.039 -0.083 0.066 專指性 - 0.041 0.033 0.070 - 0.223 註:**表示達到統計上0.01之極顯著水準 若再深入探討檢索問題有無前提假定對檢索結果之影響,表16顯示問題中有無前提假定對 於檢索行數、檢索筆數、相關筆數及檢索精確率並沒有顯著的影響。但是由平均值來看, 問題中包含前提假定者,其平均檢索行數和筆數較少,而判斷出的相關文獻較多,此現象 是可以理解的,由於問題中無法用來檢索的陳述方式愈多,則檢索者在進行檢索時,遭遇 無法繼續往下檢索的情形愈多,因此檢索行數和筆數較少,而進行相關判斷時則傾向較鬆 散的判斷,以免遺漏相關資料,故判斷相關筆數較多。但是就檢索精確率而言,問題中不 包含前提假定時,檢索精確率較高。 表16 問題中有無前提假定對檢索結果之t檢定表 檢索行數 平均值 標準差 t值 p值 是否含有前提假定         是 18.54 10.39 -0.985 0.329 否 22.84 20.20     檢索筆數 平均值 標準差 t值 p值 是否含有前提假定         是 81.08 70.12 -0.443 0.660 否 93.59 129.48     相關筆數 平均值 標準差 t值 p值 是否含有前提假定         是 28.54 39.44 0.063 0.950

(16)

否 27.75 52.97     精確率 平均值 標準差 t值 p值 是否含有前提假定         是 0.39 0.24 -0.268 0.790 否 0.41 0.26

五、結語

歸納本研究結果,在光碟資料庫終端使用者之檢索問題性質方面,先就檢索問題範疇而言,以社 會與人格心理學方面最多(21次,36.2%),臨床心理學次之(20次,34.6%),再其次是有關 實驗與認知心理學方面(10次,17.2%),至於工商心理學範疇則有7次,佔12%。在問題的複雜 性方面,實驗對象自行分析和研究者分析的結果皆以包含三個概念最多,但就平均值來看,研究 者分析問題複雜性的平均值為3.05(標準差為1.21)高於終端使用者自行分析的結果(平均值為 2.79,標準差為0.81)。造成差距的原因主要有二個,一是部份實驗對象只分析出主題的概念, 但研究者分析的標準是將問題中代表主題和題目的概念皆視為個別的概念;另一個原因是終端使 用者將不同的概念歸為一個概念,因此研究者分析出的概念較多,複雜性較高。另就檢索問題的 專指性來看,58次檢索之檢索問題的專指性並不高,平均值為2.53,標準差是0.81。可發現本研 究中檢索者之檢索問題的複雜性和專指性皆不高。至於檢索問題中有32次(55.2%)檢索之問題 中不包含前提假定,另有將近一半的檢索包含前提假定(26次,44.8%),其中包含一個前提假 定的有22次,佔37.9%,包含二個前提假定的檢索則有4次(6.9%)。在含有前提假定的26次檢 索中,共有30個前提假定,當中只有5個有關時間的前提假定可以利用系統限制的功能進行檢 索,其他的前提假定在目前的資訊系統中,皆無法直接檢索。另就前提假定的性質而言,用想要 檢索「X和Y之關係」的方式陳述檢索問題的檢索者最多(8次,26.7%)。 在檢索問題對檢索結果之影響方面,本研究發現檢索問題的確對檢索結果造成影響,主要的影響 在於檢索問題的複雜性,檢索問題愈複雜,則檢索行數愈多。至於檢索問題的範疇、專指性與包 含之前提假定個數對於檢索結果並沒有影響,但是如果這些用來陳述檢索問題的方式,例如關 係、應用、差別、影響等出現在重要欄位時是可以檢索的,是否能提高檢索滿意度,則需要進一 步之研究。 一般而言,資訊需求外顯為檢索問題,雖說資訊需求不一定會轉化成檢索問題,但沒有資訊需 求,就不會產生檢索問題。在資訊尋求與資訊檢索的文章中常將問題及人視為影響資訊尋求和資 訊檢索的最大因素。許多實證研究紛紛進行,雖然無法得到一致的結果,除證明人類行為的複雜 性外,更顯示我們需要更多的研究,才能瞭解人類的思考和行為。為設計出適合國人使用的資訊 系統,我們期待更多本土研究,包含國人檢索西文資料庫,更包括國人在中文資料庫上的資訊尋 求和資訊檢索。 誌謝:感謝國科會贊助本研究計畫「檢索問題、檢索詞彙及心智模型對資訊尋求和資訊檢索之影 響研究」(計畫編號NSC87-2415-H002-047)。

(17)

 

註釋

1. Tefko Saracevic and Matthew A. Baxter, “On a Method for Studying the Structure and Nature of Requests in Information Retrieval, “Proceedings of the 46th Annual Meeting of the American Society for Information Science 20(1983): 22-25.

2. John G. Keyes, “Using Conceptual Categories of Questions to Measure Differences in Retrieval Performance,” Proceeding of the 59th Annual Meeting of the American Society for Information Science 33(1986): 238.

3. Robert S. Taylor, “Question Negotiation and Information Seeking in Libraries,” College & Research Libraries 29:3(May 1968): 178-194.

4. 同註1。

5. Richard L. Derr, “A Classification of Questions in Information retrieval by Conceptual Presupposition,” Proceedings of the 45th Annual Meeting of the American Society for Information Science 19(1982): 69-71.

6. A. C. Graesser and T. Murachver, “Symbolic Procedures of Question Answering,” in The Psychology of Questions, eds A. C. Graesser, J. B. Black, and Lawrence Hillsdale (NJ: Lawrence Erlbaum Associates, 1985):15-18.

7. 同註2。

8. Tefko Saracevic, P. Kantor, A. Y. Chamis, and D. Trivison, “ A Study of Information Seeking and Retrieving. I. Background and Methodology,” Journal of the American Society for Information Science 39:3(May 1988): 161-176.

9. Mirja Iivonen, “Consistency in the Selection of Search Concepts and Search Terms,” Information Processing and Management 31:2(1995):173-190.

10. 同註2。

11. American Psychological Association, Thesaurus of Psychological Index Terms (Washington, D.C. : American Psychological Association, 1997).

參考文獻

相關文件

You are given the wavelength and total energy of a light pulse and asked to find the number of photons it

Reading Task 6: Genre Structure and Language Features. • Now let’s look at how language features (e.g. sentence patterns) are connected to the structure

In order to facilitate the schools using integrated or mixed mode of curriculum organization to adopt the modules of Life and Society (S1-3) for improving their

volume suppressed mass: (TeV) 2 /M P ∼ 10 −4 eV → mm range can be experimentally tested for any number of extra dimensions - Light U(1) gauge bosons: no derivative couplings. =>

incapable to extract any quantities from QCD, nor to tackle the most interesting physics, namely, the spontaneously chiral symmetry breaking and the color confinement.. 

• Formation of massive primordial stars as origin of objects in the early universe. • Supernova explosions might be visible to the most

隨著科技的進步,展覽場的導覽系統已從過去導遊、磁帶機或 CD 播放 器講解的時代轉換成行動導覽的時代。目前行動導覽方式大都以 RFID 或 QR

(Another example of close harmony is the four-bar unaccompanied vocal introduction to “Paperback Writer”, a somewhat later Beatles song.) Overall, Lennon’s and McCartney’s