• 沒有找到結果。

檢索問題、檢索詞彙、及心智模型對資訊尋求和資訊檢索之影響研究(2/2)

N/A
N/A
Protected

Academic year: 2021

Share "檢索問題、檢索詞彙、及心智模型對資訊尋求和資訊檢索之影響研究(2/2)"

Copied!
4
0
0

加載中.... (立即查看全文)

全文

(1)

1

行政院國家科學委員會專題研究計畫成果報告

檢索問題、檢索詞彙及心智模型對資訊尋求和資訊檢索

之影響研究 II

A Study of Infor mation Seeking and Retr ieving - fr om Questions,

Sear ch Ter ms, and Mental Models’ Per spectives II

計畫編號:NSC 88-2413-H-002-030

執行期限:87 年 8 月 1 日至 88 年 7 月 31 日

主持人:黃慕萱 國立台灣大學圖書館學系暨研究所

一、中文摘要 本研究探討光碟資料庫計畫檢索者之 檢索詞彙概念與檢索結果及心智模型對資 訊尋求和資訊檢索之影響。本計畫共有 31 位檢索者,對 10 個指定的檢索問題進行 59 次檢索,選用了 609 個檢索詞彙。本研究 將計算計畫檢索者選用詞彙的一致性與檢 索結果的重複性,歸納出其選用詞彙之決 策樹,並探討個人詞彙選用之心智模型對 資訊需求和資訊檢索之影響,以建立使用 者導向資訊尋求行為的本土實證研究資 料,期能將研究結果應用於資訊系統的設 計與訓練上。 關鍵詞:資訊尋求、資訊檢索、問題、使 用者、檢索詞彙、心智模型、一致性 Abstr act

This project analyzes the information seeking and information retrieval of college and graduate students in National Taiwan University when they are using PsycLIT database. After instructions, 53 subjects searched through the semester, doing 58 searches and generating 532 search terms. This study investigates information seeking and information retrieval from questions, search terms and mental models’ perspectives, it attempts to construct relationships for the above factors.

Keywor ds: Information Seeking,

Information need, information retrieval, questions, users, search terms, mental models 二、緣由與目的 檢索問題可反映出資訊需求者已發展 的有關其資訊需求的心智模型,資訊需求 者的認知型態影響到檢索問題的型態,同 時決定檢出書目是否符合其資訊需求[6, p.238]。檢索詞彙則是使用者與資訊系統溝 通的主要方式;亦可說是檢索者與系統互 動過程中的主要媒介。 在資訊系統中,詞彙可以指出文獻和檢 索問題中具有相同概念的事物,同時透過 詞彙本身的相關詞、狹義詞及廣義詞,說 明這些概念間關係的親疏遠近[5,p.22], 因此檢索詞彙更是表達檢索問題的重要工 具。但國內目前尚乏研究探討國人在檢索 過程中之詞彙選用決策樹,若能建立此決 策樹,不僅對資料庫的利用指導有所幫 助,同時對系統介面的設計也將大有幫 助。 心智模型則是「泛指使用者在與系統產 生互動或學習時所建立的認知機制,用以 呈現該系統的架構與內在關係,並協助使 用者瞭解系統、推論系統,並預測系統行 為。」[1,p.48]一般而言,有關「心智模 型」的研究顯示,檢索者會架構出自己對 系統的心智模型,個人的心智模型主導檢 索者的資訊尋求行為。雖說個人差異一直 在檢索中扮演著關鍵的角色,但個人差異 的範圍有多大,其所造成之影響又是如 何,則必須加以深入地研究。 本 計 畫 為 一 為 期 三 年 的 大 型 實 證 研 究,重點在研究檢索問題、檢索過程及檢 索結果,並經由資訊需求者與計畫檢索者 對同一問題進行多次檢索,比較其選用詞 彙概念的一致性及檢索結果的重複性,而

(2)

2 後分析檢索者(包含資訊需求者和計畫檢 索者)對問題的認知和分類,以及從檢索 過程中,檢索者與系統之間的各種互動回 饋現象,分析終端使用者選用檢索詞彙之 決策樹,據此尋找不同的心智模型,進而 探討心智模型對資訊尋求和資訊檢索的影 響。本計畫第一年度即以資訊需求者為研 究對象,從檢索者對問題認知的觀點研究 問題的特質,檢視不同特性的檢索問題對 於資訊檢索和資訊尋求之影響。 事實上,完全相同的檢索題目,由於檢 索者個人感情認知與智慧認知上的不同, 必存在相當的個別差異,不可能產生完全 相同的檢索策略和檢索結果。因此第二年 計畫以計畫檢索者為研究對象,計畫檢索 者將以和資訊需求相同學科背景之心理系 所學生為限,透過多人檢索同一問題,探 討計畫檢索者選用詞彙概念的一致性與檢 索結果的重複性,以及二者間的關係及與 其他檢索特性的關係;同時,試圖歸納出 計畫檢索者選用詞彙之決策樹,以對檢索 過程中的決策和互動有更深入的瞭解,並 據此歸納出計畫檢索者選用詞彙之心智模 型,進一步探討個人心智模型與選用詞彙 的一致性及各種檢索結果之關係。 三、結果與討論    茲將本計畫研究結果分以下六點加以 說明: (一) 計畫檢索者選用詞彙概念的一致性 計畫檢索者選用詞彙與概念的一致性 以檢索詞彙及概念各分二個層次比對之, 其中逐字比對的「詞彙第一層次」一致性 平均值與標準差為 22.14%與 15.49%﹔不 計語尾變化的「詞彙第二層次」一致性平 均值與標準差為 35.00%與 18.02%﹔不計 廣狹義關係的「概念第一層次」一致性平 均值與標準差為 39.00%與 16.43%﹔不計 相關關係的「概念第二層次」一致性平均 值與標準差為 46.50%與 17.55%﹔研究結 果 顯 示 四 個 層 次 均 無任 一 數 據 達 100% 者﹔在分組次數分配方面,一致性最低的 組別所占百分比從「詞彙第一層次」到「概 念第二層次」依次大幅遞減﹔一致性在 60 %以上者所占百分比則依次遞增﹔所占百 分比居首者,亦隨著詞彙到概念層次,由 低度一致性組(0-19.99%)轉移到中度一 致性(40-59.99%)。與 Fidel[2][3]、Saracevic 與 Kantor 等[7]及 Iivonen[8]等研究結果相 較,本研究所得之檢索詞彙概念一致性偏 低,且越到較後的層次差距越大。本研究 另計算出二人以上共同詞彙數的遞減情 形,結果顯示從 4 人開始,共同檢索詞彙 數才開始出現平均數為零的情形,到 6 人 時,共同檢索詞彙數平均數為零的百分比 已高達 77.8%。綜而言之,本研究由詞彙 到概念的一致性增長趨勢同其他研究,但 各層次的數據普遍低於其他類似研究。 (二) 計畫檢索者檢索結果分析 本研究各檢索結果的精確率平均值為 34.36%,標準差為 19.80%。其中 90%的精 確率都在 60%以下,故大部分的精確率都 集中在較低的部分﹔檢索結果的重覆性包 括檢出書目與判斷相關書目各自的重覆 性,前者平均重覆百分比為 10.48%,標準 差 為 15.79% ; 後 者 平 均 重 覆 百 分 比 為 5.72%,標準差為 10.45%,其中亦無任一 數據達 100%者。無論是檢出書目或判斷相 關書目,其重複性均以 0-4.99%者最多,比 例均超過半數,絕大部分的檢索結果重複 性均集中在 30%以下。判斷相關書目方面 的平均重覆性更低於檢出書目的數據,顯 示計畫檢索者從檢出書目到瀏覽後判斷相 關的書目,其決策結果的一致程度趨於降 低。與 Saracevic & Kantor 等人的研究結果 相較,在重覆性的部分,本研究無論就檢 出書目或判斷相關書目而言均較低;分組 次數分配方面,檢出書目與判斷相關書目 重覆性 0-5%的部份與 Saracevic & Kantor 等的研究結果相近[7,p.199],可見較大的 差異是出現於 5%以上的部分。本研究另計 出二人以上共同檢索結果的遞減情形,結 果顯示從 3 人開始,共同檢索詞彙數才開 始出現平均數為零的情形,重覆檢索結果 平均數為零的情形到了 5 人時,更高達 100%﹔綜而言之,本研究由檢出書目與判 斷相關書目,重複性減少,不同於 Saracevic

(3)

3 & Kantor 等人重複性提高的研究結果。[7, p.199] (三) 計畫檢索者選用詞彙一致性與檢索結 果之關係分析 本研究的結果顯示,在檢出書目方面, 選用詞彙一致性的高低確實可影響檢出書 目的重複性,檢出書目的重複性會隨選用 詞彙一致性的提高而增加;無論是檢出書 目重覆性複性或判斷相關書目重複性,均 和選用詞彙的一致性呈現正相關,且已達 到統計上之顯著水準,而選用相同的詞彙 亦檢出相同書目的可能性,高於選用相同 的詞彙亦選出相同書目的可能性。 就各檢索問題整體來看,詞彙一致性與 使用檢索詞彙個數二者的關係並未達到統 計上之顯著水準;各檢索問題整體的檢索 效益與判斷相關書目重複性之間呈現顯著 的正相關;各檢索問題整體的檢索效益各 與選用詞彙一致性及檢出書目的相關性則 不顯著。 (四) 計畫檢索者詞彙選用之決策樹 本研究根據檢索過程歸得之詞彙選用 決策樹可分為五個層次:1.詞彙的性質--選 擇的是一般的詞彙或是單一意義的詞彙﹔ 2.採用的檢索模式--主題詞模式或關鍵語 模式﹔3.關鍵語模式逕行檢索、主題詞模式 比對完全吻合、部分吻合、相關或無法對 應至敘述語﹔4.主題詞模式以所選敘述語 逕行檢索、同時採敘述語與文內字檢索、 捨棄所選敘述語只採文內字檢索、以及進 一步檢視該敘述語的索引典詞彙。5.檢視索 引典詞彙後選用該敘述語、相關詞或狹義 詞。 本計畫 31 位檢索者的 59 次檢索一共選 用了 609 個檢索詞彙。各詞彙選用決策其 中以一般詞彙採關鍵字模式以文內字檢索 最高,占所有檢索的 20.4%;其次為一般 詞彙採主題詞模式比對部分吻合的敘述 語,以及單一意義詞彙採主題詞模式比對 相關的敘述語,各占 11.3%與 11.0%。本研 究的檢索詞彙決策種類與 Fidel 的研究相 同者有 6 種[4]﹔與第一年度計畫的詞彙決 策相同者只有 5 種[9],三個研究中均有出 現的決策為有 4 種,包括單一意義的詞彙, 在主題詞模式之下直接採用比對完全吻合 的敘述語及比對部份吻合的敘述語﹔比對 相關的敘述語後改採文內字,以及採關鍵 語模式直接以文內字檢索。 (五) 計畫檢索者選用詞彙之心智模型 第一年度歸納出的四種心智模型--敘 述語型、文內字型、敘述語傾向型與混合 型,仍可適用於本研究,惟範圍略有出入, 其中「敘述語型」包含兩類:1.在詞彙選用 的第二層次只選擇主題詞模式,且無論比 對結果如何,受試者皆選擇敘述語進行檢 索;2.除於第二層次選擇關鍵語模式逕以文 內字檢索,以及選擇主題詞模式的比對結 果是無法對應而採用文內字之外,無論比 對結果如何,受試者皆選擇敘述語進行檢 索;「文內字型」亦包含兩類:1.在詞彙選 用的第二層次只選擇關鍵語模式,逕以文 內字進行檢索;2.雖第二層次兼用關鍵語模 式與主題詞模式,但到最後均只選擇文內 字進行檢索,並未同時選用任何敘述語; 「敘述語傾向型」包含兩類:1.在詞彙選用 的第二層次只選擇主題詞模式,到第三層 次的選擇時才有選用文內字的情形,但仍 以選用敘述語為主;2.除於第二層次選擇關 鍵語模式逕以文內字檢索,以及選擇主題 詞模式的比對結果是無法對應而採用文內 字之外,雖有同時選用文內字的情形,一 定伴隨著選用敘述語;「混合型」指受試 者在詞彙選用決策過程中,視需要選用敘 述語或文內字,並無明顯傾向於使用哪一 種。 與第一年度的研究結果相較,本研究中 各心智類型所占檢索次數比例大相逕庭, 第一年度居首的「文內字型」心智模型在 本 研 究 中 卻 成 了 四 種 中 最 罕 見 的 一 種 (8.5%)﹔本研究居首二位的「敘述語型」 及「敘述語傾向型」合計超過七成(70.1%), 而第一年度則僅有 45.3%,此現象反映計 畫檢索者與資訊需求者在檢索詞彙的選用 上確有相當的差異。 (六) 計畫檢索者個人心智模型與選用詞彙 一致性及檢索結果之關係 分析結果發現計畫檢索者不同的心智 模型在檢索結果精確率、檢出書目重複率

(4)

4 與判斷相關書目重複率等方面均無顯著差 異,僅在檢索詞彙選用的一致性上有顯著 差異。但一致性的平均值居首者為「文內 字型」,原因可能在於少數特殊樣本導致 結果偏差﹔其次由於此處一致性的標準係 採用詞彙一致性的第二層標準,因此使用 文內字時常有的字尾變化或拼字等不一致 現象在此標準下均被視為一致,故提高其 一致性的百分比﹔再者可能由於個人差異 性對詞彙選用的影響大於檢索問題,因此 即使面對同一檢索問題,同一套控制語言 的主題詞系統,檢索者仍作出一致性較低 的敘述語選擇。 四、計畫成果自評 本 計 畫 大 致 均 能 達 成 原 計 畫 預 期 目 標,並與前一年度計畫的結果加以比較, 是國內少有的以國人為研究對象,並從使 用者的角度研究國人的資訊檢索過程及資 訊尋求行為的大型實證研究。 本計畫並對於檢索概念與詞彙的一致 性建立了計算單位與判斷基準,並加以具 體說明,俾便後續有關的檢索行為一致性 研究比對基準建立與結果比較。 本計畫中終端使用者詞彙選擇決策樹 的建立不僅有助於系統介面的設計,同時 對於資料庫利用指導服務的設計亦有所啟 示。此外,從本研究對完整詞彙選擇過程 的分析中發現,由於資訊系統的檢索功能 及互動性越來越強,可以從詞彙選擇過程 中發現有許多值得納為詞彙選用心智模型 的判斷分析要素,例如輸入對應主題詞或 瀏覽索引典而未用以檢索的詞彙;使用同 一詞彙第二次以上的行為;一次選取一個 或多個敘述語或同時檢索敘述語及文內字 的行為;對延展敘述語或主要敘述語的設 定等。有賴日後更大規模的研究來進行更 精密的分析,當能發現更多樣的檢索行為 心智模型。 此外,在可預見的將來,中文資料庫檢 索會隨內容的愈加豐富及檢索功能將愈加 強大而益加普及,其影響力不容忽視,屆 時既有移植於西文的檢索行為研究設計對 中文資訊檢索的適用性都將受到嚴苛的考 驗,在本研究中對檢索詞彙選用過程的分 析方式、一致性的計算單位與判斷基準 等,未必便能反映中文的文字特性。故應 及早從語言學的角度針對中文的特性,建 立適用於中文詞彙的研究方法。 五、參考文獻

[1] Borgman, Christine L., “The User’s Mental Model of an Information Retrieval System: An Experiment in a Prototype Online Catalog,” International Journal of Man-Machine Studies 24(1986): 48. as cited in James M. Turner and Francois Papik Belanger, “Escaping from Babel: Improving the Terminology of Mental Models in the Literature of Human-Computer Interaction,” Canadian Journal of Information and Library Science 21: 3/4(1996): 38.

[2] Fidel, Raya. “Individual Variability in Online Search Behavior.” In C.A. Parkhurst ed, Proceedings of the 48th Annual Meeting of the American Society for Information Science. 69-72. White Plains, NY: Knowledge Industry Publications, 1985.

[3] Fidel, Raya. “What is Missing in Research about Online Searching Behavior.” Canadian Journal of Information Science 12:3/4(1987): 54-61.

[4] Fidel, Raya. “Searchers’ Selection of Search Keys: I. The Selection Routine.” Journal of the American Society for Information Science 42:7(1991): 490-500.

[5] Harter, Stephen P. Online Information Retrieval:Concepts, Principles, and Techniques. New York :Academic Press, 1986.

[6] Keyes, John G.. “Using Conceptual Categories of Questions to Measure Differences in Retrieval Performance.” In Proceedings of the 59th Annual Meeting of the American Society for Information Science. C.A. Parkhurst ed, 238-242, 1996.

[7] Saracevic, T. and P. Kantor. “A Study of Information Seeking and Retrieving. III. Searchers, Searches, and Overlap.” Journal of the American Society for Information Science 39:3(May 1988): 197-216.

[8] Iivonen, Mirja. “Consistency in the Selection of Search Concepts and Search Terms.” Information Processing and Management 31:2(1995): 173-190.

[9] 黃慕萱。「檢索問題、檢索詞彙及心智模型對 資訊尋求和資訊檢索之影響研究 I」。行政院 國家科學委員會專題研究計畫成果報告(民 87 年 7 月)。

參考文獻

相關文件

Web of Science Core Collection(簡稱 WOS)為引用文獻索引資料庫,可同時檢索 Science Citation Index Expanded(簡稱 SCIE,即通稱的 SCI)、 Social Sciences Citation

心心心心 收收收收 靜靜靜靜 裏裏裏裏 尋尋尋尋 真真真真 樂樂樂樂. 離離離離 群群群群 索索索索 居居居居 樂樂樂樂

6 《中論·觀因緣品》,《佛藏要籍選刊》第 9 冊,上海古籍出版社 1994 年版,第 1

The first row shows the eyespot with white inner ring, black middle ring, and yellow outer ring in Bicyclus anynana.. The second row provides the eyespot with black inner ring

In order to facilitate the schools using integrated or mixed mode of curriculum organization to adopt the modules of Life and Society (S1-3) for improving their

近年,各地政府都不斷提出相同問題:究竟資訊科技教育的投資能否真正 改善學生的學習成果?這個問題引發很多研究,嘗試評估資訊科技對學習成果 的影響,歐盟執行委員會聘請顧問撰寫的

回應電子平台問題 自主探索 考察點額外講解 支援學生.

H., Liu, S.J., and Chang, P.L., “Knowledge Value Adding Model for Quantitative Performance Evaluation of the Community of Practice in a Consulting Firm,” Proceedings of