第五章 結論與建議
第二節 建議
本研究採用驗證之方式,比較會議文獻與期刊文獻的主題 分佈與相對性預測 效果,然而因受研究範圍與時間之限制,僅以 SIGIR 會議文獻與 Web of Science 此跨領域資料庫蒐集 1990 年至 2007 年資訊檢索領域的核心期刊文獻 進行分 析,並以人工彙整主題詞彙作為研究樣本,藉以探討資訊檢索領域之主題分佈與 趨勢預測之相對性效果。根據本研究於彙整主題詞彙時所發現的 問題,做出以下 幾點建議:
一、 主題趨勢相關之建議
(一) 主題詞彙的建議
本研究採用期刊主題詞進行文獻歸類分析時發現,其控制詞彙的部份尚未完 善,許多單複數詞彙和縮寫詞彙皆尚需統整,以提供未來進行趨勢分析的研究者 更精確的主題詞彙。
在本研究所採用的會議文獻主題上,因各年度的會議都由不同的主辦單位負 責,因此其主題詞的變化性也就更多,此外,各年度的會議文獻也受限於每段議 程的發表數量,所以會出現會議文獻的主題涵蓋兩種主題,若可於會議主題上給 予控制詞彙,會更易於會議文獻的收錄與後續相關研究的進行 。
(二) 主題預測之建議
由本研究所進行的實驗與研究假設檢定可知,未來若要瞭解大領域的趨勢以 期刊文獻預測期刊主題的效果較佳,而要了解各自領域的趨勢則是以相同的文獻 類型進行預測較佳,亦即欲知道會議文獻的未來趨勢,要以會議文獻做為預測基 礎,而欲暸解期刊文獻的未來趨勢 ,則是要以期刊文獻做為預測基礎 。
此外,在自動化歸類的結果可看出,會議文獻與期刊文獻在主題分佈的數量 較為一致,表示自動化歸類後所取得之結果比主題整併之結果較適合進行後續的 實驗研究,而且自動化歸類的結果也可以排除人為因素的干擾 。
二、 對未來後續研究之建議
由於本研究之研究範圍、時間之限制,因此僅能於有限的時間內採集研究樣 本,故研究仍有不足之處,玆列出下列幾點建議以供進一步之相關研究作為參考。
(一) 研究樣本方面
本研究在研究樣本的選取上,受限於 SIGIR 會議文獻以及資訊檢索領域的核 心期刊文獻,而實際上關於資訊檢索議題尚有其他的會議文獻可供研究 ,因此後 續可針對資訊檢索領域的其他會議文獻進行探討,或是利用其他灰色文獻進行研 究,像是專利文獻或部落格的文章等 。
另外,在資訊檢索領域的期刊文獻樣本的選取上,本研究是透過資料庫限定 主題為「資訊檢索」領域的核心期刊文獻進行探討,因資訊檢索領域的期刊文獻 過多,故本研究僅限定於核心期刊為範圍,而後續研究也可針對資訊檢索領域的 非核心期刊文獻進行全面性的探討。而會議文獻與期刊文獻的作者群亦有差異存 在,本研究尚未針對作者群進行分析與探討,因此無法得知是否為作者群之差異
(二) 研究方法方面
本研究為實驗之量化研究,並未考量其他外在因素,如各年代的社會環境與 背景狀況等,因此後續研究可針對相關背景進行探討 。
在主題趨勢預測前的文獻分類,因受限於資料庫的主題詞以及會議文獻的會 議主題,僅能針對字面上或會議主題上可判斷之分類方式進行主題分類 ,後續研 究可採用專家多人比對等方式以達到更加嚴謹的主題分類 。
而本研究所進行預測時所採用的驗證集是以預測集之後兩年,此為較簡便之 方法,後續研究也可採用其他的更為嚴謹之方法所找出的熱門主題作為驗證對 象,可以更加強在預測效果上的正確性 。
本研究的主題趨勢預測方面 ,僅針對可對應的主題進行預測相對性效果探 討,而無法相對應之主題並未再針對其趨勢預測效果進行更深入的研究,後續研 究亦可從此方面再加強,以補足無法對應的主題之間預測效果之探討 。
(三) 後續的實驗研究
由於本研究是採用預測集為 10 年、驗證集為 2 年的情況下進行實驗,但經 過預測集與驗證集年代的改變所得之預測結果可知,尚有其他預測集與驗證集年 代區間可得到預測之最佳 結果(如表 4-95、表 4-96),故後續實驗亦可以其他的年 代範圍進行主題趨勢預測 。
參考文獻
英文部分:
Allen, R. S. (1995). The magnitude of conference proceedings published in physics journals. Special Libraries 86(2), 136-144.
Åström, F. (2007). Changes in the LIS research front: Time -sliced cocitation analyses of LIS journal articles, 1990 -2004. Journal of the American Society for Information Science and Technology, 58 (7), 947-957.
Baker, D. R. (1990). Citat ion Analysis: A methodological review. Social Work Research & Abstracts, 26, 3-10.
Borgman, C. L., & Furner, J. (1990). Scholarly communication and bibliometrics.
Annual Review of Information Science and Technology, 36 , 1-45.
Cai, K.-Y., & Card, D. (2007). An analysis of research topics in software engineering – 2006 Journal of Systems and Software, 81 (6), 1051-1058.
Callon, M., Courtial, J. P., & Laville, F. (1991). Co-word analysis as a tool for describing the network of interactions between basic and technological research: The case of polymer chemistry. Scientometrics, 22(1), 155-205.
Chen, C. (2005). CiteSpace II: Detecting and visualizing emerging trends and transient patterns in scientific literature. Journal of the American Society for Information Science and Technology, 57 (3), 359-377.
Courtial, J. P. (1994). A cowaord analysis of scientometrics. SCIENTOMETRICS, 31(3), 251-260
C.W.Hanson, & Janes, M. (1960). Lack of index in reports of conference. Journal of the Document, 16(2), 65-70.
C.W.Hanson, J., M. (1961). Coverage by abstract journals of conference papers.
Journal of the Document, 17 (3), 143-149.
Ding, Y., Chowdhury, G., & Foo, S. (1999a). Mapping intellectual struture of information retrieval: An author cocitation analysis, 1987 -1997. Paper presented at the 7th International Conference of the International Society for Scientometric and Informetrics, Colima, Mexico.
Ding, Y., Chowdhury, G., & Foo, S. (1999b). Mapping the development in information retrieval speciality: A bibliometric analysis via journals. Paper presented at the 7th International Conference of the International Society for Scientometric and Informetrics, Colima, Mexico.
Ding, Y., Chowdhury, G. G., & Foo, S. (2001). Bibliometric cartography of information retrieval research by using co -word analysis. Information Processing & Management, 37 (6), 817-842
Drott, M. C. (1995). Reexamining the role of conference papers in scholarly
communication. Journal of the American Society for Information Science, 6 (4), 301.
Funk, M. E. (1988). The usefulness of monographic proceedings. Buletin of Medical Library Association, 6(1), 14-21.
Gardner, J. (1980). The conference as an integral component in the science and technology information dissemination network- with some thought on the role of librarianship as a facilitator between the scientist / Engineer and the Printed Work. Paper presented at the Conference Literature in Science and Technology: Its Role in the Distribution in Information.
Garvey, W. D., Lin, N., Nelson, C. E., & Tomita, K. (1972). Research studies in patterns of scientific communicationⅡ: The role of nationa meeting in scientific and technical communication. Information Storage and Retrieval, 8(4), 164.
Garvey, W. D., Lin, N., Nelson, C. E., & Tomita, K. (1972). Research studies in patterns of scientific communication Ⅲ: Information – exchange processes associated with the production of journal articles. Information Storage and Retrieval, 8(5), 207-221.
Garvey, W. D., Lin, N., Nelson, C. E., & Tomita, K. (1972). Research studies in patterns of scientific communication Ⅱ: The role of national meeting in scientific and technical communication. Information Storage and Retrieval, 8(4), 159-169.
HE, Q. (1999). Knowledge discovery through co -word analysis LIBRARY TRENDS, 48(1), 133-159.
Hjerland, B. (2003). Fundamentals of knowledge organization. Knowledge organization, 30(2), 87-111.
Kean, P., & Ronayne, J. (1972). Preliminary communications in chemistry. Journal of Chemical Documentation, 12 (4), 218-220.
Montesi, M., & Owen, J. M. (2008). From conference to journal publication:How conference papers in software engineering are extended for publication in journals. Journal of the American Society for Information Science and Technology, 59(5), 816-829.
Mooers, C. N. (1951). Zatocoding applied to mechanical organization of knowledge.
American Documentation , 2(1), 20-32.
Pelzer, N. L., & Wiese, W. H. (2003). Bibliometric study of grey literature in core veterinary medical journals. Journal of the Medical Library Association 91(4), 434-441.
Perry, B. (1995). Grey literature in the internatonal monetary fund. Paper presented at the Second International Conference on Grey Literature.
Persson, O. (1994). The intellectual base and research fronts of JASIS 1968 -1990.
Journal of American Society for Information Science, 45 (1), 31-38.
Rokaya, M., Atlam, E., Fuketa , M., Dorji, T. C., & Aoe, J. -i. (2008). Ranking of field association terms using Co -word analysis INFORMATION PROCESSING &
MANAGEMENT 44(2), 738-755
Smeaton, A. F., Keogh, G., Gurrin, C., McDonald, K., & Sødring, T. ( 2002). Analysis of papers from twenty-five years of SIGIR conferences: What Have We Been Doing for the Last Quarter of a Century ? ACM SIGIR Forum 36(2), 39 - 43 Subramanyam, K. (1981). Scientific and technical information resources. New York:
Marcel Dekker.
Tseng, Y.-H., Lin, Y.-I., Kuo, C.-H., & Lee, Y.-Y. (2008). Which kinds of trend metrics are more effective for emerging trend detection? Paper presented at the
Proceedings of the International Symposium on Webometrics and Web Mining, 國立政治大學公企中心.
Tseng, Y.-H., Lin, C.-J., & Lin, Y.-I. (2007). Text mining techniques for patent analysis. Information Processing and Management, 43 (5), 1216-1247 Tsay, M.-Y., Jou, S.-J., & Ma, S.-S. (2000). A bibliometric study of semiconductor
Literature, 1978-1997. Scientometrics, 49(3), 491-509.
van Raan, A. F. J., & Tijssen, R. J. W. (1993). The neural net of neural network research. Scientometrics, 26(1), 169-192.
White, H. D., & Griffith, B. C. (1981). Author cocitation : A literature measure of intellectual structure. Journal of the American Societ y for Information Science,
32, 163-171.
White, H. D., & McCain, K. W. (1998). Visualizing a discipline: An author co -citation analysis of information science, 1972 -1995. Journal of the American Society for Information Science, 49 , 327-355.
Woibel. (1995). Metadatea the foundations of resources description. D-LIB Magazine.
Zhao, D., & Strotmann, A. (2007). Can citation analysis of web publications better detect research fronts? Journal of the American Society for Information Science and Technology, 58 (9), 1285 - 1302.
中文部份:
昌炎新(2006)。核心期刊的淵源以及功效分析。武漢科技大學學報,8(5),21-23。
周靜怡、孫坦、陳濤(2007)。共詞可視化:以人類基因組領域為例。情報學報,
26(4),532~537。
邱炯友(2006)。學術傳播與期刊出版。臺北市:遠流。
許雅婷(2006)。資訊檢索文獻老化現象之研究 -兼論同時法與歷時法之特質。台北 市:國立政治大學圖書資訊與檔案學研究所 。
郭華(2006)。論重要的科技信息資源-會議文獻。圖書館工作與研究(1),25-27。
張正宏(2008)。運用關鍵詞建構知識管理研究網絡 。台北市:國防管理學院資訊 管理學系。
曾 元 顯 (2007) 。 農 業 研 究 前 沿 探 勘 模 式 與 系 統 之 開 發 ( 研 究 計 畫 , STPI-C-960906 )。台北:財團法人國家實驗研究院科技政策研究與資訊中 心。
曾元顯、林堬一(2006)。文字探勘技術在教育評鑑研究發展趨勢分析之應用 。在 教育評鑑國際學術研討會 ,國立台灣師範大學。
黃淑娟、蔣嘉寧、黃擎天、宋雪芳(1998)。由文獻分析檢視會議文獻的傳播 。教 育資料科與圖書館學,35(4),340。原文引自 Felix Liebensy, “Lost
Information: Unpublished Conference Papers,”in International Conference on Scientific Information(Washington: National Academy of Science -National Research Council, 1959), pp.475-495.
蔡明月(1997)。學術傳播與書目計量學。教育資料與圖書館學,35(1),39。
蔡明月(2003)。資訊計量學與文獻特性。臺北市:編譯館。
蔡明月、劉瓊芳(2007)。1992-2005 資訊計量學研究及其發展演變 。圖書與資訊 學刊,61,42-56。
蔡明月、賴芊卉(2007)。資訊科學引用與被引用文獻分散現象與主題變化研究 : 1985-2005。圖書資訊學研究,1(2),1-31。
吳嘉雯(1998)。半導體文獻雙被引現象分析。台北縣:淡江大學教育資料科學學 系。
傅雅秀(1996)。從科學傳播的觀點探討中央研究院生命科學專家的資訊尋求行 為。圖書館學刊,11,133-163。
黃秀琴(1998)。會議文獻作者生產力與其延續出版品之研究 :以國防科技學術研討 會為例 。台北縣:淡江大學教育資料科學研究所碩士論文 。
黃淑娟、蔣嘉寧、黃擎天(1981)。會議文獻之探討。教育資料科學,18(4),88。
黃惠美(2007)。臺灣地區圖書資訊學文獻高生產作者的引用圖像 —以作者雙被引 分析為例。中華民國圖書館學會電子報 ,5。
楊世瑩(2005)。SPSS 統計分析實務。臺北市:旗標。
鄭琚媛(2004)。臺灣地區生命科學國際會議文獻生產力與延續出版之研究 。台北 縣:淡江大學資訊與圖書館學研究所碩士論文 。
羅思嘉(1990)。引用文獻分析與學術傳播研究。中國圖書館學會會報,66,73-85。
羅思嘉、陳光華、林純如(1990)。圖書資訊學學術文獻主題分類體系之研究 。臺 灣大學圖書資訊學刊,16,185-208。
資料庫與網路資源:
Science Citation Index®. Retrieved 6/1, 2008, from http://scientific.thomson.com/products/sci/
The 30th Annual International ACM SIGIR Conference 23 -27 July 2007, Amsterdam.
Retrieved 6/3, 2007, from http://www.sigir2007.org/history.html
中國大百科全書智慧藏。智慧藏學習科技股份有限公司編著。檢索日期:2008,
4/26。檢自:http://dblink.ncl.edu.tw/web/Content.asp?ID=377&Query=1
167
附錄
附錄 一 第一種和第二種主題整併下主題年代序列表
表 1 全部可對應之主題類別年代序列
主題詞彙 總次數 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007
Link analysis 3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 3
Web(IR,search,structure,www) 43 0 0 0 0 0 0 0 0 0 4 3 4 3 3 10 10 6
WORLD-WIDE-WEB(WWW,WEB) 63 0 0 0 0 0 0 0 0 0 4 5 7 12 6 8 9 12
Hypertext 4 2 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0
HYPERMEDIA 5 0 0 1 0 0 0 1 2 0 0 0 0 0 0 0 0 1
HYPERTEXT(HYPERTEXT IR) 15 1 0 0 0 2 1 3 0 1 0 0 1 1 3 0 0 2
主題詞彙 總次數 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007
Semantic Models 3 3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Semantics 3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 3 0
SEMANTICS 2 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0
LSI(Latent semantic indexing) 2 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0
LSI&Theory 3 0 0 0 0 0 0 0 0 3 0 0 0 0 0 0 0 0
LATENT SEMANTIC ANALYSIS 3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1
Probabilistic(IR) 3 0 2 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0
Probabilistic Models 3 0 0 0 3 0 0 0 0 0 0 0 0 0 0 0 0 0
PROBABILISTIC MODEL(S) (IR) 17 0 0 0 1 0 0 0 0 0 1 2 3 2 2 0 5 1
PROBABILISTIC INFERENCE 2 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0
PROBABILITY 3 0 1 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0
Theory and Logic 2 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0 0
Retrieval Logic 3 0 0 0 0 3 0 0 0 0 0 0 0 0 0 0 0 0
Logic 2 0 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0
LOGIC 9 1 1 1 0 0 1 0 0 1 1 0 0 1 2 0 0 0
Passage Retrieval 3 0 0 0 3 0 0 0 0 0 0 0 0 0 0 0 0 0
Mathematical Models(retrieval Model) 3 0 0 3 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Language Models 9 0 0 0 0 0 0 0 0 0 0 5 0 0 4 0 0 0
Information Retrieval Models 6 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Retrieval Model(S) 32 6 1 0 3 0 4 0 3 3 1 4 0 4 0 0 0 3
Formal Models 16 0 0 0 0 0 0 3 0 0 0 0 0 0 6 0 3 4
MODEL(S) 105 2 7 7 5 5 6 5 11 2 7 11 6 3 6 5 9 8
Inference Networks 3 0 0 3 0 0 0 0 0 0 0 0 0 0 0 0 0 0
INFERENCE(S) 9 0 0 0 0 2 1 0 0 0 4 1 0 0 0 0 1 0
主題詞彙 總次數 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 Classification&Categorisation(Classifiers) 28 0 0 0 0 3 3 2 4 0 0 3 1 1 0 5 3 3
Text Categorisation 7 0 3 0 4 0 0 0 0 0 0 0 0 0 0 0 0 0
Text classification 3 0 0 0 0 0 0 0 0 0 0 0 0 0 3 0 0 0
Text Categorization 14 0 0 0 0 3 0 0 0 1 0 0 4 6 0 0 0 0
CLASSIFICATION 20 0 1 1 0 0 0 2 0 0 2 0 1 4 0 1 6 2
CATEGORI(S)ZATION 5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 3
TEXT CATEGORIZATION 4 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 2 0
主題詞彙 總次數 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007
169
Evaluation 28 0 0 1 0 0 0 0 0 0 4 3 2 0 0 3 6 9
Performance Evaluation 3 0 0 0 3 0 0 0 0 0 0 0 0 0 0 0 0 0
SYSTEM PERFORMANCE 3 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 0
PERFORMANCE (STANDARDS) 35 0 2 0 0 0 1 2 3 1 2 1 2 5 4 2 5 6
high-precision 3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 3 0
PRECISION 5 1 0 0 0 0 1 0 1 0 1 0 0 1 0 0 0 0
RECALL 7 1 0 0 0 0 1 0 1 0 1 2 0 1 0 0 0 0
Test collections 3 0 0 0 0 0 0 0 0 0 0 0 0 0 3 0 0 0
IR TEST COLLECTIONS 2 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0
Data Structures 2 0 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Dimensionality reduction 2 0 0 0 0 0 0 0 0 0 0 0 0 0 2 0 0 0
Efficiency 25 0 0 0 0 2 3 0 3 0 2 0 3 0 3 4 5 0
Efficiency&Scalability 3 0 0 0 0 0 0 0 0 3 0 0 0 0 0 0 0 0
RETRIEVAL EFFECTIVENESS 7 0 1 1 0 0 0 0 0 0 0 2 0 0 2 0 1 0
EFFICIENT(EFFICIENCY) 3 0 0 0 0 0 0 1 0 0 0 0 1 1 0 0 0 0
Signatures 3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Indexing(structures) 5 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0 3
INDEX TERMS 2 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0
Compression 7 3 1 3 0 0 0 0 0 0 0 0 0 0 0 0 0 0
COMPRESSION 3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 2 0
主題詞彙 總次數 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007
Linguistic Analysis 2 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Language Processing 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Language Analysis 3 0 0 0 0 0 0 0 0 3 0 0 0 0 0 0 0 0
Domain specific NLP 3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 3
Natural Language Processing 21 2 0 0 3 3 0 3 0 0 4 0 0 0 3 3 0 0
Language 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0
LANGUAGE(S)(LANGUAGE IR) 10 0 0 1 0 0 0 0 0 0 1 0 0 0 1 1 4 2
NATURAL-LANGUAGE 5 0 0 0 0 0 0 0 1 0 1 0 0 0 1 1 1 0
主題詞彙 總次數 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007
Video and image 3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 3 0 0
Video and image 3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 3 0 0