• 沒有找到結果。

未來研究發展

在文檔中 中 華 大 學 (頁 59-66)

第伍章 結論與未來展望

此 採 用 原 始 參 數 設 定 來 進 行 分 類 時 文 件 歸 類 的 依 據,但 是 這 卻 無 法 將 SVM 優 異 的 分 類 能 力 發 揮 出 來 。 因 此 , 可 以 依 據 每 個 類 別 屬 性 的 不 同 而 設 置 不 同 的 參 數 值 , 或 是 可 以 開 發 、 測 試 更 多 不 同 的 核 心 函 數 (kerne l fu nct io n) 以 尋 求 各 好 的 分 類 效 果 。

至 於 在 GA- FCM 模 組 部 份 , 由 於 在 模 糊 分 群 演 算 法 之 中 , 有 許 多 研 究 在 探 討 集 群 有 效 性 (Clust er Validit y) 的 設 計 和 評 估 方 法 , 而 本 研 究 是 考 慮 到 使 用 基 因 演 算 法 將 兩 種 不 同 的 集 群 有 效 性 方 法 進 行 結 合 以 提 升 分 群 演 算 法 的 效 能,因 此 不 妨 可 以 考 慮 替 換 在 適 應 函 數 中 的 集 群 有 效 性 方 法 的 組 合 , 以 獲 得 更 好 的 分 群 品 質 。

誌 謝

致 謝 中 央 研 究 院 CKIP 中 文 詞 庫 小 組 所 提 供 的 CKIP 中 文 斷 詞 系 統 以 及 台 灣 大 學 資 工 系 林 智 仁 教 授 所 提 供 的 LI BSVM 軟 體 。

參考文獻

英 文 部 分

1. Bezdek, J. C.: Pattern Recognition with Fuzzy Objective Function Algorithms.

New York: Plenum Press, (1981)

2. Chang, C., Lin, C.: LIBSVM: a library for suport vector machines. Software available at http://www.csie.ntu.edu.tw/˜cjlin/libsvm, (2001)

3. Chou, C.H., Han, C.C., Chen, Y.H.: GA based optimal keyword extraction in an automatic Chinese web document classification system. Lecture Notes in Computer Science, Vol.4743(2007) 224-234

4. Dash, M., Liu, H., Xu, X.: `1+1>2': Merging distance and density based clustering.

Proceedings of the Database Systems for Advanced Applications, Hong Kong (2001) 18-20

5. Davidov, D., Gabrilovich, E., Markovitch, S.: Parameterized generation of labeled datasets for text categorization based on a hierarchical directory. Proceedings of the 27th Annual International ACM SIGIR, (2004) 250-257

6. Dorre, J., Gerstl, P., Seiffert, R.: Text mining: finding nuggets in mountains of textual data. Proceedings of the Knowledge Discovery and Data Mining, (1999) 398-401

7. Drucker H., Shahrary, B., Gibbon, D.C.: Support vector machines: relevance feedback and information retrieval. Information Processing & Management, Vol.38 (2002) 305-323

8. Eshelman, L.J., Caruana, R.A., Schaffer, J.D.: Biases in the crossover landscape.

Proceedings of the 3rd Int’l Conference on Genetic Algorithms, (1989) 10-19 9. Ester, M., Kriegel, H.P., Sander, J., Xu, X.: Density-based algorithm for

discovering clusters in large spatial databases with noise. Proceedings of the Knowledge Discovery and Data Mining, (1996) 226-231

10. Everitt, B.: Cluster analysis, New York:Heinemann Educational Book, London (1974)

11. Fayyad, U., Piatetsky-Shapiro, G., Smyth, P.: From data mining to knowledge discovery: an overview. Advances in Knowledge Discovery and Data Mining, (1996) 1-36

Vol.3955 (2006) 498–501

13. Goldberg, G.E.: Genetic Algorithms in search, Optimization and Machine Learning. Addison Wesley, (1989)

14. Han, J., Kamber, M.: Data Mining: Concepts and Techniques. New York: Morgan Kaufmann Publishers, (2001)

15. Holland, J.H.: Adaptation in Natural and Artificial System. The Press University of Michigan Press, Cambridge, (1975)

16. Hwee, T.N., Wei, B.G., Kok, L.L.: Feature selection, perception learning, and a Usability Case Study for Text Categorization. Proceedings of the 20th Annual International ACM-SIGIR Conference on Research and Development in Information Retrieval, (1997) 67-73.

17. Karypis, G., Han, E.H., Kumar, V.: Chameleon: hierarchical clustering using dynamic modeling. IEEE ,Computer, Vol.32(8) (1999) 68-75

18. Liu, D., Wang, Y., Liu, C., Wang, Z.: Multiple documents summarization based on genetic algorithm. FSKD, (2006) 355-364

19. Lin, F.R., Hsueh, C.M.: Knowledge map creation and maintenance for virtual communities of practice. Information Processing and Management, (2006) 551-568

20. López-Pujalte, C., Bote, V.P.G., Moya Anegón, F.: A test of genetic algorithms in relevance feedback. Information Processing and Management. Vol.38(6) (2002) 793-805

21. MacQueen, J.B.: Some methods for classification and analysis of multivariate observations. Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability, Vol.1 (1967) 281-297

22. Miyamoto, S.: Information clustering based on fuzzy multisets. Information Processing and Management, Vol.39 (2003)195–213.

23. Müller, K.R., Mika, S., Rätsch G., Tsuda K., Schölkopf B.: An introduction to kernel-based learning algorithms. IEEE Transaction on Neural Networks, Vol.12(2)(2001) 181-201

24. Nello, C., John, S.T.: An Introduction to Support Vector Machines and Other

28. Trotman, A.: Choosing document structure weights. Information Processing and Management,Vol.41 (2005) 243-264

29. Van Rijsbergen, C. J.: Information Retrieval. Butterworths (1979)

30. Vapnik, V.: The Nature of Statistical Learning Theory. Springer Verlag, New York (1995)

31. Wang, T.Y., Chiang, H.M.: Fuzzy support vector machine for multi-class text categorization. Information Processing & Management, Vol.43 (2007) 914-929.

32. Xie, L.X., Beni, G.: A validity measure for fuzzy clustering. IEEE Trans. Pattem Anal. Machine Intell, Vol.13 (1991) 841-847,

33. Xu, S., Wang, H., Zhang, Y.: Chinese abbreviation-definition identification: A SVM approach using context information. PRICAI 2006, (2006) 495-504

34. Yang, Y., Pedersen, J.: A Comparative study on feature selection in text categorization. Proceedings of the International Conference on Machine Learning, (1997) 412-420.

35. Youngjoong, K., Jinwoo P., Jungyun, S.: Improving text categorization using the importance of sentences. Information Processing & Management, Vol.40 (2004) 65-79

中 文 部 分

1. 蘇 木 春 , 張 孝 德 : 機 器 學 習 : 類 神 經 網 路 、 模 糊 系 統 以 及 基 因 演 算 法 則 (1997)

2. 曾元顯: 文件主題自動分類成效因素探討,輔仁大學圖書資訊系,中國圖書館 學會會報, No.67 (2002) 62-83

3. 吳鑑峰: 應用語音及臉部表情之雙模態情緒辨識,雲林科技大學電子興資訊工 程研究所碩士論文(2002)

4. 蔡明倫: 二維點狀影像資訊之強化、特徵擷取及辨識-以 X 光乳房微鈣化檢 測為例,大葉大學工工所碩士論文(2002)

5. 鍾明璇: 應用關聯規則技術有效輔助以向量空間模型為基礎之文件群集法, 中原大學資訊管理學系碩士學位論文(2002)

6. 陳榮昌,林育臣: 群聚演算法及群聚參數的分析, 朝陽學報 Vol.1(8) (2003) 327-354

7. 潘雅真: 企業式知識地圖,中華大學資管所碩士論文 (2004)

8. 劉冠妤: 導入概念階層觀念以改善分群演算法之績效,成大資管所碩士論文 (2004)

9. 韓歆儀: 應用兩階段分類法提升 SVM 法之分類準確率,成大工管所碩士論文 (2004)

10. 何俊德: 基於影像與文字特徵之網頁內容分類方法之研究,朝陽科技大學資管 所碩士論文 (2004)

11. 曾元顯,莊大衛: 文件自我擴展於自動分類之應用,輔仁大學圖書資訊學所碩 士論文(2005) 129-141

12. 曾元顯: 資訊檢索與知識探勘,輔仁大學圖書資訊系,2004

13. 黃安橦: 應用支向機於晶圓圖類之研究,明新科技大學工管所碩士論文(2005)

附 錄 一 、 特 徵 詞 詞 性 對 照 表

下 列 表 格 是 由 中央研究院資訊科學所詞庫小組所編列的中研院平衡語料 庫詞類標記集。

簡化標記 對應的CKIP詞類標記

A A /*非謂形容詞*/

Caa Caa /*對等連接詞,如:和、跟*/

Cab Cab /*連接詞,如:等等*/

Cba Cbab /*連接詞,如:的話*/

Cbb Cbaa, Cbba, Cbbb, Cbca, Cbcb /*關聯連接詞*/

Da Daa /*數量副詞*/

Dfa Dfa /*動詞前程度副詞*/

Dfb Dfb /*動詞後程度副詞*/

Di Di /*時態標記*/

Dk Dk /*句副詞*/

D Dab, Dbaa, Dbab, Dbb, Dbc, Dc, Dd, Dg, Dh, Dj

/*副詞*/

Na Naa, Nab, Nac, Nad, Naea, Naeb /*普通名詞*/

Nb Nba, Nbc /*專有名稱*/

Nc Nca, Ncb, Ncc, Nce /*地方詞*/

Ncd Ncda, Ncdb /*位置詞*/

Nd Ndaa, Ndab, Ndc, Ndd /*時間詞*/

Neu Neu /*數詞定詞*/.

Nes Nes /*特指定詞*/

Nep Nep /*指代定詞*/

Neqa Neqa /*數量定詞*/

Neqb Neqb /*後置數量定詞*/

Nf Nfa, Nfb, Nfc, Nfd, Nfe, Nfg, Nfh, Nfi /*量詞*/

Ng Ng /*後置詞*/

Nh Nhaa, Nhab, Nhac, Nhb, Nhc /*代名詞*/

I I /*感嘆詞*/

P P* /*介詞*/

T Ta, Tb, Tc, Td /*語助詞*/

VA VA11,12,13,VA3,VA4 /*動作不及物動詞*/

VAC VA2 /*動作使動動詞*/

VB VB11,12,VB2 /*動作類及物動詞*/

VC VC2, VC31,32,33 /*動作及物動詞*/

VCL VC1 /*動作接地方賓語動詞*/

VD VD1, VD2 /*雙賓動詞*/

在文檔中 中 華 大 學 (頁 59-66)

相關文件