• 沒有找到結果。

應用文字探勘於影評文章自動摘要之研究 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "應用文字探勘於影評文章自動摘要之研究 - 政大學術集成"

Copied!
59
0
0

加載中.... (立即查看全文)

全文

(1)b. 立. 政 治 大 ⽽. ‧. ‧ 國. 學. n. er. io. sit. y. Nat al. Ch. n engchi U. 然. iv. i. 新. A Study on Application of Text Mining for Automatic Text Summarization of Film Review. ⽽只 h.

(2) 新 O. r之. a. w. 兩. 新. O. Si. 60. 5622. 5545. l. 新. Nat io. O. Og. al. n. O. TFIDF hR. 50. 之. K-Means. 能. 有. Ch. v n i之 U engchi. 之. W. O. 新. l 21.19%兩. S. O 之 h. R. O. 新. 在. i. O新 然. g. 新. 兩. l 15.87%之. O新. ⽽. 之. O. 新 O. 三. WWA. 之. h. X⽽. 新 兩 h之. 之. O. 之. 4616. ‧. 62. 立. O. 兩. 政 66治 4616 大. 2. ‧ 國. 9345. O. 之. O. T. 學. 60. h之. v. W. ⽽. O. O. y. b. 之 SV. c. er. S. R. sit. c. 之V. T. O. 兩在 T 新. 之. 新. 之 c. W. h. O. 新. 之v. 之. 兩 i. 新. I. l.

(3) J 9 J As Facing the Big Data issue, there are too many information on the website for reader to understand. How to perform and summarize essential information quickly is a challenge. People who want to go to a movie will also face this situation. Before choosing movies, they will search relative information of the movies. However, there are many film reviews all over the websites. Automatic text summarization can efficiently extract important information for readers, and conclude concepts of reviews on the websites. Through this method, readers can easily comprehend the best. 政 idea of all the reviews and save their time.. 治. 立. 大. ‧ 國. 學. The research presents a multi-concept and extractive film review summary for readers. It generates film review summary from the most popular blog platform,. ‧. PIXNET, with extract-based method and clustering concept. The method using. y. Nat. io. sit. K-Means algorism let the film review summary focus on specific film to cluster the. er. n. sentences by features, and havingastatistical sense and WWA method to measure the. iv. l. n sentences. On the last step, it C hthe representative weight of sentences in order to choose i U e ngch. will compare to templates to decide the sequence of classified sentences and summary all represent sentences from each cluster. The research provides a multi-concept and extractive film review summary for people. From the result, there are five movies, which are used summary method increase the average similarity to 21.19% that comparing between the film reviews summary and templates summary. It shows that the automatic film reviews summarization can extract the important sentences from the reviews. Also, with comparing template method to order the cluster, it can sequentially list the cluster of the sentences to generate a movie review, which saves readers’ time and easily comprehend.. Key words: Text-mining, Film review summary, Automatic text summarization, sentences clustering. II.

(4) 新. ............................................................................................................................................. I. ABSTRACT ................................................................................................................................ II ....................................................................................................................................... V ..................................................................................................................................... VI ............................................................................................................................ 1. 政 治 大 ................................................................................................................. 1 立. O ................................................................................................................................ 2. ................................................................................................................................ 3. ‧. ‧ 國. 學. y. Nat. 然. i. al. n. 然. er. io. sit. .................................................................................................................. 4. i 新. v. .................................................................................... 4. ni. Ch. engchi U. 新. ............................................................................................. 8. ............................................................................................................ 9. 2.3.1 . ............................................................................................. 9. 2.3.2 . .................................................................... 9. 2.3.3 . ......................................................................... 9. 2.3.4 . .......................................................................................... 10. 2.3.5 . .......................................................................................... 10. h. .................................................................................................................... 10 新. .................................................................................................................... 12 .................................................................................................. 14. .............................................................................................................................. 14. III.

(5) . .............................................................................................................................. 16. .............................................................................................................................. 17. 3.3.1. ...................................................................................................................... 17. 3.3.2. ...................................................................................................................... 18. 3.3.3. ........................................................................................................................... 18 O. ......................................................................................................................... 19 ................................................................................................................. 19. 政 治. 3.4.1. ‧ 國. ...................................................................................................................... 21. sit. io. a(WWA) ............................................................................................ 22 iv l C n hengchi U. n. 3.5.2. y. Nat. 3.5.1. 新. ............................................................................................................... 21. ‧. ........................................................................................................................ 20. 學. 3.4.2 K-Means. 大. 立. er. .................................................................................................................... 23 .................................................................................................................... 25. ............................................................................................................ 27. i. 新. i. 新. ................................................................................................ 28. i. 新. ................................................................................................ 39. .................................................................................. 27. g. 新. ........................................................................................... 40 ................................................................................ 46. ......................................................................................................................... 46. ........................................................................................... 47 ................................................................................................................................. 49. IV.

(6) 2-1. ........................................................................................................................................... 6. 3-1. ............................................................................................................................................................. 15. ................................................................................................................................................... 24. 立. 政 治 大. 學. ‧. io. sit. y. Nat n. al. er. 3-3. ............................................................................................................................................. 21. ‧ 國. 3-2 K-MEANS. Ch. n engchi U. V. iv.

(7) .............................................................................................................................................. 17. 3-1. ...................................................................................................................................... 20. 3-2K-MEANS. .............................................................................................................................................. 25. 3-3. ............................................................................................................................................................. 27. 4-2. 2. 4-3. 2. ..................................................................................................................... 29. 有. 立. X⽽. 4-5. 能. X⽽. 三. 有. ............................................................................................. 31 ........................................................................................ 32. 三. .......................................................................................................................... 33. 有. io. sit. y. Nat. 4-6. ‧. 能. 學. 4-4. 政 治 大. ................................................................................................................ 30. ‧ 國. 4-1. er. 34 a ...................................................................................................................... v i l C hengchi Un ............................................................................................................................... 35. n. 4-7. 有. 4-8. .......................................................................................................................... 36. 4-9. ................................................................................................................... 37. 有. 4-10 4-11. .............................................................................................................. 38. 4-12. ................................................................................................................................................ 39 g. 4-13 4-14 4-15. ........................................................................................................................ 39. 新. g. 2 能. X⽽. 三. 4-18. g. .................................................................................................... 41 g. g. 4-16 4-17. 新. 新. ............................................................................ 42. ......................................................................................................... 43. 新 新. .............................................................................................................. 44. g. 新. .................................................................................................... 45. VI.

(8) . V. dWb. 之. 兩. S h. V. r之. O. c. m. y. 新. 之. O. S. 然. h. O. R. W. 之 O. b. O. 之v. o. 新. O 之. S. a. i. Ow 之. 兩 1. ⼜之. 然v. a. 兩V. b. i. O. 兩 之. n之b. O. 新. Su. 之. r i. O. sit. n. g. o. b. Sullivan(2001)之. 之. 之. 然O. 知. w h之i. S. 然l次. O. O. 要. v ni U ei ngchi 新 S 兩. X. Or. O. O. Ch. 之Sullivan. 有. 之 o. ‧. al. cS. w 之. b 之 S. O. O. io. O新. lT. 家a. Nat. 新. O. V. 之. ‧ 國. R. 兩 i. g. R. 政 治 大. 立. O. b. 之. Wr. O a. O. 之. 學. 家. h之. O. er. O. Or 之. O Olv Vr. a.

(9) 新. S. W. O. 之. 然O. O o. O. 之. i. O. Z. O. fX. e. 兩 之. V. W. O. 立. 之 m. ‧ 國. v. 之 之 eT V. n之. O. 之. 之. O. 很. i O. 兩. O 新. K-Means 之 之. O. 之. a O v a lV ni Ch engchi U 然O. m. O. y. b. 然. b. h. ‧. R 兩. 之. O. n. O. 之. O. io. a. 之 f 政 治 大. Nat. 之 S. 之. 學. c O. b. sit. a 兩. 新. v. V. er. fO. T. O新 之. a o. Og. 之. O. 如. O. 之 r h. WWA. 新. O個. R c. 有. O O 新. 新 O. 之. 我 an 之. O. 之. O W. 2. O. 新. 兩.

(10) O讓. n⽽ O. 之 w. 新 hO. 之. 新. 兩. O. 之. v. 立. O. 之m. 之. h. O. y 新. 新. O. sit a ll Ch. er. 之. n. l. 之 W. ‧. io. v. Nat. V新. 政 治 O大. ‧ 國. 兩. 新. 之m. 學. 新. 新. O新. 新 h. g. engchi i. O. i Un 新 如. 如. l. 兩. 3. 如. v. O. 如 S. 之u.

(11) cu i. 然. 新. hv. 然. h. 新. v. V. O. O. i. 新. 新. 兩. i. l. 之. O. l. g. 新. g l v O新. 之. 新. y sit. io. n. al. 點 知2014⼜. X. V. Ch. n e n g c h i U. 之. a. ⼼. iv. 然(Text Mining) O. l兩. 然S. i 之 O. S. 有. r這c. i. 了. S. 之 下. (semi-structured)O. h. 兩. S v. 然O 然. (un-structured) W. 新. (extract-based). ‧. Nat. b. 新. 兩. 然. 天. (Domain Knowledge). (Statistical Analysis). (abstracted-based)O. 如 i. 政 治 大. 立. l. ‧ 國. O. ⽽. 學. 新. v. er. 新 如h. O. 了. 之. O. O. S O. 之v. l. 出. 出. 出 h. 4. 之V. 之. O m. 兩.

(12) 之 Wk. r之. m. w. S. w. S. O 出. h之. O. 之. S. io. n. K. 為. ⼩. OK. l. S. V. W. c. 出. W. VO. 兩 O. v. 之. m. O. al. WK. R. 之. y. 之. Su. i 政 治 大. bO. Nat. W. 之. 立. ‧ 國. W. 出. O. ‧. 兩 出. O. 學. 出. 之. 兩. VO. 出. O. W. O v. 兩 hO. OS. 之. 兩. 出. O. er. V. O. sit. k. i v為 K C LDA hengchi Un. ⼩. 出 兩. n. LDA. 兩. K. 為. ⽽. K. 為. (KNN)S. 之V W. k 之. 出. O. r之. W. r之c OK. 之 Z k. 為. hO. 兩. 5. O O. 之. OK. 為. k. O. l.

(13) ⼩. ⽽. ⼩. (SVM)l. 出. 之V. g. O. l. r. OSe. V. O. 之S. S 有. O. d. 之. h之. 兩 活. (Latent Dirichlet Allocation, LDA) 之S. (Statistical Topic Models ) 之. g. v h. Ch. 之v. n engchi U O. l. f. O. W” bag of words ”O. R. 兩. O 之LDA. 2-1. 之i v. n. 之. al. Wg. S. er. Nat. g. hv. io. 之. l. ‧. ‧ 國. O. 學. l. y. 立. LDA l. 政 治 大. sit. l. O. 知topic-word⼜之. 知doc-topic⼜ 兩 r LDA. 之 O. hO. Su. S W. 兩. 2-1. Document. Topic 1. Word. Topic 2. ........ Word. 6. ……............. .......... Topic n. Word. …...... O之.

(14) l. K 知K-Means⼜O. k l O Ok. o. ht之. S. 之. l⽽ nO. Ow. c. ‧ 國. !"!!. Ch. !! Oht之 l. a n. n engchi U. !兩. N. htO. k 之. 之. h兩. k. ht之htl. (1). 兩. b. iv. k之. 之. k. 兩K-means. ht兩. bO n. (1). sit al. k. n. !. y. 之. n. ⽽. ! − !!. n. b. l. OZ. er. ⽽. 之. ‧. ; !! l. io. n. ! !!!. Nat. l. 之 nl 政 治 大. 學. !=. ht. l 之. l. 立. k. s O. ht之 w. h之k l. h. N. S. W. O. 之. ⽽. !! − !! < ! 之 7. (2) O. R. 兩.

(15) 然. i. 新. i. 新. 之. S. 然. h. O. 之. 之. 天. Ow 兩. 之2014⼜ 政. 治. 立. 動 知2012⼜. 然O. ‧ 國. 兩知. l. 之. b. ⽽. 有. sit. y. O. er. 兩. n. al. ⽽. l. O. v. ‧. O. io. 然. W. 大. 然. Nat. ⽽. l. 之. 學. 之. Olv O. aO. 點. O. i. Vr. 之2011如. i. R. O n之b. Ch. n engchi U. iv. 有. O. 兩 有. l O. ⽽. O. 之. O. 有 有. l 說. ⽽. 說. 然. 兩 之. O. 中 a. h. O. 有. 兩. 有說 ⽽. l. 之. O v. 有. 之. 有. 說 之. 兩 T. i. 新. 8. S. 然. 了O. 之.

(16) 然O. 之 n 新. O. 兩. i. 新 新. R. O. g g. al. 新. 新. w 之 n. O. 要 O. 之 v. 新. w. o vm 新. 2.3.2 次. 新. l. 之. O. 2.3.3 次. 之v 新 新. n e n g c h i UO 新. v. R. 新. iv. 之 R. n之g. 新 新. O. S. g. v. O. 之 S. 兩知. 新. 天. 點. l. 之2014⼜. 新. (Multilingual Summarization) O 新. O新. 兩知. (Extractive Summarization)S 9. ⼀g ng. (Monolingual Summarization)O 新. O. (Multi-Document Summarization). gR. l 之 次g. R. C之 h. 如 次g. Sg. O. (Single-Document Summarization). n. S. R. 之 nl. 新 之 次. io. 新. 新. Nat. l. 之 w. ‧. 新. O新. 政 新治 O大. 立. ⽽. 2.3.1 . R. ‧ 國. O. av. 學. 新. O. b. y. l. V新. sit. Oi. 之. er. S. 然O. R. O. d T. 之2007⼜.

(17) O. 新 S. Summarization) Oe. 之. S新. W. 兩次. w. k無. 新. 新 之. 之. S新. (Abstractive. 新. i. 兩(Dalal & Zaveri之2011; Das &. Martins之2007; Gupta & Lehal之2010; Mani & Maybury之1999) 新. O. O新 之 次 立. S. w. sit. O. 之 次. O O. 新. O. 新. 之v. R. 之2007⼜. 之. 之. O. S. O. 之. 有. O. (2006). v. S. l. 之. 兩 之在. b. (Query-Based. O. O新. O. O兩知. h V. 之. iv l C hengchi Un (Generic Summarization)S R O. 新 之 W. O. O新. 之2007⼜. 新 a. 新. Summarization). 兩知. n. 次. o. 新 之. io. 新. 2.3.5 . 知Indicative Summarization⼜ S. ‧. O. 新. O. Nat. R. 政 治 大. 學. R m. O. (Informative Summarization)c. ‧ 國. 新. 新. y. 次. 新. er. 2.3.4 . O. ⼿ O. O. 之. 為 l. 10. O 好. R. 之 O.

(18) O. O. W. W. 之R. k. 之 R S. o O. 之vm ZO. 有 之. O. r. r. W. 立. 之. ZO. k之 政 治 大. ‧ 國 n. w. O. O. 之. er. io. v. a. O. 兩 T. sit. O 也l C知2000⼜. 之. 得. c. ‧. 之. O. k. 學. Nat. O. S. 兩. 之 V. 兩. R. 兩 S. 之yW. O. O. O. y. 之W. hengchi Un. i. 之. iv. l. lv. a. O. XlO. 之. OR. v. m兩 V cWk O. aO. li. 之. O. 之. S. S O. S. c. O 之. Facebook. O m. 11. 之. 之. O 得. 兩. O. W. S O.

(19) 新. 新. R. Knowledge). O. (extract-based). 新. O. v. l. 新. 新. (Domain 之. (Statistical Analysis) 之. (abstracted-based)O. nc. 新 R. O新. 兩. 治. 立 l. 新. 之. y al. n. 新. Ch. h之. n engchi U W. V. hO. S. w. 之. 之i. SuV. 新. O. 新. O. O v. r之 h. W. S O 兩. 之yWa n hO 新. 之. O. n之 pvm. O. h. 之 S. 之V. gO. v. m. 得. 兩. h. iv. O. 之Vi O. l. er. io. V. 兩. sit. (Statistical Analysis)之 兩. h. r. Nat. 新. hO. (Domain Knowledge)之v. 之 SX O. v. ‧. ‧ 國. ⽽. 新. 學. l. 真政天知2006⼜ 大. 有 有. S. 之 有 O. V 之. h d. 兩 l⽽新. (extract-based). 新. (abstracted-based)(Dalal & Zaveri 2011; Das & Martins 2007; Gupta & Lehal 2010; 12.

(20) Oi. Mani & Maybury 1999)兩新. 之. 新. O. v. O. 新 如新. O. O 之. k. 新 O. 之. k. O. 之. kO. O. r之. ‧. S. 之 R. 新 a 之m. n. 兩. i. io. a. a. O. w. 學. 兩. S. 政 治 大 g兩 立O. ‧ 國. l. 之 新. 之 S. Nat. O. O. 之. O 之. S. 之. y. R. l 之. 之 之 yW. O. c O. 之. 之R. O. sit. O. O. S. O. er. g. 新. iv l C hengchi Un. 13. O.

(21) h之v S. O. 新. l裡. ar. R. 立. O. 政 之 治 大新. 新. WvmcW w. al. n. O. cWrn. y. io. 新. vmcWw. 新. 之 w S. 之. R h. O. c. 之 g. O. 新. 之v. l b. i裡. O. 兩. O. n 有. 之. O 之. tfidf. 裡. l 之. O. 開. 新 之V. 之. O. 之. O 之. S 之. O. i. O新 如 O. 之. 3-1 l O. 之. O. v Ch 新 之 Uni O engchi. 之. 之. er. Nat. 之Vi. O. ‧. 新. ‧ 國. 兩. h之. 學. O. l. 兩V. 之. 之 a. v. S新. O. W. 新. sit. 新. O. h. w. 如. S. K-means 如. S 如. WWA O. og. 之 14. O. 如. 之.

(22) S. W. an. 新 兩 n. u兩 3-1. 1 2. 學. ‧ 國. 立. 政 治 大. Nat. K-means. n. al. er. io. sit. y. ‧. K-means Algorithm. Ch. n engchi U. WWA Method. WWA. 15. iv. S.

(23) bO. (PIXNET)S 學 V. O. a. 兩. h. Of 兩裡. 立. O. n. R. O. 之. g. Ch. 裡. O. l. n engchi U. 6000. 兩. 2 能. rO. cl. v. i. O 之v R. R⽤. 之. h5. l. X. 之 R. O. 裡. 之. 之. Wb. O. O 16. 3-1兩 l. 裡. Python 裡. 之. 三 兩. Beautiful Soup Tool. V. aO. 50. X⽽. v. n. O. iv W. W a. h. (PIXNET)hO. 之. O. S. 兩. l裡 W5. g. aO. al. 之. 之 l. m之裡. io. 兩 h之 i. 裡 O. Nat. a無. m. cV. ‧. 之. 之. O 政 治 大. ‧ 國. O. O. 學. ni. O. 之 S. S裡. i. 之 h. h. y. g. g. 之. sit. 裡. er. O API li. 新. O. 之v.

(24) O 50. O. 新. O. i. 之. O Tag. 之. i. 兩 3-1. 66 治 政 大. 2. 立. 60. 9345. 學. ‧ 國. 三. 60. 5545. ‧. 62. 5622. 50. n. al. 4616. er. io. sit. y. Nat. 4616. Ch. n engchi U. iv. V. r之 裡. Ow 之yW. O. O. T. 得. 之. O. O w. 3.3.1 V O 新. r之 之. h. a. O. O r. Re. h之 O 之. 得. W. 之 得. T. 之. w 之 O. Vi a. 兩 V. rvm 17. r. O R. R. O. w O 兩.

(25) 3.3.2. T. Jieba O. 之v. hO. W. 之在. h之 S h 之yv. O. 樣. 之V. l. 立. 新. ‧ 國 之. O. 3.3.3. S. 什. 兩. Ch. m之v. V無. iv. n e n g c h i Ui e 如Tag. V. r. c. Z c. S. Tag. m兩. h. “. 之. y W Tag. n. h之. 得. O. O. 之. W. W. 之S. ‧. io. al. hOX O. O. h. h. my O. Tag. h. 政 之 治 Marvel 大. VO. Nat. ri. gO. N-Gram. hO. N-Gram. N-Gram 友. 之. 裡. yW. 學. 兩. 之. 之. 得. 之 V. l. h. 多. V. O. sit. W. OS. l. er. hO. 之. l. ” 友如樣 之 lR 之 w O V a. w O. b. 之 w S. O. W友 之w. ”. 友 之”. O. l. 之. rc s O N-Gram. h開. 兩. T. i. O. Jieba O. 之 之. O 18. “兩” O. R. V r. O. 兩.

(26) O O. 之. yW. O. n. 兩V. O. w K-means W. l. 立. ‧ 國. S. O. l h. S. n. d. u. o. 新. h之 wg b. W 8~12. O. 之. R. 裡 O. 兩 X. gO 之 h. a 之. W RSv. 兩V n之v. D.. 之. a l O 之wg w O v ni Ch U engchi. y O. S之. er. io. T. 之. 兩. ‧. Nat. O. 之 S. 之. dS. k. Newman (2007) J. Boyd-Graber (2009)O. n. 之. O. 學. K-Means c. 之. g. 政 治 大. K-means h之k 之. 兩 u. V. 兩 O. V. hc. 之. O. 3.4.1. O K-means. y. wa. sit. r. vm. O. 之. OR 之 W. cW. W h. aO e. O. v. 兩. a. 19. V 之. O S. 之V 之. b. O O.

(27) o. ZO. V. 新. rO. O. k. 之. S. 兩. O. 之 c. ht之 wR o. O. 立. ⽣. 之. S l 8~12. ‧ 國. Ok. S. ‧. 2. htO. ht之 w. er. a lK-Means O v ni Ch U engchi. n. l. 3-2. io. 兩. 有. Nat. O. 之. O. h之k O. 政 治 大. 之 O. 後. k. 學. V K-means. O. 兩V K-means. k. 兩. O. 之. S. k-. O. 之. 之 O. y. 3.4.2 K-Means. W 8~12. sit. n之v. o V. 3-2 麼 a. 兩 3-2K-Means. 1. X. 國. 時 國. 2. m. 3 4 5. X. X 麼. 2. b. 6 7 8. 20. X.

(28) 3-2 K-Means. 政 治 大. 立. c 之. n. 之. WWA. er. io. TFIDF. al. mC h. v ni O U engchi R. 兩 n. OS TF-IDF之TF-IDF SV V. h. TFIDF. 兩. WWA 3.5.1. O. y. O. K-Means. O TFIDF. Nat. 之. 之. sit. K-Means. ‧. ‧ 國. 學. hO. O. O TF-IDF Frequency)兩. 之. V. h. 之TF-IDF O. 然 之. u之. O. r之. O. 之 V. l. W. 兩. S⽽ TF * IDF之TF(Term Frequency)之IDF(Inverse Document n. TFIDF O. t. 兩TF. !"!,! = 21. !!,! ! !!,!. n⽽. (4).

(29) jS. 之i S. iVjh. O. 之. h. ! n!,! SV. O. O. h之. j. h. O. 之!!,! 有. 兩. n⽽. IDF. !"#! = log DS. W. 之i SV 之 tf!,!立 ×idf!. 兩. h O 政 治 大 vo. V. 之. TF-IDF. W. h. TF-IDF. ‧ !"#$"!,! = !"!,! × !"#!. io. sit. y. (6). er. Nat. al. n. TFIDF. 之t ! S. 學. n⽽. (5). !:!! ! !!. ‧ 國. O. O. !. Ch. Un engchi 之. O. iv. 之o. O h. 有 O. tfidf. 兩 3.5.2. (WWA). 對. 之. (2004)V O. 之. h. R. O O. (7)l WWA O j之. w. Cosine Similarity vml 0~1之. 之v. e. S. i. j. K-Means. 兩 之. O 之o. O. l. O. 兩!! S. j. j Ok. !′! 之. l!! ~0兩. O 22. n. i TFIDF h之!′! 之. 之. w. i. j 之v.

(30) k. O. ! !!. V. !!!. =. 新. 之. − !! × !"# !, !. (7). 之 S. 治之 大. cS政. 立. 之. ‧ 國. 之. Nat. h. io. n. al. 裡. 之. Ch hO en. O 之. iv. n gchi U. S裡. a. Oa. O新. h. 之. W. V. O. r之. S. 新 w tfidf. O. WWA. V. O. O. h S. 20. 多之. 5. 之 l. 之 O 之 我 Oa. O. O. o 兩. hO. 兩 h之V. 之V. 10. n. y. 兩. W. sit. O X. O. er. 之l. T. ‧. O. h. 學. 之. 之 w. 兩. !. 之. O. hO. O. 新. 之W. hR. 新 兩 n hS. n. O. 23. O. 之. 3-3 l. W. 之 兩. b.

(31) 3-3. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat al. Ch. n engchi U. 24. iv.

(32) . 新 l. 之. 之. O. 新. 新. 兩 n. u. 兩 V裡. hO n. 兩. 新. O. n. 之. u. 3-3. io. n. Ch. n engchi U. h之 O O. O. l. 新. ⼜. 兩 h之. 家. 5. 兩. 5. 新. a. l裡. 裡. 兩. 兩. O. 之 S S. 新. 知50. 裡. O. O O. l. O. 之. h. O. aO. 50. l. 新. iv. i裡. l裡. g. 兩. y. Nat. 3-3. al. l. 新. O. sit. m新. 立 g. ‧ 國. S. 政之 治 大 l. ‧. 新. v. 學. 新. O新. er. 之. W. X O. h O. 6. h. 之 25. O. 如. S. 之V. O. 之. W.

(33) 之. O. c. l. 新 新 W. 新 之. R. hO. h v. 兩 O. W ⼀. O. O. hO. 立. 兩 政 治 大. 學. ‧. ‧ 國. y. Nat io. sit. m. S. O. 之m O新. 兩V. 之. n. al. er. b. Ch. n engchi U. 26. iv. 之. S.

(34) h之 c 之. 兩. cu. 新. Ow 之. 之. 新. ⽽. 2 能. ‧. 之. X⽽. sit. y al. 新. Ch. l. 兩. n engchi U. O. 之. iv. g. 新. 新 S. w. aO. 50. er. 之. n. O. io. 6000. aO. Nat. 三. 兩. 立. 學. 裡. S. 政 治 大. ‧ 國. i. 新. l. O 新. c. 之. 4-1兩 4-1. g. 新. 新 兩. 27. 之.

(35) u. l. O新 之. O. 新. 新. O. 之. 之v. 新. 新. 立O. 新. X⽽. y. w 之. hO. 之. n. al. h. O. h. O. er. 有. 之. ‧. 新. io. hO. 之 W. 三. c. Nat. 兩. 政 治 大. 學. 2 能. 兩. ‧ 國. n. w O. sit. i. S. Un. Ch. We n g c h i. iv. an. O. 兩. 4-2. 4-11兩 c l 之 S. 2 S. O. K-means V. 1 hW. 之. 2h. O. h. 之. w K-means. O. hW l. 之WT 之. 之. 有 之. 2 國 有 之. h. 之. 4-2. O. 兩 O h. 4-3 lV. 有. h. 之 tfidf O. 28. hO WWA 之W. O. V.

(36) O. v. 之. SV. 5 hO. b. O. o. c 友. X. W. a 之 友. O. hW友 o. 友. 樣. hW O. O. 2. Nat. -. S. 政 治 大 h. 之. m. ‧. l. 樣. X. ‧ 國. 兩. 樣. TkOZ. TkOZ 友. X. 學. O. 之 立. h. l a. hOa. 樣. an. T. 樣之. w我. W. io. sit. 樣之. S. Rm. 之 友. w. y. 之. 兩. n. a. er. R. 4-2l. Ch. 2. n engchi U. iv. 有. 有 國 D9. C. 麼. X m. 快. X. t. k. 麼. X. X. 時. X. m. X. X. 2. marvel V. R X. 29.

(37) 4-3. 2 O 3. l. 4CJ. a 不. 發. 兩 兩. k. O. O a. gvf bO. O. 立. O. T. l. Ou. io. X. al. n. nO. l. S. Nat Ok. l 愛. X. 兩. S. 年. 9. O兩 J O. 兩. 麼不們⼦. 兩. 看. V. h. bi n C h麼 engchi U. v. S. 年. O. 7D O. 兩 X. 兩 兩. Rm. l. 年. hS. 看. O. TkOZ. l. 麼V. k. 時. l. hS. ‧. k. l. S. i. 學. V. 兩. X 政 兩治 大. ‧ 國. l. O. y. l. O. sit. 國. l. er. O. l. 們. T. h. X. O. 那. b. O. X. 兩 XV. l 9. l. C 2J. 會 A. n. O. l. r. 了. OW. 國 l. X. 兩. X. X. 想. 7. 以著X. 兩. 可. g. O. 兩. O. l. 兩. O. SV. O. 兩 l. h. O. W. X O. l. 國. 兩 v. 兩. 30. o. V. c.

(38) l. 三. -. 能. 4-4. X⽽. 有 三 X. X. 能. X. 4. 立. ‧ 國. X g. b l X. io. y. n. al. Ch. n engchi U. 31. X. ‧. DC. 能. 學. 來. justice. 政 治g 大. junkiexl X. dawn. b. Nat. 8. 能. w. 6. ice. bdc. 來. 5. superman. X. 3. 7. batman. sit. 2. 能. 有. er. 1. 三. iv. b X.

(39) 能. 4-5. X⽽. 三. O 能. X. 三. r l. h. l. vmc. 9JD9 5 2. 9C. 1. O多 O. 讓. i. 道. O. h. io. 兩. X. al. O. cW. O. 69N. y. 來. o ri n C hO engchi U. S. v f能. 兩 O. f. a. 兩. l能. l. l. X兩. 能. 兩. l. 52. g. n. O O. JA. 兩. hg. l. 9M. bdc. sit. ‧ 國. 分. Nat. C. D9. 政 治 大 兩. 立 X52能. X. l. 2. ‧. X. 9JD9. 學. lV. 三. 能. 52 O. l. X. 兩. b. l. JA a. 兩. 能. X l. 9M 0. 兩. O O. l. D9. er. l. X. 三. r. O. SlT. p. yW. X. m. 兩 OR. l R. l. f V. l. hvmW. r XS. l. X. l. 來 XO. h兩 r. oRS. p. O. 兩. S. w. O. O兩. o. S. i 來. S. w. 過. 兩. 能. 來. ry. O. l l. X兩. 兩. l. l. Ow. T. T. 9B A S S. O 32. hO 兩. s. 道 兩. W. g. O. 兩.

(40) l. 有. 4-6. 有 zoo e. topia. X. Nick. ⾃他 最. 最. X 都都. 政 治 大V f. 都都. Z ⾃他. X. 種⼰. ‧. ‧ 國. io. sit. y. Nat n. al. er. b. 立. X. ⾃他. 學. c l. v. R. Judy. 種⼰. X. Ch. n engchi U. 33. iv. g.

(41) 4-7. O. 8. l. J. A9. h. bdc. 種⼰兩 bdc. l. l. r. l. W. 立. O. ‧ 國. W W. O. l. ⾃他 A B l 政 治 大. O. 種⼰. 更. l. O⾃他. 兩. Nat. b. al. O. R. l. g. m. bO. 兩. 兩. iv. n. o. 兩. er. io. X. l. 更情O⾃他. 兩. N兩. 種⼰. R. l. Ow. ‧. 最. l. e. 學. l. N. 兩. y. 上V. a. sit. l. bdc. mC h m. tU n 兩. O. engchi. f. v. V. 美. 兩 l. R. S. O. t. ⾃他O更. XO. 太. r. l. T. T X. Vi cO. h. l. R. O. O. 兩. 兩. ht8. J. A9. 兩 yS. S. S. l. yW. 兩. O. O. l. h. 兩 i. l. X O最去. O. l. O. O. O. l. yS. v O. l. c. X. O美. 兩. a. S. O. X. c兩 R. l l. b. d. O l. X 都都. S. O. V. ca. O美. 兩. 兩 b. l. 34. 兩. 兩. R. O.

(42) l. 有. 4-8. 有 地. g interstellar. 169 2001. X. 立. cooper. 治 政 o 大. w. r. wT. h. cooper. 23. 學 r. r. ‧. 地. io. sit. y. Nat n. al. er. r. ‧ 國. r. V. Ch. n engchi U. 35. iv. r.

(43) 4-9 O w. l. 地. 們. 不. 你. O. Z兩 d. S. a. 11. 7. 兩. g. l. to O. W. SUR t兩 政 治 大. ‧ 國. O 兩 X. Nat. VNASA. l. io. 兩. l. O. RgO. V. n. al. a. l. W. T. yS. l. 兩. ‧. l. g. 學. l. aUc. R. 立. hO. l l. g. Interstellar 給. 兩. O. 兩. X. y. l. O. sit. b. O. er. l. Ch. Ou. n eef n g c hfi U. iv. n. OXv. 兩. OX. hc. 兩 rcW. l. V r. l. wT23. n. l. O. l 沒. l l. o. T O. l. 們. V. V W. h. mfo. gOr. 兩. VR. O. r. 還. aO. r. 到O. 兩. R. X. 兩. 兩. O. 地. 23. Or. T. s. 兩 Or. 兩. g. dS. O. 兩. 36. S. r. ⾥.

(44) l. 有. 4-10. 有 X. b C. 活. r. 時. 種. X. intern. 活. 時. a. Prada. ‧ 國. 學. n e. ‧. k. io. sit. y. Nat n. al. er. t. 立. 政 X治e 大. X. 種. 40. 是. h. Ch. n engchi U. 37. iv. X.

(45) 4-11 O aZ. l. S. O O. vs vs. 學. vs O. vs. S. k. 兩. vs. l. vs. lT. O. X. w. O種. 兩. ScWR. O. 兩. l. dVV. l. Ben. T. O⽇Ra. O 政 治 大. 立. ‧ 國. O70. 活. 20150925. 9. W. O. 時. 起. r01. 2. 就和. ⼈. a l們 感 v ni Ch U e n gThe c h iInterna. n. h 2015. S. y. THE INTERNa. io. l. r. Ben Whittaker. ‧. Nat. l. 兩. 兩. 學. X兩. 時. 種. O. Jules 活. l. O. sit. f. er. l. 兩 2015 活. 25. 9. 時. 25 起. 就和. 兩 O. l. a. l. O. l. 活. l. 時. Or O. O. R. 兩 S. O 今. OBen. 活. 種. 感. O. X兩 S. 兩. 兩. X. 兩. 做. l. 時. T. t. l. 是 活. O成. UR 兩. O70. 70. f. 的. O. l. l. O. h. ⼤博. w. 時兩 V O. 38. 200g X種. 兩.

(46) i. lT. n. 新. 之. V. 4-12. l. 新. Z. h. rO. O. 兩. 兩. 4-12. 新. 政 治新 大. 立. 學. 之v. 4-13 f. n. O. 之. SuV. w. g. 新. 新. er. io. l 21.19%之. y. O. sit. Nat. O. al. V. ‧. 新 h之. Compare 1 Compare 2. ‧ 國. g. Ch. O. n i U e n g c hw新. iv. 之v. 之. h 新. 兩 4-13. 2 三. Average. g. 新. Compare 1. Compare 2. 0.2091. 0.1612. 0.0479. 29.71%. 0.2504. 0.2328. 0.0176. 7.56%. 0.2351. 0.1568. 0.0783. 49.94%. 0.2198. 0.1441. 0.0757. 52.53%. 0.1453. 0.0953. 0.0500. 52.47%. 0.2119. 0.1580. 0.0539. 34.11%. 39. Difference. Improvement.

(47) h之. 之. 知Compare2⼜O. l 15.8%之 T 34.11%兩. n. 之. 新 之 w. 新. v. Or. g. 立. l. ⼀. 新 之. v. u. R. O. 新 兩在. al. n. 之. Sv. y. ‧ 國. 新. S. io. 4-18 h. 治 政 新 大. ‧. 之. O. 兩. Nat. O. 之. 之. ⼀g. 學. 新. l. O. g. 新. w. W 之l. w. g. e之. 4-14. er. 21.19%之 v. S. sit. V. C之h. v ni h U engchi V. O. 2l 之 1. 4-14之. 2. 6 O. 之. O 4 g. 5 新. O新. 8. 3之. l 之. 40. 7. l m. 新. O. 兩.

(48) 4-14. g. 2. g 2. 新. The Avengers Age of Ultrona. 20150422. 不 發. 兩. O. O 年. 國. k. O. bO. —. 們. 之. O a. O. O. gvf X. 兩V. 2 O兩. 立. O. ‧ 國. S. X X. 了. 想. n. h O. 之. X 那. h. sit. h. S. XmenO iv l C hengchi Un. O. T 會. V. b a. 兩 S. 看. er. io. 麼. 以著X. O 國. y. Nat. Ok. hS. 兩. X. 兩. 時. 1963. ‧. X. i. 學. OW. 兩. 政 治 大. n. Marvel Studio. X. 新. 年. O. X. 愛. TkOZ. b. O. X. 兩. 之. nO. X. Rm. 兩. XV. 兩 O. W. O. X. 國 v. 3. o. 兩 V. c. 兩 r. 可 O. SV k. T. g. 2. k. O. 兩. O. Ou S. O. 兩 麼V. 1 看. hS. 年. Magneto O. 麼不們⼦. 41. 兩 兩.

(49) 能. 4-15. X⽽. g 能. X. 三. 2r32 O. 新. 新. h. X. 三. 20160325. O. O多. 之vmc lDC. Batman v Superman Dawn of Justice. 兩 O兩 i. 道. O 兩b. O. DC. 立. VS. O. logo兩. 之. a. io. f. hg 兩. n. 來 XO. 兩能. O. C來h. 來. O X兩. VS. g. 能. O O. al. bdc. XVS能 h. X. Nat. Bruce Wayne. X. 兩. ‧. cW. O. 政 治 大. 之 lV. 分. i. 學. O. S. 能. ‧ 國. X. o. X. 來 O. y. 讓. X. sit. XS. o. r. f能. er. O. g. Batman V Superman Dawn Of Justicea. Charles Roven兩. 能. 三. n engchi U. iv. S. ry. s. 道. w. W. 過. g. 兩 SDC. 之. X. l能. X. m 兩. 三. r. OR. O. SlT. yW p. T. X兩 R S. f. Ow. w. V. Or O. SDC. h兩. O. hvmW. r. oRS. 兩. DarkseidSDC 兩. 42. hO. 兩. T. p.

(50) g. 4-16. g. 新 h. Zootopia bdc. 種⼰兩. bdc. bdc. a. 上VJudy l O. 立. O. Vi. 都都. S. f. O. al. 兩. ni C h兩 engchi U O. S S. O. t. 兩. 美. V R. v. l. O ca. h. R. O. O最去. 兩. O. T. cO. X. 兩. v. b. g. yS. c. m. O. X. S c之. 43. O美. O R. a. O. X. b. 兩. 之. htZootopia. 兩. l 兩. 兩. yW. R. 之. X O美. bO. 兩. O. O. 最. i. V. R. X. 之 r. m. v. h. m. O. 之. 兩 o. yS. O. n. l. O⾃他. O. io. O. 更. ⾃他O更. Nat. T. 太. 種⼰. 更情O⾃他. ‧. XO. X. r. 政 治 大 O. y. O. d. 兩. 學. S. b. Ow. sit. W. t. l. 種⼰. ‧ 國. W R. e. Judy兩. W 兩. 20160226兩. er. ⾃他Nick. 新.

(51) g. 4-17. g hO. R o. wT23. V. 立O. 到O. 兩. 地. ‧ 國. S. O X. O. n. al. W. T. ef. n V. Z兩b. mfo. OXv Un. engchi. 們. d. S. 11. O r. O. 兩. iv. 之. 不. 你. W. ⾥. VNASA. yS. Ou. 兩. rc. O. O g. 7 兩 O. O. 兩. 地. Interstellar a. aO. Or. hc. h. w. g. Cfh. OX. W. s. ‧. X. io. V. a. V. VR. T. O. Nat. RgO. n. 政 治 大. dS. 兩. l. gOr. 兩. g. 們. 學. 兩. 沒. 兩. X. T. 兩. y. r. 還. 兩. sit. Or. 23. r. 兩l. er. r. 新. O O. 新. 給. g W. R. to SUR. 44. t兩. aUc.

(52) 4-18. g O成 t. 做. OBen. 活. aZ. S. O. 學. 今. R. S. lT. O. a. r. S. f. O. O. 種. 2015. 70. UR. 兩. v ni U e nOg c h i X種 V. 兩. O. Or. 200g 兩 活. 時. O70. X兩 O⽇Ra. O種. 兩dVV. T. 時. 20150925. 起 就和. 9. 2. r01. ⼈. 兩h 25. Sc. 兩. 感 9. 兩. w. y O. THE INTERNa 活. 的. O W. X. sit. S. Ch. Jules. Ben Whittaker. O. O. vs. er. al. n. O. Ben. 兩. 兩. 感. X兩. 是 S. io. 種. 政 治 大. vs. ‧. O. O. k. Nat. O. vs. O. 立. ‧ 國. O70. 時. w. vs. 學. 活. 時. ⼤博. vs. 兩 活. X. h. O 兩. O. O. 時兩. vs WR. 新. 新. T. 兩f. g. 們 The Interna 活. 25. 兩. 45. 時. 2015 起 就和.

(53) . V. g T. hO. O. 之. 之. 立. ‧ 國 ⽽. h. Ch. h之. 之 w. g. 之. g O. hO. 新. O新 g. 新. 之. 之. 三. 新. l 25.04%之 l 14.53%之 O. O 新. 之 h. 兩. 46. 之m. 新. l 21.98%之. 新. W. g. 之. 2.. 新. iv. 2 l 20.91%之. l 23.51%之. 之. n engchi U. l 21.19%兩. 新. v. y al. n. O. h. l 21.19%之新. O. 1.. S. ‧. n. h. 政 治 兩V 大. O. io. l. 新. T. Nat. v. O. WWA. 學. 新. 兩. w K-means. w. ⼼之 o. l. f. sit. O. hv. er. WR. 新. 新 新. 兩. h v. O O.

(54) . w裡. 新. 之. 之. K-means 之. o 兩. 之. ⽽. 立. ‧ 國. ‧. 之. h. O. io. 新. 新. n. al. 之. C. hengchi ySR. v O. W. O. y. Nat. h. 1.. 學. ⽽. n. 政 治 大. S. sit. dW. 之 w. O. er. O. 之. iv. 之V. O. Un 兩. Ov. v. cS. O. 兩. ⽽ V. 1.. a. 之 g. l 之. aO. W. O. m. ZO V. 2.. 裡. mcW. l 之. m 新. W. O. 之 O. 之. 新 之 S. v. 兩. r之S. O O O. O W. W avm. r. ⼥. 之. R 之 47. r之V rv.

(55) 之. 立. ZO. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat al. Ch. n engchi U. 48. iv. 兩.

(56) h 天. 點. 兩2014兩. i. 新. 兩h. 12知4⼜兩 兩2011兩i (TBI 2011)知4⼜ 立兩. 之. io. n. al. 兩. sit. 新. ⽽. 兩. 兩. h. b. er. i. 兩. 兩. y. 然. Nat. 兩2007兩. k. ‧. 兩2012兩. 政 治 大. 學. 動. ‧ 國. c. 新. Ch. n engchi U. 現兩2006兩. iv. i. FAQ. 兩. 13知2⼜之89-112兩 也 兩. 兩2006兩. Oh. 兩. 兩 真. 新. l. 兩 兩2005兩 b. 兩. 天兩2006兩. l. b l. k. i. 兩 k. i. 新. 兩. 兩. 兩 事. 兩2013兩. kO. V 49. i. 新. O.

(57) 新. O. 立. 兩. 兩. 政 治 大. 學. ‧. Nat. y. i. io. sit. 兩2004兩. n. al. er. 對. 19知2⼜兩. ‧ 國. 兩h. Ch. n engchi U. 50. iv. b. 兩.

(58) Sullivan, D. (2001). Document Warehousing and Text Mining. Wiley. Dalal, M.K. and Zaveri M.A. (2011). Heuristics based automatic text summarization of unstructured text. Proceedings of the International Conference & Workshop on Emerging Trends in Technology (ICWET 2011), Mumbai, India, February 25-26. Das, D. and Martins A.F. (2007). A survey on automatic text summarization. Literature Survey for the Language and Statistics II course at CMU, Vol. 4, pp. 192-195.. 立. 政 治 大. ‧ 國. 學. Gupta, V. and Lehal G.S. (2010). A survey of text summarization extractive techniques. Journal of Emerging Technologies in Web Intelligence, Vol. 2, No. 3, pp.. ‧. 258-268.. sit. y. Nat. er. al. n. 293, Cambridge: MIT press.. io. Mani, I. and Maybury M.T. (1999). Advances in Automatic Text Summarization. Vol.. Ch. n engchi U. iv. S. Deerwester, S. T. Dumais, G. W. Furnas, T. K. Landauer, and R. Harshman (1990). Indexing by latent semantic analysis. Journal of the American Society for Information Science, vol. 41, pp. 391-407. T. Hofmann (1999). Probabilistic latent semantic indexing. Proceedings of the 22nd annual international ACM SIGIR conference on Research and development in information retrieval, Berkeley, California, USA, 1999. Dempster, N. Laird, and D. Rubin (1977). Maximum likelihood from incomplete data via the EM algorithm. J. Royal Statistical Society, Series B, vol. 39, pp. 1-38, 1977. D. M. Blei, A. Y. Ng, and M. I. Jordan (2003). Latent dirichlet allocation. J. Mach. Learn. Res., vol. 3, pp. 993-1022. D. Newman, K. Hagedorn, C. Chemudugunta, and P. Smyth (2007). Subject metadata enrichment using statistical topic models. Proceedings of the 7th ACM/IEEE-CS joint conference on Digital libraries, Vancouver, BC, Canada. 51.

(59) J. Boyd-Graber, J. Chang, S. Gerrish, C. Wang, and D. Blei (2009). Reading tea leaves: how humans interpret topic models. Neural Information Processing Systems NIPS.. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat al. Ch. n engchi U. 52. iv.

(60)

參考文獻

相關文件

- Teachers can use assessment data more efficiently to examine student performance and to share information about learning progress with individual students and their

 With new ICE trains crossi ng Europe at speeds of up to 300 km/h, sound and vib ration levels in the trains ar e an important issue.  Hilliges/Mehrmann/Mehl(2 004) first

三、參加「大專校院社團評選」之社團,應於完成線上報名後,上傳核章後之 社團評選報名表(附件 1-1)、社團組織章程、社團簡介文字資料、校內 社團評選紀錄等

Shared readings: modeling comprehension, vocabulary, text structures, and text features for older readers, The Reading Teachers, Vol. Read

• You can make good use of this opportunity and become more aware of the importance of teaching information texts with an explicit emphasis on understanding the features of academic

• A simple look at a website can reveal many potential web accessibility issues for persons with disabilities.  Can the content be

3、 輸入文字(Input Text):所產生的文字框具固定寬度,可以讓

運用 Zuvio IRS 與台日比較文化觀點於日本文化相關課程之教學研究 Applying Zuvio IRS and Perspective on Cultural comparison between Taiwan and Japan to Teaching