• 沒有找到結果。

應用社會網路分析於易經爻辭之文字特徵觀察 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "應用社會網路分析於易經爻辭之文字特徵觀察 - 政大學術集成"

Copied!
109
0
0

加載中.... (立即查看全文)

全文

(1)國立政治大學資訊科學系 Department of Computer Science National Chengchi University. 碩士論文 Master’s Thesis 政 治. 大. 立. ‧. ‧ 國. 學. 應用社會網路分析於易經爻辭之文字特徵觀察. y. Nat. er. io. sit. Application of Social Network Analysis. n. For Text a Characteristic Observation v. i l C n hen hi U On I-Ching Line g c Statements. 研 究 生:李俊澔 指導教授:劉吉軒. 中華民國一零五年七月 July 2016.

(2) 應用社會網路分析於易經爻辭之文字特徵觀察 Application of Social Network Analysis For Text Characteristic Observation On I-Ching Line Statements. 研 究 生:李俊澔. Student : Chun-Hao Lee. 指導教授:劉吉軒. Advisor : Jyi-Shane Liu. 立. 政 治 大. ‧ 國. 資訊科學系. 學. 國立政治大學. sit. io. A Thesis. er. Nat. y. ‧. 碩士論文. n. Submitted to a Department of Computer v Science. i l C n NationalhChengchi i U e n g c hUniversity. In partial fulfillment of the Requirements For the degree of Master In Computer Science. 中華民國一百零五年七月 July 2016.

(3) 摘要. 隨著資訊技術的進步,各種史料文本的數位化工作已經處理完成,運用資訊技 術於史料文本分析的研究日益增加。本研究以詞頻分析與社會網路分析為主 軸,對於古代《易經》爻辭的文字進行多元化的觀察,本研究首先以詞頻分析 探討《易經》爻辭字詞頻率的觀察,再利用《易經》爻辭位置資訊建構成各個 社會網路結構,對每個社會網路結構運算各項社會網路指標數據,最後將實驗 結果與過往《易經》爻辭的論點做印證與對照,期望對於《易經》爻辭之分. 政 治 大 向,也可供未來研究者對於其他古文研究作參考。 立. 析,有更多元性的客觀研究觀察。本研究提供了一個分析《易經》爻辭的新面. ‧ 國. 學. 關鍵詞:易經爻辭、詞頻分析、社會網路分析、資料分析。. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v.

(4) Abstract. With advances in information technology, digitization of various historical text has been completed.The study of historical text analysis by using information technology is increasing daily.In this paper, we used word frequency analysis and social network analysis in the I-Ching line statements.First, we used word frequency analysis in IChing line statements,using N-gram and TF-IDF technique analysis word frequency.Second, we constructed social network structure by I-Ching line statements posi-. 政 治 大 work.We compared our experiment 立 results with some existing I-Ching theory, expecttion information,calculating several social network analysis indicator on each net-. ‧ 國. 學. ing to get more objective results and more diverse analysis for the I-Ching line statements. We not only provided a new perspective to study I-Ching line statements but. ‧. also expected to help other researchers to study different historical text.. sit. y. Nat. al. n. Analysis, Data Analysis. er. io. Keywords: I Ching Line Statements, Word Frequency Analysis, Social Network. Ch. engchi. i n U. v.

(5) 目錄 第一章 緒論................................................................................................................... 1 1.1 研究背景 ........................................................................................................... 1 1.2 研究動機與目的 ............................................................................................... 2 1.3 研究資料 ........................................................................................................... 4 1.4 論文架構 ........................................................................................................... 5 第二章 文獻探討........................................................................................................... 6 2.1 文字探勘 (Text Mining) ................................................................................... 6 2.2 詞頻分析(word frequency analysis) ................................................................. 6. 治 政 2.4 網路文字分析(Network Text Analysis) ........................................................... 7 大 立 2.5 共現網路(Co-occurrence network analysis) ..................................................... 8 2.3 社會網路分析(Social Network Analysis) ........................................................ 7. ‧ 國. 學. 第三章 研究方法與系統架構....................................................................................... 9 3.1 研究流程架構 ................................................................................................... 9. ‧. 3.2 文本資料前處理 ............................................................................................... 9. y. Nat. 3.2.1 《易經》符號系統結構 .............................................................................. 10. io. sit. 3.2.2 《易經》爻位貴賤 ...................................................................................... 10. n. al. er. 3.2.3 《易經》爻辭時序性 .................................................................................. 11. i n U. v. 3.2.4 爻辭與爻位規則條例 .................................................................................. 11. Ch. engchi. 3.2.5 爻辭常見之重要名詞 .................................................................................. 12 3.3 詞頻分析 ......................................................................................................... 14 3.3.1 N-gram model .............................................................................................. 14 3.3.2 TF-IDF(term frequency–inverse document frequency) .......................... 14 3.4 共現網路關聯定義 ......................................................................................... 15 3.4.1 相鄰關係與標點符號分段定義關聯(relation) ........................................... 15 3.4.2 全關係與跨標點符號定義關聯(relation) ................................................... 16 3.5 社會網路分析 ................................................................................................. 16 第四章 實驗數據與結果............................................................................................. 20 4.1 詞頻分析 ......................................................................................................... 20 i.

(6) 4.1.1 1-gram 詞頻分析.......................................................................................... 20 4.1.2 1-gram TF-IDF ............................................................................................. 25 4.1.3 2-gram 詞頻分析.......................................................................................... 30 4.1.4 2-gram TF-IDF ............................................................................................. 35 4.2 社會網路分析 ................................................................................................. 39 4.2.1 連通子圖 ...................................................................................................... 39 4.2.2 社會網路分析 .............................................................................................. 59 第五章 結論與未來研究方向..................................................................................... 93 5.1 研究結論 ......................................................................................................... 93 5.2 未來研究方向 ................................................................................................. 94. 政 治 大. Reference..................................................................................................................... 96. 立. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. ii. i n U. v.

(7) 表目錄 表 3.1: N-gram 模型範例 ............................................................................................ 14 表 4.1: 1gram 詞頻分布所佔比例 ............................................................................. 21 表 4.2: 1gram 詞頻數量所佔比例 ............................................................................. 21 表 4.3: 四分位數範例 ................................................................................................ 23 表 4.4: 1gram 詞頻前二十名之六爻分布 ................................................................. 24 表 4.5: 1gram 詞頻前二十名字詞之詞類 ................................................................. 25 表 4.6: 1gram TF-IDF(6)分數前二十名 .................................................................... 27 表 4.7: 1gram TF-IDF(7)分數排名前二十名 ............................................................ 28 表 4.8: 1gram TF-IDF(6)分數排名前二十名字詞之詞類 ........................................ 28. 政 治 大. 表 4.9: 1gram TF-IDF(7)分數排名前二十名字詞之詞類 ........................................ 29. 立. 表 4.10: 2gram 詞頻分布所佔比例 ........................................................................... 31. ‧ 國. 學. 表 4.11: 2gram 詞頻數量所佔比例 ........................................................................... 32 表 4.12: 2gram 詞頻前二十名之六爻分布 ............................................................... 34. ‧. 表 4.13: 1gram 詞頻前二十名字詞之詞類 ............................................................... 34. y. Nat. 表 4.14: 2gram TF-IDF(6)分數排名前二十名 .......................................................... 36. io. sit. 表 4.15: 2gram TF-IDF(7)分數排名前二十名 .......................................................... 38. n. al. er. 表 4.16 2gram TF-IDF(6)分數排名前二十名字詞之詞類 ....................................... 38. i n U. v. 表 4.17 2gram TF-IDF(7)分數排名前二十名字詞之詞類 ....................................... 39. Ch. engchi. 表 4.18: 全爻辭連通子圖列表 .................................................................................. 40 表 4.19: 全爻爻辭其餘連通子圖字詞表 .................................................................. 42 表 4.20: 陰爻爻辭連通子圖列表 .............................................................................. 43 表 4.21: 陰爻爻辭其餘連通子圖字詞表 .................................................................. 44 表 4.22: 陽爻爻辭連通子圖列表 .............................................................................. 44 表 4.23: 陽爻爻辭其餘連通子圖(陽+陰&陽) .......................................................... 45 表 4.24: 陽爻爻辭其餘連通子圖(陰&陽+陰&陽) ................................................... 46 表 4.25: 初爻爻辭連通子圖列表 .............................................................................. 46 表 4.26: 初爻爻辭連通子圖字詞列表 ...................................................................... 48 表 4.27: 二爻爻辭連通子圖列表 .............................................................................. 48 iii.

(8) 表 4.28: 二爻爻辭連通子圖字詞列表 ...................................................................... 50 表 4.29: 三爻爻辭連通子圖列表 .............................................................................. 50 表 4.30: 三爻爻辭連通子圖字詞列表 ...................................................................... 51 表 4.31: 四爻爻辭連通子圖列表 .............................................................................. 52 表 4.32: 四爻爻辭連通子圖字詞列表 ...................................................................... 54 表 4.33: 五爻爻辭連通子圖列表 .............................................................................. 54 表 4.34: 五爻爻辭連通子圖字詞列表 ...................................................................... 56 表 4.35: 上爻爻辭連通子圖列表 .............................................................................. 57 表 4.36: 上爻爻辭連通子圖字詞列表 ...................................................................... 58 表 4.37: 全爻辭網路對比隨機網路 .......................................................................... 60. 政 治 大 表 4.39: 陽爻爻辭網路對比隨機網路 ...................................................................... 61 立 表 4.38: 陰爻爻辭網路對比隨機網路 ...................................................................... 60. ‧ 國. 學. 表 4.40: 初~三爻網路對比隨機網路 ........................................................................ 62 表 4.41: 四~上爻網路對比隨機網路 ........................................................................ 62. ‧. 表 4.42: 全爻辭與陰陽爻辭 weight degree 前十名 .................................................. 63 表 4.43: 全爻辭與陰爻陽爻 degree 前十名 .............................................................. 64. y. Nat. sit. 表 4.44: 全爻辭與陰爻陽爻 bet 前十名 .................................................................... 65. er. io. 表 4.45: 全爻辭與陰爻陽爻 clo 前十名 .................................................................... 66. al. v i n Ch 表 4.47: 全爻辭與陰爻陽爻字詞與其詞類 67 e n g.............................................................. chi U n. 表 4.46: 全爻辭與陰爻陽爻 eig 前十名 .................................................................... 67. 表 4.48: 六爻爻辭 wd 前十名 .................................................................................... 68 表 4.49: 六爻爻辭 deg 前十名 ................................................................................... 69 表 4.50: 六爻爻辭 deg 前十名 ................................................................................... 69 表 4.51: 六爻爻辭 bet 前十名 .................................................................................... 70 表 4.52: 六爻爻辭 bet 前十名 .................................................................................... 71 表 4.53: 六爻爻辭 clo 前十名 .................................................................................... 71 表 4.54: 六爻爻辭 clo 前十名 .................................................................................... 72 表 4.55: 六爻爻辭 eig 前十名 .................................................................................... 72 表 4.56: 六爻爻辭 eig 前十名 .................................................................................... 73 iv.

(9) 表 4.57: 六爻爻辭字詞與其詞類 .............................................................................. 74 表 4.58: 當應乘及不當不應不乘字詞 WD 前十名 .................................................. 74 表 4.59: 當應乘及不當不應不乘字詞 degree 前十名 .............................................. 75 表 4.60: 當應乘及不當不應不乘字詞 bet 前十名 .................................................... 76 表 4.61: 當應乘及不當不應不乘字詞 clo 前十名 .................................................... 76 表 4.62: 當應乘及不當不應不乘字詞 eig 前十名 .................................................... 77 表 4.63: 當應乘及不當不應不乘字詞與詞類 .......................................................... 78 表 4.64: 全關連網路其餘連通子圖字詞表 .............................................................. 78 表 4.65: 全爻辭與陰陽爻 WD 前十名 ...................................................................... 79 表 4.66: 全爻辭與陰陽爻 degree 前十名 .................................................................. 80. 政 治 大 表 4.68: 全爻辭與陰陽爻立 clo 前十名 ........................................................................ 81 表 4.67: 全爻辭與陰陽爻 bet 前十名 ........................................................................ 81. ‧ 國. 學. 表 4.69: 全爻辭與陰陽爻 eig 前十名 ........................................................................ 82 表 4.70: 六爻爻辭 wd 前十名 .................................................................................... 83. ‧. 表 4.71: 六爻爻辭 deg 前十名 ................................................................................... 83 表 4.72: 六爻爻辭 deg 前十名 ................................................................................... 84. y. Nat. sit. 表 4.73: 六爻爻辭 bet 前十名 .................................................................................... 84. er. io. 表 4.74: 六爻爻辭 bet 前十名 .................................................................................... 85. al. v i n Ch 表 4.76: 六爻爻辭 clo 前十名 .................................................................................... 86 engchi U n. 表 4.75: 六爻爻辭 clo 前十名 .................................................................................... 86. 表 4.77: 六爻爻辭 eig 前十名 .................................................................................... 87 表 4.78: 六爻爻辭 eig 前十名 .................................................................................... 87 表 4.79: 當應乘及不當不應不乘字詞 WD 前十名 .................................................. 88 表 4.80: 當應乘及不當不應不乘字詞 deg 前十名 ................................................... 89 表 4.81: 當應乘及不當不應不乘字詞 bet 前十名 .................................................... 89 表 4.82: 當應乘及不當不應不乘字詞 clo 前十名 .................................................... 90 表 4.83: 當應乘及不當不應不乘字詞 eig 前十名 .................................................... 90 表 4.84: 各子網路之 Core-Periphery ......................................................................... 92. v.

(10) 圖目錄 圖 1.1: 論文架構圖 ...................................................................................................... 5 圖 3.1: 研究流程架構圖 .............................................................................................. 9 圖 3.2: 易經符號系統架構 ........................................................................................ 10 圖 3.3: 《易經》承乘關係示意圖之一 .................................................................... 11 圖 3.4: 《易經》承乘關係示意圖之二 .................................................................... 11 圖 3.5: 《易經》相應關係示意圖 ............................................................................ 12 圖 3.6: 《易經》當位關係示意圖 ............................................................................ 12 圖 3.7: 相鄰關係與標點符號分段示意圖 ................................................................ 15. 政 治 大. 圖 3.8: 全關係與跨標點符號分段示意圖 ................................................................ 16. 立. 圖 4.1: 1gram 詞頻分布圖 ......................................................................................... 20. ‧ 國. 學. 圖 4.2: 1gram 詞頻與詞頻排名 ................................................................................. 22 圖 4.3: 1gram 詞頻與詞頻排名皆取對數 ................................................................. 22. ‧. 圖 4.4: 2gram 詞頻分布圖 ......................................................................................... 30. y. Nat. 圖 4.6: 2gram 詞頻與詞頻排名 ................................................................................. 32. sit. 圖 4.7: 2gram 詞頻與詞頻排名皆取對數 ................................................................. 32. n. al. er. io. 圖 4.8: 連通子圖範例 ................................................................................................ 40. i n U. v. 圖 4.9: 全爻辭中網路大小為 1 的連通子圖 ............................................................. 41. Ch. engchi. 圖 4.10: 全爻辭中網路大小為 2 的連通子圖 ........................................................... 41 圖 4.11: 全爻辭中網路大小為 3 的連通子圖 ........................................................... 42 圖 4.12: 陰爻爻辭中網路大小為 2 的連通子圖 .................................................... 43 圖 4.13: 陰爻爻辭中網路大小為 3 的連通子圖 ....................................................... 43 圖 4.14: 陽爻辭中網路大小為 1 的連通子圖 ........................................................... 44 圖 4.15: 陽爻辭中網路大小為 2 的連通子圖 ........................................................... 44 圖 4.16: 陽爻辭中網路大小為 3 的連通子圖 ........................................................... 45 圖 4.17: 初爻辭中網路大小為 2 的連通子圖 ........................................................... 46 圖 4.18: 初爻辭中網路大小為 3 的連通子圖 ........................................................... 47 圖 4.19: 初爻辭中網路大小為 5 的連通子圖 ........................................................... 47 vi.

(11) 圖 4.20: 初爻辭中網路大小為 7 的連通子圖 ........................................................... 47 圖 4.21: 二爻辭中網路大小為 2 的連通子圖 ........................................................... 48 圖 4.22: 二爻辭中網路大小為 3 的連通子圖 ........................................................... 49 圖 4.23: 二爻辭中網路大小為 4 的連通子圖 ........................................................... 49 圖 4.24: 三爻辭中網路大小為 2 的連通子圖 ........................................................... 50 圖 4.25: 三爻辭中網路大小為 3 的連通子圖 ........................................................... 50 圖 4.26: 三爻辭中網路大小為 4 的連通子圖 ........................................................... 51 圖 4.27: 三爻辭中網路大小為 7 的連通子圖 ........................................................... 51 圖 4.28: 四爻辭中網路大小為 1 的連通子圖 ........................................................... 52 圖 4.29: 四爻辭中網路大小為 2 的連通子圖 ........................................................... 52. 政 治 大 圖 4.31: 四爻辭中網路大小為 立 4 的連通子圖...........................................................53 圖 4.30: 四爻辭中網路大小為 3 的連通子圖 ........................................................... 53. ‧ 國. 學. 圖 4.32: 四爻辭中網路大小為 5 的連通子圖 ........................................................... 53 圖 4.33: 五爻辭中網路大小為 2 的連通子圖 ........................................................... 55. ‧. 圖 4.34: 五爻辭中網路大小為 3 的連通子圖 ........................................................... 55 圖 4.35: 五爻辭中網路大小為 4 的連通子圖 ........................................................... 56. y. Nat. sit. 圖 4.36: 五爻辭中網路大小為 6 的連通子圖 ........................................................... 56. er. io. 圖 4.37: 上爻辭中網路大小為 2 的連通子圖 ........................................................... 57. al. v i n Ch 圖 4.39: 上爻辭中網路大小為 4 的連通子圖 58 e n g c........................................................... hi U n. 圖 4.38: 上爻辭中網路大小為 3 的連通子圖 ........................................................... 57. 圖 4.40: degree 分布圖 ............................................................................................... 59 圖 4.41: 《易經》爻辭詞類 ....................................................................................... 94. vii.

(12) 第一章. 緒論. 1.1 研究背景 近年來,由於資訊科技及網際網路的發達,許多過去只存在於紙本的書 籍、文本、史料被數位化。舉例來說,臺灣歷史數位圖書館[1]收錄臺灣相關史 料的全文資料庫,包括「淡新檔案」、「明清臺灣行政檔案」與「古契書」三 文獻集。中國哲學書電子化計劃[2]將中國的古代哲學書及其相關的原典文獻加 以電子化,用交叉索引等技術,給中外的學者提供更方便的方式來學習和研究 這些古書。由於眾多文本數位化的工作趨近完成,運用現代資訊技術於文本的 分析與研究也越來越多,過往對於文本的傳統研究,局限於研究者主觀理解文. 政 治 大. 本全文大意後,透過參考史料當代的時空背景,各時代對於該史料的解釋文. 立. 本,猜測揣摩原始作者想表達的思想,利用人文的角度分析與解釋史料文本所. ‧ 國. 學. 想要表達的義涵。如今,不同於以往的傳統研究,史料文本在數位化後,許多 過往需耗時日久才能得出的結論,或是超越人類計算能力所能及的範圍,在資. ‧. 訊分析技術的協助下,研究者可以更快速更深入的探索史料文本,發掘出許多 史料文本新的層面與意涵[3]。近年來有眾多資訊技術被研究者所運用,例如,. y. Nat. sit. 資訊檢索(Information Retrieval)可以在數位化文件或資料庫中進行搜尋,其技術. n. al. er. io. 可以依照使用者需求,提供使用者各種型態資訊快速查詢的方法以及查詢的過. i n U. v. 程[4]。資料探勘(Data Mining) 可以從大量的資料中自動搜尋隱藏於其中有著特. Ch. engchi. 殊關聯性的資訊,使得史料文本中人物或事件間隱藏的樣式被發掘[5]。 適用於史料文本的技術有許多方向,由於史料文本通常包含著大量的文字 與語言,所以許多研究者運用詞頻分析的技術在史料文本上[6],但如同《周易 繫辭傳》中的一句話「書不盡言,言不盡意」,書是記錄語言的,但有時不能 把所要說的語言全無遺漏的記錄下來,語言文字是表達思想的,但語言文字有 其一定的侷限性,有時不能把思想完全無遺漏的表達出來。由於文字與語言存 在此種侷限性,使得詞頻統計的方法有時無法適用於所有史料文本,無法深入 探討史料文本中隱藏的義涵,此時研究的面向可以換一個角度切入,使用共現 網路[7]與社會網路分析[8]等技術進行研究。. 1.

(13) 社會網路分析原先是使用於社會學領域的分析方法,社會學家們利用它從 社會網路的角度出發,透過定義節點與節點之間的關係,基於關係的一種模式 或規則反映了社會結構,再透過社會結構的量化分析解釋一些社會學、經濟 學、管理學等領域問題,在許多領域被廣泛應用。而將共現網路與社會網路分 析的技術應用在史料文本的分析上時,希望可以打破文字與語言的侷限性,透 過上述兩種技術的結合,將史料文本建構成網路,使文本中的文字定義為結 點,文字與文字間的關係定義為聯結,利用史料文本中特有的結構關係形成網 路結構,分析此網路結構中的資訊以補充語言、文字之不足,進而找出史料文 本中隱含的意義[9]。. 1.2 研究動機與目的. 治 政 大 《易經》是中國最古老的文獻之一,並被古文家尊為「五經」之首,是歷 立 代思想家投注大量心力所深入研究探討的一部經書。歷代對於《周易》的研 ‧ 國. 學. 究,隨著社會發展與文化思想演變,經歷不同的歷史階段,由於《周易》文字 艱澀精簡的特性,歷代學者對其解釋有著許多不同的版本。舉例來說,張善文. ‧. 的《歷代易學要籍解題》[10]中所收錄之先秦至當代的易學研究書籍,即有五. sit. y. Nat. 百多種。這些著作不盡相同,但每個著作都有著其作者的一套解釋理論能夠闡. io. er. 述其觀點,使得許多論點眾說紛紜無統一根據,而且過往的研究者也少有從科 學化的角度去解釋《易經》。. n. al. Ch. i n U. v. 《易經》的主要特色在於,不包含乾坤兩卦之用爻爻辭,《易經》爻辭總. engchi. 共三百八十四爻,其字數僅為 3446 字,而人生所有可能的情況,大概都包含在 內。在《易經》中,一個卦辭或是一個爻辭,通常是運用一些事物的狀態作為 象徵,但每一個卦辭或是爻辭所代表的事物卻又不盡相同,所以無法單就單一 卦辭或爻辭的代表事物來判斷,使之無法全面性的分析。為了詮釋《易經》所 要傳達的意涵,過往社會人文研究者提出了許多方法,例如從《易經》卦爻辭 中的關鍵字詞演繹出《易傳》的義理[11]、《易經》爻位的「當」、「應」等 資訊構成《易經》思維的重要成分[12]、《易經》中不同卦爻辭共同出現所隱 含的資訊[13]。. 2.

(14) 本篇論文,主要為利用上述人文研究者所提出的研究方向,基於上述研究 者的論點,使用科學化的技術與數據做更進一步的研究,目的希望基於上述研 究者的論點從新的方向探討《易經》。 在過往的史料文本研究中,資料檢索、資料探勘、詞頻統計等技術,確實 能有效地提供社會人文學者一個新的方向協助探勘文本中富含的資訊[14],但 由於《易經》爻辭之文字為文言文所組成,其文字具有精簡艱澀的特性,再加 上《易經》爻辭中富有陰陽爻位等資訊,使得上述所說之技術,並不足夠完整 分析《易經》爻辭中的所有資訊。本篇論文的研究方法,除了單純看《易經》 爻辭的文字資訊以外,需要將《易經》爻辭中的字詞數量、陰陽爻位、字詞共 現等等資訊,運用於建構社會網路結構,對此社會網路結構進行各式社會網路. 政 治 大 技術做分析探討。將社會網路分析之結果與過往研究者所提出的《易經》爻辭 立 指標運算,試圖透過社會網路指標各項量化的數據資料,使用科學化的角度與. ‧ 國. 學. 思想論點做對照,希望透過各項量化數據,能夠客觀的對於《易經》爻辭思想 論點做詮釋,希望利用社會網路分析技術與其分析結果能幫助所有研究者對. ‧. 《易經》有著近一步的探索與發現。. 除此之外,本篇論文利用《易經》爻辭當中的階層架構資訊將文字建構成. y. Nat. sit. 共現網路,並對其進行社會網路分析,試圖透過此種方法提供一種新的思維,. er. io. 希望可以讓《易經》之外的史料文本利用其特有的架構資訊建構成社會網路,. al. n. v i n Ch 訊特性做設計,使得過往只使用社會人文角度分析的史料文本,可以運用科學 engchi U. 利用社會網路分析技術做新面向的研究。針對每個史料文本的獨特階層架構資. 化的觀點與量化的數據進行分析與驗證並試圖得到新的詮釋。. 本篇論文試圖透過社會網路分析的方法,讓眾多艱澀難懂的古文與現代科 學接軌,讓古文得以再知識化與再意義化,過往研究者從古文中發掘出許多創 新的觀點與思維,本篇論文希望能再次幫助研究者說明或挖掘出這些古文中背 後的隱藏義涵,更能將這些史料文本的意義世界呈現於研究者的眼前,作為日 後研究者進一步研究史料文本的基礎。. 3.

(15) 1.3 研究資料 本篇論文之《易經》爻辭原文來自於《中國哲學書電子化計劃》《周易》 [2],《周易》相關之背景介紹與理論架構參考自多本《周易》書[15][16][17]。 普遍認為《周易》最初原是上古卜筮的紀錄,但到了商、周之際,經過文 王的整理和注述,把它由卜筮的範圍,進入人文文化的學術領域,周文王創作 後天八卦,其後周公、孔子,根據伏羲畫卦及周文王之前所記錄的符號文字 等,加以解說歸納著作,經過孔子的研究和傳述,散爲諸子百家學術思想的源 泉。 《周易》,包括《易經》與《易傳》。《易傳》亦稱為《十翼》,其中包括. 政 治 大. 〈彖傳〉、〈象傳〉、〈繫辭傳〉、〈說卦傳〉、〈序卦傳〉、〈雜卦傳〉及〈文言傳〉 等文章典籍,用來解釋《易經》的道理,全篇總共 28403 字,是理解《易經》. 立. 經文的重要根據。. ‧ 國. 學. 「傳」是用來對「經」的注釋。古人說的《周易》,常把「易傳」也涵括在 內。相傳為孔子所作,但也有學者認為是集體創作。. ‧. 《十翼》包括有:. sit. y. Nat. 〈彖傳〉上下兩篇:「彖」是「斷」的意思,主要用來論斷六十四卦卦名、卦辭. io. er. 的文字,分析六十四卦中,每一個卦的總體概念及其意義。. 〈象傳〉上下兩篇: 象傳中的象詞分為兩種,總論一卦的象,稱為「大象」。每. al. n. v i n 一卦六爻爻辭後面分論這六爻的象,稱為「小象」 。 Ch engchi U 〈繫辭傳〉上下兩篇: 《易經》的整體概論,用以闡述《易經》的哲學意義。. 〈說卦傳〉一篇: 解釋組成六十四卦的八個經卦所代表的意義,以及八卦相重的 由來。 〈序卦傳〉一篇: 解釋六十四卦的發展規律性,說明六十四卦次序和排列的理 由。 〈雜卦傳〉一篇:以相類或相反的關係,作兩兩相耦的對比來解釋六十四卦的卦 名。 〈文言傳〉一篇:詳細解說乾卦和坤卦。可能是後世易學家的見解所輯錄而成。 以上七個部份,共有十篇,稱為《十翼》。翼是「助」的意思,表示易學起 4.

(16) 飛的十隻翅膀。 本篇論文主要在於分析《易經》爻辭之文字特徵,故本篇論文只取用《周 易》六十四卦中的爻辭做為研究資料,將對於《易經》爻辭做社會網路分析後 與易經通論作對照與分析,故研究資料不包含《易經》《十翼》等其餘內容。. 1.4 論文架構 本研究論文的架構如圖 1.1 所示;第一章為摘要、研究背景、研究動機與目 的、論文架構;第二章為文獻探討,主要分為文字分析與社會網路分析這兩個 領域做介紹,文字分析的領域將對文字探勘、詞頻分析這兩各項技術作背景介 紹與討論,社會網路分析的部分將先講述最初用於人與人間社會關係的社會網. 治 政 大 介紹與探討;第三章的內容為本研究的實驗方法以及本研究的共現網路定義架 立 構做介紹;第四章則為實驗結果與探討,實驗結果包含詞頻分析、TFIDF、各 路分析,之後再對於社會網路分析用於文字的應用層面做概述,做相關文獻的. ‧ 國. 學. 式子網路的各項社會網路指標計算等,再利用這些數據進行分析探討;第五章 則為結論,針對第四章所運算之實驗結果做最終的結論與敘述未來研究方向。. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. 圖 1.1: 論文架構圖 5. i n U. v.

(17) 第二章. 文獻探討. 2.1 文字探勘 (Text Mining) 世界上的所有資訊分為非結構化資料與結構化資料,而非結構化的資佔了 決大多數[18],而這非結構化的資料大部分是保存於文字的型態,對於文字的 研究深遠複雜多如繁星,但就學術研究的面向來說主要分為三種領域,語言 學、資訊科學、社會科學,語言學著重於文字的文法結構與語意表達,資訊科 學著重於自動化的文字分析與工具,社會科學著重於利用書面或口頭形式的文 字分析人類行為與文字影響力間的關係[19]。 在 資 訊 科 學 的 領 域 中 , 最 熱 門 最 常 使 用 的 技 術 之 一 為 文 字 探 勘(Text. 政 治 大. Mining),文字探勘不同於資料探勘需要結構化的資料,它的原始輸入資料可以. 立. 沒有任何規則、長短不一,舉凡像是新聞報導、社群網路的文章或留言、人與. ‧ 國. 學. 人間的聊天資料、歌詞、書本等等,日常生活中的所有文章或是句子,文字探 勘的技術都可以從其中試圖發掘出可觀、極具潛力的資訊[18]。. ‧ sit. y. Nat. 2.2 詞頻分析(word frequency analysis). io. er. 在文字探勘的領域中包含著許多其它相關領域,像是機器學習(machine learning)、自然語言處理(natural language processing)、資訊檢索 (information re-. n. al. Ch. i n U. v. trieval)、知識管理(knowledge management)[18],而近幾年由於數位人文的發展. engchi. [3],研究者們也利用資訊科學的技術對文本做不同於以往的分析,其中最常使 用 N-gram 與詞頻統計來對一個文本做初期的統計分析以供後續研究[20],而適 用於此種方法的文本種類也非常廣泛,從 Twitter 的 tweet 資料[21]到中國古典 的紅樓夢小說[14],只要將文字利用 N-gram 拆解成單詞,都可以利用詞頻來做 統計分析。 n-gram 屬於計算機語言學與機率論的概念,此技術初期被廣泛使用於拼字 檢查校正(spelling correction )、語音識別(speech recognition )、機器翻譯 (machine translation)等等領域,而後該技術在自然語言處理 (natural language process, NLP)領域應用於詞語分類(text classification )[22]、分詞(Word Segmentation)等方面,是一個重要的語言模型(language model)[23]。 6.

(18) 經過 n-gram 斷詞後,常使用 TF-IDF 用於資訊檢索與文本挖掘做為加權技 術。TF-IDF 用以評估一字詞對於一個文件集或一個語料庫中的其中一份文件的 重要程度。字詞的重要性隨著它在文件中出現的次數成正比增加,但同時會隨 著它在語料庫中出現的頻率成反比下降。 如果某個詞或短語在一篇文章中出現的頻率 TF 高,並且在其他文章中很少 出現,則認為此詞或者短語具有很好的類別區分能力,因此,TF-IDF 傾向於過 濾掉常見的詞語,保留重要的詞語。舉例來說想找出文件中的關鍵詞,就可以 利用計算特定文件中每個詞的 TF-IDF 值,接著找出該值最高的若干個詞,來 做為該文件的關鍵詞。像是處理新聞或專利文件時,我們想要快速的知道某段 文字的「特徵」,我們可以用少數幾個關鍵詞來表示。這時,TF-IDF 就可以派. 政 治 大. 上用場,幫助我們以自動的方式,計算出每一份文件的代表關鍵詞[24] [25]。. 立. 2.3 社會網路分析(Social Network Analysis). ‧ 國. 學. 社會網路分析最初用來探討人與人之間的社會網路結構,將人表示為節 點,人與人之間的關係表示為連結,將節點與連結建構成一個社會網路模型,. ‧. 藉由分析社會網路模型的各項數據,來探討出人與人之間社會網路的資訊,而. sit. y. Nat. 隨著網際網路快速的發展,各種適用於社會網路分析的資料越趨廣泛,近年許. io. er. 多領域都利用社會網路分析的方法來做為新的研究方向,有關於社會網路的研 究甚至成指數性成長[26],研究者們利用社會網路分析中的各項指標[27, 28]探. n. al. Ch. 討出已往尚未發掘的新知識。. engchi. i n U. v. 2.4 網路文字分析(Network Text Analysis) 隨著文字分析領域與社會網路分析領域兩者的發展,研究者們嘗試融合兩 者 的 特 點 , 進 而 產 生 了 一 種 新 面 向 的 領 域-網 路 文 字 分 析(Network text analysis)[29] [30]。每個文字或字詞或拆分的字詞形成網路中的節點,文字或字 詞間的關聯形成網路中的邊,將文字的資料轉化為網路資料。網路文字分析領 域其所探討的意義為,字詞間的語意聯結代表著語意的概念,所有語意的聯結 將構成一個語意的網絡,字詞結點在網絡中的位置也富含著資訊價值,透過對 此網路運用網路分析的理論進行運算,可以找出主要的節點或是群體,從而分 7.

(19) 析出文字資料想要表達的主要概念。例如用在訪談內容、新聞文章中找出其關 鍵字詞[31],用在小說書本中找出其主要表達主題[32, 33],但偏重在對整體網 路做統計學方向分析以取主要概念。. 2.5 共現網路(Co-occurrence network analysis) 在語言學領域面向的文字研究當中,文字共同出現的現象與意義也是許多 研究者探討的焦點[34],任何文字資料可以透過自然語言處理的方法切割成字 詞,研究者可以依照研究需求,自行定義字詞形成共現的定義,建構出研究所 需之共現網路。舉例來說,研究者可以定義兩個字詞共同出現在同一句子為共 現關係或是兩個字詞共同出現在同一段落為共現關係,將字詞形成節點,字詞. 治 政 大 量化數據的分析。近年來,共現網路分析被應用在許多類形的資料中,像是選 立 舉文章[35]、新聞文章[36]、中國詩詞[37]、中文期刊標題[38]、期刊摘要[39] 、 共現的定義形成邊,建構出一個共現網路,就可以對此共現網路進行各項網路. ‧ 國. 學. 網路標籤[40]等等。. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. 8. i n U. v.

(20) 第三章. 研究方法與系統架構. 3.1 研究流程架構 本篇論文的研究流程架構如圖 3.1 所示,本篇論文僅《周易》爻辭進行分 析,完成文本前處理將《周易》爻辭中的古字轉化成現代的楷體字,首先進行 基礎的詞頻分析,使用字詞頻率與 TFIDF 的技術配合統計學敘述分析的概念進 行分析,之後再利用共現網路的定義建構關聯網路,並將《易經》爻辭中,陰 陽六爻等階層資訊建構關聯網路的子網路,最後再使用社會網路分析方法對此 關聯網路及其各子網路進行分析。. 政 治 大. 立. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. i n U. 圖 3.1: 研究流程架構圖. Ch. engchi. v. 3.2 文本資料前處理 《易經》是一套龐大的系統,包含符號系統、階層系統、時序系統等等, 《易經》透過描述人事物狀態的變易,表現出中國古典文化的哲學和宇宙觀, 《易經》每一卦六爻爻辭之中,俱備了三才,兩兩重疊,由八卦而演至八八六 十四卦。《易經》中總共三百八十四爻來代表陰陽柔剛變易的錯綜複雜現象。本 章節將對於易經的符號系統結構、爻位貴賤、爻辭時序性、爻位規則、爻辭常 見之重要名詞等依序進行介紹。. 9.

(21) 3.2.1 《易經》符號系統結構 《易經》的內容以「卦」組成,共有六十四卦。每一卦由六畫組成,每一 畫稱為「爻」。如下圖 3.2 所示,每一個爻辭以一條長的橫線代表陽,稱為「陽 爻」;或以兩條斷開的橫線代表陰,稱為「陰爻」。從最底層數起,總共有六 爻,而六爻以不同的陰、陽配搭,形成六十四種不同的組合。 六爻可以分為上半部分和下半部分,而每一部分的三個「爻」以不同的 陰、陽配搭,形成多種不同的組合,稱為卦。如圖 3.2 所示,六爻由下而上分 別為:初、二、三、四、五、上,上方四、五、上三爻稱為「上卦」或「外 卦」 ,下方初、二、三為為「下卦」或「內卦」。. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. i n U. v. 圖 3.2: 易經符號系統架構. engchi. 3.2.2 《易經》爻位貴賤 《繫辭傳》:「天尊地卑,乾坤定矣;卑高以陳,貴賤位矣;動靜有常, 剛柔斷矣;方以類聚,物以群分,吉凶生矣;在天成象,在地成形,變化見 矣」其語譯為,天在上而尊,地在下而卑,由於天地分,乾坤的性能就確定 了,地卑天尊的層次確定之後,卦爻由下至上的貴賤等次也就各居其位了。由 於乾動坤靜,各有其常性和規律,因此在卦爻中陽爻的剛性和陰爻的柔性,也 就判然區分清楚了。君子就義,小人背理,各以品性不同而聚合:牛入牛群, 羊入羊群,也各以種類不同而分別。因此,就善者,得善果:趨惡者,得惡 10.

(22) 報,吉凶之途自別。所以在天上的日月星辰晦明等一切現象,在地下的山川草 木鳥獸等一切形態,其變化都呈現在眼前,顯露在卦爻之中。. 3.2.3 《易經》爻辭時序性 王弼《周易略例》「明卦適變通爻」:「夫卦者,時也;爻者,適時之變者 也」 。意思是說,卦講的是「時間」,而爻是順應時間而做改變的。爻的所處不同 位置,也代表不同的時機,不同時機也決定了吉凶。. 3.2.4 爻辭與爻位規則條例 在《易經》中,爻辭的爻位有著許多的規則,如下列所示:. 政 治 大. 1.承乘,陰爻在陽爻之下稱為陰承陽,陽爻在陰爻之上稱為陽乘陰,這兩種情. 立. 況下的爻辭,理論上有著較為偏向吉的敘述,反之則有偏向凶的敘述。廣義上. ‧ 國. 學. 距離二個以上的爻位也有承乘關係,但本篇論文只取用相鄰爻位之承乘關係, 其實際例子如下圖 3.3 與下圖 3.4 所示。. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 3.3: 《易經》承乘關係示意圖之一. 圖 3.4: 《易經》承乘關係示意圖之二 11.

(23) 2.相應,一陰爻與一陽爻可以兩相交應,稱為「相應」,相應則多幫助。如果兩 對應爻辭皆為陰爻或陽爻,則不能交感,稱為「無應」,無應則任何事物少幫 助。如下圖 3.5 所示,初爻對應四爻,兩者皆為陰爻所以不應,二爻對應五 爻,兩者為一陰一陽所以相應。. 立. 政 治 大. 圖 3.5: 《易經》相應關係示意圖. ‧ 國. 學. 3.當位,如下圖 3.6 所示,一卦中之六個爻位,每個爻位分為陰位與陽位,以. ‧. 初、三、五爻為陽位,二、四、上爻為陰位,如果爻象與爻位之陰陽相同,即 陽爻居陽位或陰爻居陰位,則稱此爻「當位」,反之則謂之為「不當位」。. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 3.6: 《易經》當位關係示意圖. 3.2.5 爻辭常見之重要名詞 元:開始或第一,美好之事物而居首位者。 亨:通達,做事通達無阻。 12.

(24) 利:不頓滯,有利,適當,合理。 貞:正,精誠,意志堅決,正確。 吉&凶:事物得之稱吉,失之稱兇 悔、吝:悔、吝居吉、凶之間,憂由悔生,故悔自凶趨吉,而慮自吝發,故吝 由吉向凶 无咎:沒有災難 有孚:有字為助詞,孚通常做誠信的意思 有攸往:意思為有所往,攸為助詞. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 13. i n U. v.

(25) 3.3 詞頻分析 3.3.1 N-gram model N-gram 模型,為一種文字探勘與自然語言處理常使用的技術,其最早的概 念為,在文本的一段語句當中,第 N 個字詞的出現的機率只與其前面 N-1 個詞 相關,爾後此技術被廣泛用於資料壓縮、生物序列等領域,而在自然語言處理 中,最常利用 N-gram 模型做一個文本的自動斷詞與分類,使用 N-gram 將文本 斷詞後的每個字詞,就可以拿來進行後續的統計與分析。本篇論文則利用 Ngram 進行自動斷詞,做詞頻分析與 TFIDF 之實驗。當給定文本中的一個語句, 當 N=1 時稱為 unigram,N=2 時稱為 bigram,N=3 時稱為 trigram,以此類推其 主要方法如下表 3.1 所示。. 立. 政 治 大. ‧ 國. 學. 見龍在田,利見大人. N=1 見、龍、在、田、利、見、大、人. ‧. N=2 見龍、龍在、在田、田利、利見、見大、大人. y. Nat. er. io. al. 表 3.1: N-gram 模型範例. sit. N=3 見龍在、龍在田、在田利、田利見、利見大、見大人. n. v i n 3.3.2 TF-IDF(term frequency–inverse document frequency) Ch engchi U. TF-IDF 為 TF 詞頻(Term Frequency)以及 IDF 逆向文件頻率(Inverse. Document Frequency)所組成,其公式分別如下,在公式 3.1 中,𝑖代表一個字 詞,𝑗代表一個特定文件,𝑛𝑖,𝑗 即該字詞𝑖在該文件𝑗中出現的次數,∑𝑘 𝑛𝑘,𝑗 則表示 該文件𝑗中所有字詞出現次數的總和,將𝑛𝑖,𝑗 除以∑𝑘 𝑛𝑘,𝑗 即為該字詞在該文件中 的 TF 詞頻 𝑡𝑓𝑖,𝑗 =. 𝑛𝑖,𝑗 ∑𝑘 𝑛𝑘,𝑗. 公式 3.1: TF 公式. 14.

(26) 在公式 3.2 中,𝐷為所有文件的總數,𝑖為一個字詞,|{𝑗: 𝑡𝑖 ∈ 𝑑𝑗 }|代表包含字詞𝑡𝑖 的文件數目,將兩者相除取對數,即得該字詞 IDF 逆向文件頻率。. idf𝑖 = 𝑙𝑜𝑔. |𝐷| |{𝑗: 𝑡𝑖 ∈ 𝑑𝑗 }|. 公式 3.2: IDF 公式. 最後,在將 TF 與 IDF 兩者相乘,求得公式 3.3 之 TF-IDF。 𝑡𝑓𝑖𝑑𝑓𝑖,𝑗 = 𝑡𝑓𝑖,𝑗 × 𝑖𝑑𝑓𝑖. 立. 治 政 公式 3.3: TF-IDF 公式大. ‧ 國. 學. 3.4 共現網路關聯定義. ‧. 《易經》中爻辭的字詞段落分為兩種,一種為最初的易經古文,無任何標 點符號分段,一種為後代譯者依據語意解釋加上標點符號,而為了將這些字詞. y. Nat. n. a. i n U. 3.4.1 相鄰關係與標點符號分段定義關聯(relation) l. Ch. engchi. er. io. 義。. sit. 建構成共現網路架構,就必須分別依照兩種字詞段落定義出共現網路關聯的定. v. 如下圖 3.7 所示,由於標點符號為後代譯者依據語意解釋加上,如果依造標 點符號分段,定義關聯時可以保留較完整的字詞語意,不會造成跨標點所形成 之無語意字詞連結。而字詞與字詞間的關聯,是依據字詞與字詞兩兩相鄰的關 係所建立,雖然相鄰的關係還是會建立出少數無語意字詞連結,但大部分可以 保留較完整的字詞語意。舉例來說,在下圖 3.7 中建立的字詞關聯分別為王 假、假有、有家、勿恤、吉(斷占)等字詞關聯。. 圖 3.7: 相鄰關係與標點符號分段示意圖. 15.

(27) 3.4.2 全關係與跨標點符號定義關聯(relation) 《易經》古文最初無標點符號,後代譯者自行依據語意解釋加上標點符 號,如此可能會造成不同的語意解釋,故版本不同有不同的標點符號分段,所 以依照爻辭整句跨標點符號建立字詞間的關聯。而字詞與字詞間的關聯,是依 據字詞與字詞兩兩全連結的關係所建立,如此一來,雖然無法保留字詞原始的 語意,產生許多無語意的字詞關聯,但這些字詞關聯卻保了字詞在同一爻辭 中,所有字詞組合共同出現的資訊,透過這些資訊,可以分析所有字詞組合在 不同爻辭中共同出現的特殊情況。舉例來說,在下圖 3.8 中建立的字詞關聯分 別為王假、王有、王家、王勿、王恤、王吉、假有、假家、假勿、假恤、假 吉、有家、有勿、有恤、有吉、家勿、家恤、家吉、勿恤、勿吉、恤吉等字詞 關聯。. 學 ‧. ‧ 國. 立. 政 治 大. sit er. io. 3.5 社會網路分析. y. Nat. 圖 3.8: 全關係與跨標點符號分段示意圖. al. n. v i n Ch 社會網路分析主要對網路結構的資料,進行各種角度的分析,皆下來將介 engchi U 紹本篇研究所使用的各項社會網路分析指標的介紹與公式: 社會網絡直徑(Diameter),在一個相連網路中,一個節點可以透過不同的路 徑連結到另一個節點,其數量最短的路徑稱為最短路徑長度(geodesic distance),而一個網路中任意節點連結到任意節點所需的最小最短路徑長度, 稱為社會網絡直徑(Diameter),通常這個數值越小,表示這個網路中的連結越緊 密。 平均路徑長(Average Path Length), 𝐺為一網路,𝑣𝑖 , 𝑣𝑗為網路中任意兩點,𝑛 為網路中節點個數,平均路徑長數值越小,代表網路中任兩節點之平均距離越 短,代表著資訊能在網路中迅速傳播,其公式如下:. 16.

(28) 𝑙𝐺 =. 1 ∑ d(𝑣𝑖 , 𝑣𝑗) 𝑛 × (𝑛 − 1) 𝑖≠𝑗. 公式 3.4: 平均路徑長公式. 群聚係數(Clustering Coefficient),有一節點𝑣𝑗 的鄰居(neighbourhood) 𝑁𝑖 定義 如下公式,代表著節點𝑣𝑗 透過邊相連的其他點稱為其鄰居 𝑁𝑖 = {𝑣𝑗 : 𝑒𝑖𝑗 ∈ 𝐸 ∪ 𝑒𝑖𝑗 ∈ 𝐸} 公式 3.5: 鄰居定義. 治 政 而點𝑣 的群聚係數𝐶 ,為點𝑣 之鄰居個數𝑁 之兩倍除以鄰居間個數的最大可能, 大 立 其公式如下: 𝑖. 𝑗. 𝐶𝑖 =. 𝑖. 2 |{𝑒𝑗𝑘 : 𝑣𝑗 , 𝑣𝑘 ∈ 𝑁𝑖 , 𝑒𝑗𝑘 ∈ 𝐸}|. 學. 𝑘𝑖 (𝑘𝑖 − 1). ‧. ‧ 國. y. Nat. 公式 3.6: 點之群聚係數公式. sit. 𝑗. n. al. er. io. 而一個網路之群聚係數 C,為網路中每個點的群聚係數之平均,其公式如下:. Ch. e n1g 𝑛c h i. C=. 𝑛. i n U. v. ∑ 𝑐𝑖 𝑖=1. 公式 3.7: 網路之群聚係數公式. 群聚係數,代表網路中一個節點的鄰居節點間也有連結,形成三角形結 構,群聚係數數值越高,三角形結構越多,代表著網路的結構性越高。. Betweenness Centrality(中間中心性),是計算有多少的最短路徑經過此節 點,路徑(Path)是指兩個不相鄰節點經由其他節點所連結之路徑,若一節點處於 17.

(29) 許多其他兩點之間的最短路徑上,可以認為該節點居於重要地位,因為他具有 控制其他兩個節點之間的交往能力,它測量的是節點對資源掌控的程度。一個 節點在網路中占據這樣的位置越多,就越代表它具有很高的中間中心性,就有 越多的節點需要通過它才能發生連結。給一點𝑣,其中間中心性為通過點𝑣的所 有最短路徑數之和,𝜎(𝑠, 𝑡)代表𝑠, 𝑡兩點間的最短路徑,𝜎(𝑠, 𝑡|𝑣) 代表𝑠, 𝑡兩點間 有通過點𝑣的最短路徑,其公式如下:. 𝐶𝐵 (𝑣) = ∑. 𝜎(𝑠, 𝑡|𝑣) 𝜎(𝑠, 𝑡). 𝑠,𝑡∈𝑉. 政 治 大. 公式 3.8: 中間中心性公式. 立. Closeness Centrality(接近中心性)則是以 closeness 或 distance 當作參考的依. ‧ 國. 學. 據,其想法是利用一個節點到網路中其他任意節點,兩點之間的最短路徑. ‧. (Geodesics)的距離總合,𝑑(𝑣, 𝑢)為通過點𝑣, 𝑢的最短路徑,n為網路中節點個 數,其公式如下:. io. sit. y. n−1 𝑛−1. ∑ 𝑣=1𝑑(𝑣, 𝑢). n. al. Ch. i n U. 公式 3.9: 接近中心性公式. engchi. er. Nat. 𝐶(𝑣) =. v. 如果一個點通過比較短的路徑與許多其他點相連,我們就說該點具有較高 的接近中心性。對一個社會網路來說,接近中心性越高,表明網路中節點的差 異性越小,反之,則表明網路中節點間的差異越大。. Eigenvector Centrality(特徵向量中心性)會給予每個節點一個相對分數,而 分數的算法是依照各節點是否與分數高的節點互相連結而定,其公式如下, M(v)代表節點 v 的鄰居所構成之集合,𝜆為 Eigenvector 計算方程式 Ax = 𝜆x 中的 𝜆。. 18.

(30) 𝑥𝑣 =. 1 𝜆. ∑ 𝑥𝑡 𝑡∈𝑀(𝑣). 公式 3.10: Eigenvector Centrality 公式 Core-Periphery Structures 為一種找出網路主要群體的分法[41],此方法可 以將網路中的節點分成核心群體(Core)與周邊群體(Periphery),其主要概念是核 心群體彼此間有著緊密的連結,而核心群體與周邊群體的連結數較少,周邊群 體與周邊群體間連結最為稀疏。. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 19. i n U. v.

(31) 第四章 實驗數據與結果 4.1 詞頻分析 本章節將前處理過後的《易經》爻辭,運用自然語言處理中的N-gram 方法 進行詞頻分析。 《易經》當中總共 64 卦,每卦含 6 條爻辭,全部總數包含爻辭 384 條,但卻僅用 3446 字就描述完畢,平均每條爻辭不到十個字,可見《易 經》爻辭所使用的文字精簡艱澀程度,而《易經》每句爻辭中每個字詞多為一 個字或兩個字所組成,故將N-gram 的參數N設定為N=1 與N=2 進行分詞, 分別進行詞頻統計分析。. 4.1.1 1-gram 詞頻分析. 政 治 大. 立. 將《易經》爻辭共 3446 字進行 1-gram 運算後,總共有 746 個相異的 1-. ‧ 國. 學. gram 字詞,其所有字詞的詞頻分布圖如圖 4.1 所示,其詞頻分布圖呈現冪次定 律(power law),將其詞頻數據呈現於下表 4.1,表中分別代表詞頻排名比例、相. ‧. 異字詞之個數、詞頻總和數、佔總詞頻比例。. n. al. er. io. sit. y. Nat. 160. 詞頻. 120. 80. Ch. engchi. i n U. v. 40. 0. 字詞. 圖 4.1: 1gram 詞頻分布圖 詞頻排名比例(%). 相異字詞. 詞頻總和數. 佔總詞頻比例(%). Top 5. 37. 1602. 46. Top 10. 75. 1944. 56. 20.

(32) Top 20. 150. 2382. 69. Bottom 80. 597. 1064. 31. 表 4.1: 1gram 詞頻分布所佔比例. 如表 4.1 所示,詞頻排名比例前百分之二十之字詞,共有 150 個相異字詞,其 詞頻總和數共 2382 字,平均每個字詞出現 16 次,佔總詞頻的百分之六十九。 而詞頻排名比例後百分之八十之字詞,共有 597 個相異字詞,其詞頻總和數共 1064 字,平均每個字詞只出現一到兩次。如此數據顯示出《易經》爻辭 1-gram 詞頻之特性,如下表 4.2 所示,《易經》爻辭 1-gram 字詞頻率大於等於五次的相 異字詞僅為 166 個字,但其詞頻總合數含有 2462 次,佔了總詞頻比例的百分之. 政 治 大. 七十一,而字詞頻率小於三次的相異字詞有 529 個字詞,詞頻總合數含有 615. 立. 次,僅佔了總詞頻比例的百分之十八。由表 4.1 及表 4.2 數據可知, 《易經》爻. ‧ 國. 學. 辭文字的特性為小部分相異字詞重複出現,其相異字詞數少但佔總詞頻比例 高,而大部分相異字詞只出現一到兩次,其相異字詞數多但占總詞頻比例偏. y. sit. Nat. 詞頻總和數 2462. >=4. a l 166 C 202 h. >=3. 277. 2831. 82. <3. 529. 615. 18. n. >=5. io. 相異字詞. U e n g c h i2606. er. 詞頻. ‧. 低。. v ni. 佔總詞頻比例(%) 71 76. 表 4.2: 1gram 詞頻數量所佔比例. 將字詞出現的頻率與它在頻率表裡的排名做排列,觀察其是否符合齊夫定 律所述,在自然語言的語料庫裡,一個單詞出現的頻率與它在頻率表裡的排名 成反比。如圖 4.2 及圖 4.3 所示,《易經》爻辭之 1gram 詞頻符合齊夫定律,試 圖推論其成因為何,可以發現在一般自然語言語料庫中,字數多為數萬數十萬 字以上,而《易經》爻辭字數僅為 3446 字,但在《易經》爻辭中相異字有 746 21.

(33) 個,此種相異字數與總字數差異不大的情況下,平均每個字詞只出現四到五 次,字詞頻率與排名分布均勻,導致雖然《易經》爻辭與一般自然語言之語料 庫總字數差異甚大,但《易經》爻辭卻仍然符合齊夫定律。. 160. 80. 40. 0. 0.750. 0.000 0.000. 800. ‧ y. sit. al. n. 詞頻(log). 600. 圖 4.2: 1gram 詞頻與詞頻排名. io. 1.500. 400. 詞頻排名. Nat. 2.250. 立. 學. 3.000. 200. ‧ 國. 0. 政 治 大. er. 詞頻. 120. 0.750. Ch. engchi. 1.500. 2.250. i n U. v. 3.000. 3.750. 詞頻排名(log). 圖 4.3: 1gram 詞頻與詞頻排名皆取對數. 觀察完 1gram 詞頻整體分布圖後,本研究選取在六爻爻辭中,分別詞頻排 名前二十名之字詞,並通過取四分位數的方式,將一個字詞在初爻至上爻中, 詞頻次數較為極端的情況挑選出來。四分位數的公式如公式 4.1 所示,其中𝑁代 表數列總數,𝑖代表第𝑖個四分位數,𝑄𝑖 的值代表此四分位數落於數列第幾個數。. 22.

(34) 𝑄𝑖 =. 𝑖(𝑁 + 1) 4. 公式 4.1 四分位數公式. 如果𝑄𝑖 求出的值不為整數,則需對數列中最接近𝑄𝑖 的左右兩數進行內差 法求得𝑄𝑖 。如下表 4.3 所例,Q1 為數列由小到大排序的第 1.75 個數,因為不為 整數,所以將第一位置及第二位置的數做內差法,即求得 Q1 等於二十二,為 求得第一四分位數及第三四分位數後,將小於第一四分位數 Q1 的數值標為綠 色,將大於第三四分位數 Q3 的數值標為紅色。. 吉. 20. 29. 位置. 0. 三. 立. 1. 政 四 治 五大. 上. Q1. Q3. 17.5. 26.75. 6. 19. 31. 17. 2. 3. 4. 表 4.3: 四分位數範例. 5. ‧. ‧ 國. 二. 學. 初. Nat. sit. y. 《周易繫辭下傳》第九章中解釋第二爻居卿、大夫之位,得內卦之中而有. er. io. 應於君王,故多獲美譽。四爻居諸侯之位,以其居位逼近於君王,故多有惕. al. v i n Ch 故多有凶災。五爻居天子之位,得外卦之中而高居尊位,故多有功績。在下表 engchi U n. 懼。三爻居三公之位,為上下卦交接變動之位,襄贊諸侯與君王,疲於奔命,. 4.4 中,觀察字詞頻率前二十名之字詞分別在六個爻辭中的詞頻分布,將字詞的 詞頻分布與繫辭傳中內容對照可以發現,吉、不、貞、利此四個字詞在二爻 時,詞頻次數高於二爻第三四分位數而被標為紅色,代表此四個字詞出現於第 二爻的次數高於其他字詞,呈現了第二爻多獲美譽的現象。咎、孚、如三個字 詞在第四爻標為紅色,能說明第四爻无咎詞頻次數較高,對應於四爻多有惕懼 之現象。無、凶、悔、厲等字詞在第三爻被標為紅色,吉、有、孚等字詞在第 三爻標記為綠色,呈現出三爻多有凶災此現象。吉、有、貞、孚、大等字詞在 第五爻被標為紅色,呈現出五爻多有功績此現象。. 23.

(35) 頻率. 初. 二. 三. 四. 五. 上. Q1. Q3. 無. 145. 27. 16. 27. 25. 21. 28. 22. 27. 吉. 123. 20. 29. 6. 19. 31. 17. 17.5. 26.75. 其. 101. 13. 18. 22. 14. 13. 21. 13.25. 20.25. 咎. 92. 25. 11. 13. 20. 10. 13. 11.5. 18.25. 有. 92. 18. 10. 14. 14. 20. 16. 14. 17.5. 不. 77. 9. 17. 14. 8. 13. 16. 10. 15.5. 貞. 76. 10. 17. 9. 10. 15.25. 于. 74. 11. 立12. 19. 10.25. 12.75. 之. 73. 19. 8.25. 15.25. 利. 61. 凶. 53. 用. 48. 人. 43. 孚. 34. 6. 4. 悔. 33. 3. 3. 7. 大. 32. 3. 4. 往. 32. 11. 如. 31. 子 厲. 政13 治10 大16 13 10 9. 13. 16. 7. 12. 10. 12. 9. 5. 10. 14. 9.25. 11.5. 9. 6. 13. 4. 3. ‧. 學. 6. 4.5. 12. Nat. ‧ 國. 字詞. 8. 10. 6. 4. 10. 6.5. 10. al7. 13. 1. 8. v ni. 8. 6.25. 8. 4. 4. 6. 6. 9. 5. 3.5. 6.75. 6. 5. 9. 5. 4.25. 5.75. 3. 6. 5. 4. 3. 3.25. 5.75. 2. 5. 5. 10. 6. 3. 3.5. 5.75. 30. 6. 4. 8. 1. 7. 4. 4. 6.75. 26. 4. 1. 10. 3. 4. 4. 3.25. 4. y. sit. io. n. Ch. er. 10 6. 18. e3n g c h6 i U 11. 表 4.4: 1gram 詞頻前二十名之六爻分布 24.

(36) 1gram 詞頻前二十名字詞之詞類如下表 4.5 所示,可以發現詞頻前二十名之 字詞,多為斷占詞,少部分為其、于、之、用、往、如等狀態字詞,而人事物 的字詞僅有人、大、子等三個字詞。如此詞類數據結果,快速驗證了《易經》 最初原本就是上古卜筮學術的概念,可以清楚的看出來《易經》大部分的字詞 主要使用於斷占與狀態的形容。 字詞 頻率. 詞類. 字詞. 頻率. 詞類. 無. 145. 斷占. 凶. 53. 斷占. 吉. 123. 斷占. 用. 48. 狀態. 其. 101. 狀態. 人. 43. 咎. 92. 治 政 大 斷占 孚 34. 人事物. 有. 92. 斷占. 悔. 33. 不. 77. 斷占. 大. 32. 人事物. 貞. 76. 斷占. 往. 32. 狀態. Nat. 74. 狀態. 如. 31. 狀態. 狀態. 子. 30. 厲. i n 26 U. 73. al. n 利. 61. Ch. 斷占. engchi. y. sit. 人事物. er. io. 之. ‧. 于. 斷占. 學. ‧ 國. 立. 斷占. v. 斷占. 表 4.5: 1gram 詞頻前二十名字詞之詞類. 4.1.2 1-gram TF-IDF 要計算 TF-IDF,需要先設定整個文本中,文件頻率的範圍為何,因為本篇 論文著重於《易經》中六個爻辭位置的分析,故將文件頻率的範圍訂定為六個 爻辭。計算出每個字詞的頻率與逆向文件頻率的乘積,求得 TFIDF 值。現列出 TFIDF 分數前二十名之字詞,如下表 4.6 所示,分別列出字詞、該字詞的詞 頻、文件頻率的範圍、其 TF 值、IDF 值及 TF-IDF 值,將總詞頻排名前二十名. 25.

(37) 之字詞與 TF-IDF 分數排名前二十名之字詞做對比,將並未出現於總詞頻排名前 二十名之字詞用粗體表示。 由於《易經》爻辭中,有一個獨特的第七爻辭”用爻”,此爻辭在全部爻辭 中僅出現二次,由於此特殊第七爻辭,故除了計算文件頻率範圍為六爻的 TFIDF 外,另外計算 TF-IDF 文件頻率範圍為七爻的數據,如下表 4.7 所示。. 字詞 詞頻 範圍. TF. IDF. TFIDF. 趾. 6. 1. 0.0017 0.7782 0.001355. 征. 17. 4. 0.0049 0.1761 0.000869. 國. 6. 2. 立6. 2. 0.0017 0.4771 0.000831. 學. ‧ 國. 血. 政0.0017治0.4771大0.000831. 4. 0.0046 0.1761 0.000818. 天. 8. 3. 0.0023 0.3010 0.000699. 且. 5. 2. 0.0015 0.4771 0.000692. 先. 5. 2. 0.0015 0.4771 0.000692. 夬. a5l. 2. 0.0015 0.4771 0.000692. n. er. io. sit. y. ‧. 16. Nat. 攸. Ch. i n U. i e 0.0009 n g c h0.7782. v. 反. 3. 1. 戒. 3. 1. 0.0009 0.7782 0.000677. 茅. 3. 1. 0.0009 0.7782 0.000677. 後. 7. 3. 0.0020 0.3010 0.000611. 朋. 7. 3. 0.0020 0.3010 0.000611. 中. 11. 4. 0.0032 0.1761 0.000562. 嗟. 4. 2. 0.0012 0.4771 0.000554. 26. 0.000677.

(38) 富. 4. 2. 0.0012 0.4771 0.000554. 高. 4. 2. 0.0012 0.4771 0.000554. 從. 6. 3. 0.0017 0.3010 0.000524. 濡. 6. 3. 0.0017 0.3010 0.000524. 表 4.6: 1gram TF-IDF(6)分數前二十名. TF. IDF. TFIDF. 101. 咎. 92. 立6. 有. 92. 6. 0.026698 0.0669468 0.0017873. 不. 77. 6. 0.022345 0.0669468 0.0014959. 趾. 6. 1. 0.001741 0.845098 0.0014714. 于. io. 6. 0.021474 0.0669468 0.0014376. 政 治 大 0.026698 0.0669468 0.0017873. y. sit. er. n. al. 0.029309 0.0669468 0.0019622. ‧. 74. 6. 學. Nat. 其. ‧ 國. 字詞 詞頻 範圍. v i n 6C h0.021184 0.0669468 e n g c h i U 0.0014182. 之. 73. 征. 17. 4. 0.004933 0.243038. 攸. 16. 4. 0.004643 0.243038 0.0011284. 凶. 53. 6. 0.01538 0.0669468 0.0010297. 國. 6. 2. 0.001741 0.544068 0.0009473. 血. 6. 2. 0.001741 0.544068 0.0009473. 用. 48. 6. 0.013929 0.0669468 0.0009325 27. 0.001199.

(39) 天. 8. 3. 0.002322 0.3679768 0.0008543. 人. 43. 6. 0.012478 0.0669468 0.0008354. 且. 5. 2. 0.001451 0.544068 0.0007894. 先. 5. 2. 0.001451 0.544068 0.0007894. 夬. 5. 2. 0.001451 0.544068 0.0007894. 中. 11. 4. 0.003192 0.243038 0.0007758. 後. 7. 3. 0.002031治 0.3679768 0.0007475 政 大. 立. 字詞 頻率. 詞類. 字詞. 頻率. 學. 詞類. 人事物. 戒. 3. 人事物. 17. 人事物. 茅. 3. 人事物. 國. 6. 人事物. 後. 7. 狀態. 人事物. Ch. 朋. 7. i n U. v人事物. n. al. sit er. 征. y. 6. io. 趾. Nat. ‧. ‧ 國. 表 4.7: 1gram TF-IDF(7)分數排名前二十名. 血. 6. 攸. 16. 狀態. 中. 11. 狀態. 天. 8. 人事物. 嗟. 4. 狀態. 且. 5. 狀態. 富. 4. 狀態. 先. 5. 狀態. 高. 4. 狀態. 夬. 5. 狀態. 從. 6. 狀態. 反. 3. 狀態. 濡. 6. 狀態. engchi. 表 4.8: 1gram TF-IDF(6)分數排名前二十名字詞之詞類. 28.

(40) 字詞 頻率. 詞類. 字詞. 頻率. 詞類. 其. 101. 狀態. 國. 6. 人事物. 咎. 92. 斷占. 血. 6. 人事物. 有. 92. 斷占. 用. 48. 狀態. 不. 77. 斷占. 天. 8. 人事物. 趾. 6. 人事物. 人. 43. 人事物. 于. 74. 狀態. 且. 5. 狀態. 之. 73. 征. 17. 攸. 16. 狀態. 中. 11. 凶. 53. 斷占. 後. 7. 狀態 狀態 狀態. 學. 狀態. ‧. ‧ 國. 立. 5 政 先治 大 人事物 夬 5 狀態. 表 4.9: 1gram TF-IDF(7)分數排名前二十名字詞之詞類. sit. y. Nat. io. er. 當 IDF 文件頻率的範圍為六個爻辭的情況下,其 TFIDF 分數如表 4.6 所. al. 示,從數據中可以發現,TF-IDF 分數排名前二十名之字詞,其詞頻都不高,僅. n. v i n Ch 有三個字詞頻率高於十次,這三個字詞的範圍皆為四個爻辭,而其餘十七個字 engchi U 詞的範圍落於一到三個爻辭。將 TFIDF 分數排名前二十名與總詞頻排名前二十 名的字詞做比對,也發現無一字詞相同,可以根據數據推測出其成因,因為詞 頻較高的字詞,皆出現於六個爻辭範圍當中,在 IDF 範圍為六的情況下,IDF 的數值為零,導致 TF-IDF 分數皆為零,故 TF-IDF 分數排名前二十名與總詞頻 排名前二十名的字詞無一字詞相同,而其餘字詞由於 IDF 範圍在一到三個情況 下,IDF 的數值很高,導致詞頻數小於十次的字詞也有著很高的 TF-IDF 分數。 而在 IDF 文件頻率的範圍為七個爻辭的情況下,如表 4.7 所示,TFIDF 分數 排名前二十名與總詞頻排名前二十名相同的字詞分別為:趾、征、攸、國、血、 天、且、先、夬、中、後,可以發現,這些字詞詞頻為六到十七,範圍為一到 四個爻辭,跟其他字詞相比,皆為詞頻很低但範圍很小的情況。 29.

(41) 觀察表 4.8 及表 4.9 之字詞詞類,可以從中發現,在文件頻率的範圍為六個 爻辭及七個爻辭的情況下,TF-IDF 排名前二十名之字詞,斷占詞與狀態詞皆為 頻率高且文件頻率範圍大的字詞,而人事物之字詞皆為頻率低且文件頻率範圍 小的字詞,如此之結果符合《易經》爻辭之詞類特性,但從 TF-IDF 技術的面向 來做觀察,無法找出具有特殊詞類特性之字詞。 TF-IDF 分數的算法為 TF 值與 IDF 值之乘積,其概念為顯示出詞頻數高但 文件頻率範圍小的字詞,代表其字詞獨特性很高。但由前述之實驗數據中可以 發現,由於《易經》爻辭中的字詞,詞頻數高的字詞,其出現的文件頻率範圍 也大,詞頻數低的字詞,其出現的文件頻率範圍也小,如此一來,造成 TF-IDF 分數出現很大的雜訊,無法利用 TF-IDF 分數來判斷出字詞的獨特性,並找出關. 政 治 大 的概念進行分析,需要更多因素的考量。 立. 鍵字詞,可以推論出由於《易經》爻辭文字的特性,使其無法單純利用 TF-IDF. ‧ 國. 學. 4.1.3 2-gram 詞頻分析. ‧. 將《易經》爻辭進行 2-gram 運算後,總共有 2501 個不同的 2-gram 字詞,. sit. y. Nat. 其所有字詞的詞頻分布圖如下圖 4.4 所示,其詞頻分布圖呈現冪次現象,將其. io. er. 詞頻數據呈現於下表 4.10,表中分別代表詞頻排名比例、相異字詞之個數、詞 頻總和數、佔總詞頻比例。. n. al. 90. Ch. engchi. i n U. 詞頻. 68 45 23 0. 字詞. 圖 4.4: 2gram 詞頻分布圖. 30. v.

(42) 詞頻排名比例(%) 相異字詞 詞頻總和數 佔總詞頻比例(%) Top 5. 125. 757. 22. Top 10. 250. 1025. 30. Top 20. 500. 1438. 42. Bottom 80. 2001. 2001. 58. 表 4.10: 2gram 詞頻分布所佔比例. 治 政 字詞,其詞頻總和數共 757 字,平均每個字詞出現大 6 次,佔總詞頻的百分之二 立 十二。詞頻排名比例前百分之十與前百分之二十之字詞,平均每個字詞出現 4. 觀察表 4.10 可以發現,詞頻排名比例前百分之五之字詞,共有 125 個相異. ‧ 國. 學. 次與 5 次,佔總詞頻比例百分之三十與百分之四十二。詞頻排名比例前百分之 二十的字詞,平均每個字詞出現 4~6 次,佔了總詞頻百分之四十二,而詞頻排. ‧. 名比例後百分之八十字詞,每個字詞皆只出現 1 次,佔了總詞頻百分之五十. sit. y. Nat. 八。而觀察下表 4.11 之詞頻數量所佔比例,更明確凸顯《易經》爻辭在 2gram. io. er. 下的字詞組成結構,詞頻大於 11 的字詞只有 10 個,但其佔了總詞頻百分之 七,詞頻大於 2 的字詞有 413 個,其佔總詞頻百分之三十九,而詞頻為 1 之. n. al. i n U. 2gram 字詞,有 2088 個,佔了總詞頻百分之六十一。. Ch. engchi. v. 由上述兩段結果可以觀察出,2gram 字詞與 1gram 有著相似的字詞組成結 構,一樣為小部分相異字詞重複出現,其相異字詞數少但佔總詞頻比例高,而 大部分相異字詞只出現一到兩次,但 2gram 字詞與 1gram 字詞相比,此種情況 更為顯著,2gram 字詞中有著大量的相異字詞只出現一次。 詞頻 相異字詞 詞頻總和數 佔總詞頻比例(%) >=11. 10. 239. 7. >=4. 80. 622. 18. >=3. 143. 811. 24. 31.

(43) >=2. 413. 1351. 39. =1. 2088. 2088. 61. 表 4.11: 2gram 詞頻數量所佔比例 觀察下圖 4.6 及圖 4.7,可以發現《易經》爻辭之 2gram 詞頻與詞頻排名分 布圖與圖 4.2 及圖 4.3 之 1gram 詞頻與詞頻排名分布圖非常相似,而其經過驗 算,也符合齊夫定律之公式。 90. 45 23. 立. 0. ‧ 國. 194 387 580 773 966 1159135215451738193121242317. 圖 4.6: 2gram 詞頻與詞頻排名. ‧ y. sit. io. al. n. 詞頻(log). 詞頻排名. Nat. 2.5 2. 1.5 1. 0.5 0.. 學. 1. 政 治 大. er. 詞頻. 68. 0.. Ch. engchi. 1.. i n U. 2.. v. 3.. 4.. 詞頻排名(log) 圖 4.7: 2gram 詞頻與詞頻排名皆取對數. 下表 4.12,為 2gram 詞頻前二十名之六爻分布,從表中可以發現許多 2gram 字詞之現象,例如:无咎在初爻及四爻詞頻比例較高,貞吉在二爻及五 爻詞頻比例較高,君子、小人、無攸等字詞在三爻及上爻詞頻比例較高。 每個 字詞在六爻中頻率的多寡顯示出此字詞的分布特性,而在每個爻當中不同字詞 32.

(44) 的分布特性也顯示此爻的主要特性屬於哪類字詞,可以大略從字詞的吉凶好壞 等屬性,描述一個爻辭的屬性。此外,无咎、貞吉、君子、小人、無攸等字詞 在六爻的分布特性,可以印證出《易經》爻辭中,初、四;二、五;三、上為 三組相對應位置的兩爻之說法。 字詞. 頻率. 初. 二. 三. 四. 五. 上. Q1. Q3. 22. 11. 11. 19. 9. 13. 11. 17.5. 貞吉. 31. 5. 10. 1. 6. 7. 2. 2.75. 6.75. 有孚. 21. 4. 1. 2. 3. 7. 4. 2.25. 4. 悔亡. 18. 2. 1. 1.25. 4.5. 吉無. 17. 立2. 1 6 5 政3 治 大. 4. 2. 3.75. 16. 3. 0. 5. 1. 3. 4. 1.5. 3.75. 15. 0. 4. 0. 2. 4. 5. 0.5. 4. 13. 0. 3. 0. 2. 4. 4. 0.5. 3.75. 12. 2. 1. 0. 2. 5. 2. 1.25. 2. 3. 3. 0. 2. 2. v. 1. 1.25. 2.75. e1 n g 3c h i 1. 1. 3. 1. 2.5. io. y. n. al. er. 元吉. 2. Nat. 無不. 3. ‧. 不利. 0. 學. 君子. 6. sit. 85. ‧ 國. 无咎. i n U. 利用. 11. 小人. 10. 1. 終吉. 10. 2. 1. 3. 1. 1. 2. 1. 2. 貞凶. 10. 2. 1. 1. 1. 2. 3. 1. 2. 勿用. 9. 2. 0. 4. 1. 0. 2. 0.25. 2. 征凶. 9. 1. 3. 2. 0. 0. 3. 0.25. 2.75. 無攸. 9. 1. 1. 4. 0. 0. 3. 0.25. 2.5. 吉有. 9. 3. 0. 0. 3. 3. 0. 0. 3. Ch. 33.

(45) 入于. 8. 2. 0. 3. 1. 0. 2. 0.25. 2. 貞厲. 8. 0. 0. 4. 1. 2. 1. 0.25. 1.75. 攸利. 8. 1. 0. 4. 0. 0. 3. 0. 2.5. 以其. 7. 3. 0. 0. 1. 2. 1. 0.25. 1.75. 表 4.12: 2gram 詞頻前二十名之六爻分布. 2gram 詞頻前二十名字詞之詞類如下表 4.13 所示。可以看出 1gram 與 2gram 詞頻大部分的字詞主要使用於斷占與狀態的形容,在 2gram 中此種現象. 政 治 大. 更為明顯,代表人事物僅有君子、小人兩個字詞,而這兩個字詞也可以引伸為 斷占詞的一種。. 立. 詞類. 字詞. 頻率. 詞類. 學. ‧ 國. 字詞 頻率. 斷占. 小人. 10. 人事物. 貞吉. 31. 斷占. 終吉. 10. 斷占. 有孚. 21. 斷占. 貞凶. 10. 斷占. 悔亡. 18. 斷占. 勿用. 9. 斷占. 吉無. al. 斷占. 征凶. 9. 君子. 16. 人事物 無 攸. 9. 斷占. 不利. 15. 斷占. 吉有. 9. 斷占. 無不. 13. 斷占. 入于. 8. 狀態. 元吉. 12. 斷占. 貞厲. 8. 斷占. 利用. 11. 狀態. 攸利. 8. 斷占. n. Ch. engchi. y. sit. er. io. 17. ‧. 85. Nat. 无咎. i v斷占 n U. 表 4.13: 1gram 詞頻前二十名字詞之詞類. 34.

參考文獻

相關文件

Chow (Eds.), Changing classroom and changing schools: Study of good practices in using ICT in Hong Kong schools(pp. Hong Kong: Centre for Information Technology in School

ix If more than one computer room is opened, please add up the opening hours for each room per week. duties may include planning of IT infrastructure, procurement of

Provide all public sector schools with Wi-Fi coverage to enhance learning through the use of mobile computing devices, in preparation for the launch of the fourth IT in

Centre for Learning Sciences and Technologies (CLST) The Chinese University of Hong Kong..

The research data are collected by questionnaire survey and analysed in electors’ opinion with political party of candidate, application of information technology media,

Thus, this study plans to design one refuge to meet the actual needs of Taoshan Village by using the technology if Building Information Modeling, which can provide perfect

With the advancement in information technology and personal digital mobile device upgrade, RFID technology is also increasingly common use of the situation, but for

“Examiningthe Technology Acceptance Model Using Physician Acceptance of Telemedicine Technology”, Journal of Management Information System,(16(2),p91-112 (1999).