第三章 研究方法與系統架構
3.2 文本資料前處理
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
9
第三章 研究方法與系統架構
3.1 研究流程架構
本篇論文的研究流程架構如圖 3.1 所示,本篇論文僅《周易》爻辭進行分 析,完成文本前處理將《周易》爻辭中的古字轉化成現代的楷體字,首先進行 基礎的詞頻分析,使用字詞頻率與 TFIDF 的技術配合統計學敘述分析的概念進 行分析,之後再利用共現網路的定義建構關聯網路,並將《易經》爻辭中,陰 陽六爻等階層資訊建構關聯網路的子網路,最後再使用社會網路分析方法對此 關聯網路及其各子網路進行分析。
圖3.1: 研究流程架構圖
3.2 文本資料前處理
《易經》是一套龐大的系統,包含符號系統、階層系統、時序系統等等,
《易經》透過描述人事物狀態的變易,表現出中國古典文化的哲學和宇宙觀,
《易經》每一卦六爻爻辭之中,俱備了三才,兩兩重疊,由八卦而演至八八六
十四卦。《易經》中總共三百八十四爻來代表陰陽柔剛變易的錯綜複雜現象。本
章節將對於易經的符號系統結構、爻位貴賤、爻辭時序性、爻位規則、爻辭常 見之重要名詞等依序進行介紹。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
3.2.1 《易經》符號系統結構
《易經》的內容以「卦」組成,共有六十四卦。每一卦由六畫組成,每一 畫稱為「爻」。如下圖 3.2 所示,每一個爻辭以一條長的橫線代表陽,稱為「陽 爻」;或以兩條斷開的橫線代表陰,稱為「陰爻」。從最底層數起,總共有六 爻,而六爻以不同的陰、陽配搭,形成六十四種不同的組合。
六爻可以分為上半部分和下半部分,而每一部分的三個「爻」以不同的 陰、陽配搭,形成多種不同的組合,稱為卦。如圖 3.2 所示,六爻由下而上分 別為:初、二、三、四、五、上,上方四、五、上三爻稱為「上卦」或「外 卦」,下方初、二、三為為「下卦」或「內卦」。
圖3.2: 易經符號系統架構
3.2.2 《易經》爻位貴賤
《繫辭傳》:「天尊地卑,乾坤定矣;卑高以陳,貴賤位矣;動靜有常,
剛柔斷矣;方以類聚,物以群分,吉凶生矣;在天成象,在地成形,變化見 矣」其語譯為,天在上而尊,地在下而卑,由於天地分,乾坤的性能就確定 了,地卑天尊的層次確定之後,卦爻由下至上的貴賤等次也就各居其位了。由 於乾動坤靜,各有其常性和規律,因此在卦爻中陽爻的剛性和陰爻的柔性,也 就判然區分清楚了。君子就義,小人背理,各以品性不同而聚合:牛入牛群,
羊入羊群,也各以種類不同而分別。因此,就善者,得善果:趨惡者,得惡
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
11
報,吉凶之途自別。所以在天上的日月星辰晦明等一切現象,在地下的山川草 木鳥獸等一切形態,其變化都呈現在眼前,顯露在卦爻之中。
3.2.3 《易經》爻辭時序性
王弼《周易略例》「明卦適變通爻」:「夫卦者,時也;爻者,適時之變者
也」。意思是說,卦講的是「時間」,而爻是順應時間而做改變的。爻的所處不同
位置,也代表不同的時機,不同時機也決定了吉凶。
3.2.4 爻辭與爻位規則條例
在《易經》中,爻辭的爻位有著許多的規則,如下列所示:
1.承乘,陰爻在陽爻之下稱為陰承陽,陽爻在陰爻之上稱為陽乘陰,這兩種情 況下的爻辭,理論上有著較為偏向吉的敘述,反之則有偏向凶的敘述。廣義上 距離二個以上的爻位也有承乘關係,但本篇論文只取用相鄰爻位之承乘關係,
其實際例子如下圖 3.3 與下圖 3.4 所示。
圖 3.3: 《易經》承乘關係示意圖之一
圖 3.4: 《易經》承乘關係示意圖之二
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
2.相應,一陰爻與一陽爻可以兩相交應,稱為「相應」,相應則多幫助。如果兩
對應爻辭皆為陰爻或陽爻,則不能交感,稱為「無應」,無應則任何事物少幫
助。如下圖 3.5 所示,初爻對應四爻,兩者皆為陰爻所以不應,二爻對應五 爻,兩者為一陰一陽所以相應。
圖 3.5: 《易經》相應關係示意圖
3.當位,如下圖 3.6 所示,一卦中之六個爻位,每個爻位分為陰位與陽位,以 初、三、五爻為陽位,二、四、上爻為陰位,如果爻象與爻位之陰陽相同,即 陽爻居陽位或陰爻居陰位,則稱此爻「當位」,反之則謂之為「不當位」。
圖 3.6: 《易經》當位關係示意圖
3.2.5 爻辭常見之重要名詞
元:開始或第一,美好之事物而居首位者。
亨:通達,做事通達無阻。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
13
利:不頓滯,有利,適當,合理。
貞:正,精誠,意志堅決,正確。
吉&凶:事物得之稱吉,失之稱兇
悔、吝:悔、吝居吉、凶之間,憂由悔生,故悔自凶趨吉,而慮自吝發,故吝 由吉向凶
无咎:沒有災難
有孚:有字為助詞,孚通常做誠信的意思 有攸往:意思為有所往,攸為助詞
‧
3.3.1 N-gram model
N-gram 模型,為一種文字探勘與自然語言處理常使用的技術,其最早的概
當N=1 時稱為 unigram,N=2 時稱為 bigram,N=3 時稱為 trigram,以此類推其 主要方法如下表3.1 所示。
3.3.2 TF-IDF(term frequency–inverse document frequency)
TF-IDF 為 TF 詞頻(Term Frequency)以及 IDF 逆向文件頻率(Inverse Document Frequency)所組成,其公式分別如下,在公式 3.1 中,𝑖代表一個字 詞,𝑗代表一個特定文件,𝑛𝑖,𝑗即該字詞𝑖在該文件𝑗中出現的次數,∑ 𝑛𝑘 𝑘,𝑗則表示