3.3 系統架構
3.3.2 N ETWORK M ODULE
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
33
所顯示的 2-mode 網路型態下的 Simrank 演算法。
依序取得 Prediction Network 中所有人物與 Seed Person Set 中各人物的相似度 計算結果之後,最後將由 Prediction List Module 負責執行系統最後的運作階段,職 務接替人選推薦列表的建置。在此階段中,將藉由三種不同的統計分析方式:相似度累 加機制、權重化相似度累加機制以及投票機制,同時產生三種接替人選的推薦列表。
透過系統三階段的運作流程,取得最後的職務接替人選推薦列表之後,即可藉由人 事異動資料庫中該職務的實際接替人選,來檢驗系統的整體預測效果,並可進一步進行 分析每一職務的接任人選受到歷任人物職務歷程的影響程度。在以下各小節中,我們將 陸續針對 Network Module、Simrank Algorithm Module 以及 Prediction List Module 三程式模組進行進一步的解說。
3.3.2 Network Module
Network Module 可隨著輸入的期望預測時間點和預測職務名稱之不同,從人事異動 資料庫中取出所需的相關異動記錄資料,其後藉由模組內部的二網路建構子程序:
person-toward-post network construct procedure 以及 post-toward-person network construct procedure,同時建構出相對應的 Seed Network 以及 Prediction Network。
其中 Seed Network 是由所期望預測的職務節點,以及從預測時間點之前曾經擔任過期 望預測職務的所有異動記錄中,所取出的人物節點共同建構而成的一 2-mode 網路;而 Prediction Network 則是從在預測時間點之前的所有人事異動記錄中,依據所設定的訓 練資料年限長度,從所擔任職務的職等低於所期望預測職務的職等 2 等之內的人選中,
根據其在訓練資料年限範圍之內的異動記錄,依序擷取出職務節點以及人物節點共同建 構成一 2-mode 網路;對於選擇以和期望預測職務職等相距為 2 等的人物集合為主要人 選的原因,主要是因為透過觀察資料庫中的異動記錄,發覺其絕大多數的職務異動範圍
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
34
均在 2 等之內,故合理推論可能的接替人選也應出現於此職等範圍之內的人選之中。舉 例來說,當期望預測職務為經濟部部長(職務職等為 16),訓練資料年限長度為 5 年時,
我們會先取出職務職等介於 14 至 15 等之間的人選,再從民國 96 年至民國 92 年間的異 動記錄集合中,依據這些人選名單取出其異動記錄,再依序擷取出職務及人物節點以建 構出 Prediction Network。
如圖 3-5 中顯示了預測時間為 97 年,預測職位為經濟部部長的 Seed Network 示意 圖;而圖 3-6 中所示則為在預測時間 97 年之前,設定訓練資料年數長度為 5 年(即從 92 年至 96 年之間)的 Prediction Network。藉由 Seed Network 以及 Prediction Network 的建構完成之後,後續的 Simrank Algorithm Module 便可從 Seed Network 中擷取出曾 經擔任過該期望預測職務的所有人物,將之彙整形成所謂的 Seed Person Set,之後再 以此 Seed Person Set 為核心基礎依序與 Prediction Network 中所有的人物進行職務 歷程相似度的計算。
圖 3-5 Seed Network 示意圖
接下來,我們便開始針對 Network Module 內部二子程序於建構 2-mode 網路時的流 程進行解說。首先藉由從圖 3-6 中可以看出,在設定訓練年數僅為 5 年,且期望預測職 務職等為 16 等的條件之下,其所呈現的人物以及職務節點已達一定程度的數量(數據
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
35
資料顯示共有 280 個人物節點以及 216 個職務節點),隨著後續實驗階段針對訓練年數 長度以及期望預測職等的逐步下降,所產生的人物以及職務節點個數將可高達上萬,故 為了系統計算效能方面的考量,Network Module 在針對 2-mode 網路的建置方面,主要 是藉由 person-toward-post network construct procedure 以及 post-toward-person network construct procedure 兩子程序,透過運用 HashMap 資料結構的概念,同時以 2 個 HashMap 來模擬單一 2-mode 網路的建置。其中 person-toward-post network construct procedure 負責負責從異動記錄中,擷取出人物姓名以及異動部門、職位等 資訊,建構出以人物姓名為 Key 值,以異動部門與職位合併而成的職務資訊為 Value 值 的 HashMap;而 post-toward-person network construct procedure 則負責建構以職務 資訊為 Key 值,人物姓名為 Value 值的 HashMap。圖 3-7 所示即為此二子程序以各自產 生的 HashMap 來模擬單一 2-mode 網路的示意圖。
圖 3-6 Prediction Network 示意圖
‧
person-toward-post network construct procedure
post-toward-person network construct procedure
圖 3-7 Network Module 內部二子程序建構 2-mode 網路運作流程圖