• 沒有找到結果。

應用社會網路連結預測於各職級各部門之政府職位接替人選推薦

三、 研究方法

3.1 應用社會網路連結預測於各職級各部門之政府職位接替人選推薦

本研究以政府人事異動資料庫為主要資料來源,建構出同時具有人物以及職 務兩種不同類型節點的 2-mode 網路,並以連結預測理論為主要核心,建置出職 務接替人選推薦系統,配合不同的實驗模式設計進行接替人選的評選推薦,希望 能以此來探討單一職位對於其未來接替人選的考量上,受到其歷任人員職務歷程 的影響程度。

3.1.1 政府官員與職位關聯網路建立

從政府官員異動資料庫及所設定的時間區段(如 10 年或 15 年)中,依序取出 每一筆異動資料中的姓名、職等、異動部門、異動職位以及異動公告年月日相關 欄位的資訊,將其中的人物姓名資訊形成一種類型的節點,稱為人物節點;而異 動部門和異動職務資訊則共同結合產生另一種類型的節點,稱之為職位節點。依 據每一筆異動資訊,可得知該名人物在公告時間點被調動至不同的職位,而將所 產生的人物節點和職位節點間建立連結。由於單一人物在研究設定的時間區段內 可能產生多次異動,故單一人物節點可與多個不同職位節點產生連結;相對的,

單一職位亦有可能依序由不同的官員擔任,故單一職位節點也可與多個不同人物 節點產生連結。而在相同類型的節點彼此間,例如不同人物節點或者不同職位節 點彼此間,則無連結關係的建立,因此我們所建置的人物職位網路是為 2-mode 網路,如圖 1 所示。

圖 1 : 人物職位 2-mode 網路 3.1.2 應用 SimRank 相似度計算於 2-mode 網路

為了探討特定職位的接替人選的選擇受到與歷任官員的職務歷程相似度的 影響程度,我們提出以曾經擔任過該特定職位的所有官員集合為基礎,依序找出 曾經擔任過的職務歷程與前述官員相似的候選人集合,經過綜合評比分析取出職 務歷程相似度值最高的前 n 名,以做為該特定職位的推薦接任人選集合。連結預 測理論相關演算法的共同設計概念同樣也是以相似度為核心,做為其預測兩節點 未來產生連結關係可能性的判斷準則;也就是若任何一原先並無連結關係存在的 對點,其彼此間的相似度較高,則該對點在未來某一時刻的社會網路結構中,彼 此間產生新連結關係的機會將會較高。此種分析推論概念恰可符合我們研究上期 望尋找與某特定職位的歷任官員的職務歷程相似度較高的人選,以做為後續可能 接替該特定職位的人選推薦的需求。另外,基於其演算法的延伸彈性,我們選擇 以連結預測理論中的 SimRank 演算法為本研究模型的核心計算方法。

SimRank 演算法的基本理論基礎是由一遞迴關係概念所構成,認為任意兩節 點彼此間的相似程度會因為與該兩節點相連的其他節點彼此間相似程度的高低 而受到影響;其相似度的計算方式如下圖 2 之公式。

圖 2: SimRank 相似度計算公式

當欲計算任意二節點(x,y)間的相似程度時,若 x 與 y 相同,亦即希望計算 單一節點與自身的相似度時,其值為 1;若 x,y 為不同節點時,則須先取得 x 節點的鄰居節點集合中任一節點(即 Γi (x))與 y 節點的鄰居節點集合中任一節點 (即 Γj (y))彼此間的個別相似度值,再將所有的個別相似度值依序累加取得總計 後,以做為計算(x,y)二節點相似度的基礎;其中參數 c 為一相似度遞減參數,

其值介於 0 和 1 之間。此參數設計的目的主要是用於顯示任意兩節點彼此間相似 度受到其鄰居節點彼此間相似度的影響效果將會呈現遞減現象。

圖3: SimRank2 相似度計算公式

SimRank 演算法相似度計算公式主要是適用於 1-mode 網路中,我們欲將其 運用至2-mode 網路時,必須針對原先的計算公式進行適當的延伸調整,其相似 度計算公式如圖3 所示,其中 A、B 與 c、d 分屬二種不同類型的節點,Γi (A)、Γj

(B)、Γi (c)、Γj (d)分別代表某單一節點的所有鄰居節點所形成的集合;而 C1與C2

則均為相似度遞減係數,其值介於0 和 1 之間。

SimRank 參數設定上,我們經過初步測試後將以 Decay Factor : 0.8;Iteration : 1~10 (step : 1);Data Range (years) : 5~20 (step : 5),而 Voting Procedure 中的門 檻值則設定為 0.025。

3.1.3 實驗設計

本研究提出一職位接替人選推薦系統,其架構如圖 4 所示,可分為 network construction、similarity calculation 及 candidate ranking 三個主要模組。

圖 4: 職位接替人選推薦系統架構 1) 網路建置模組 (network construction)

給定期望分析的時間區段和職位名稱,此模組從人事異動資料庫中取出所需 的相關官員與職位資料,藉由模組內部的二網路建構子程序:person-toward-post 以及 post-toward-person,同時建構出相對應的 seed network 及 prediction

network。Seed network 是由所期望分析的職位節點,及從分析時間區段中曾經擔 任過該職位的所有異動記錄中,取出的人物節點共同建構而成的一 2-mode 網路。

2) 相似度計算模組 (similarity calculation)

在網路建置模組依據所設定的分析時間區段和職位,完成 seed network 以及 prediction network 的建置之後,便交由相似度計算模組負責開始執行職務歷程相 似度的計算工作。由於我們的研究立意是希望探討單一職位的歷任官員曾經擔任 過的職務歷程,對於該職位後續接替人選的評選影響程度,故首先需挖掘出曾經 擔任過所設定職位的成員有哪些。相似度計算模組首先根據 seed network 中所提 供的人物結點資訊,收集各人物曾經擔任過的職務歷程資訊彙整形成 seed person set。其後再以此 seed person set 為基礎,以 prediction network 為計算範圍,透過 其內的 individual-whole procedure 以及 pair-calculation procedure 二子程序負責進 行職務歷程的相似度計算工作。 排序子程序:accumulation procedure、weighted accumulation procedure 及 vote procedure。

a) Accumulation : 以相似度的加總結果作為職位推薦之排序。

b) Weighted accumulation : 職位的時間點與薦選時間點間的差距愈 短,其職位歷程所造成的影響程度應愈大,而時間差距愈長,所造

相關文件