• 沒有找到結果。

基於社會網路分析連結預測理論之政府官員職位與職務歷程影響研究 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "基於社會網路分析連結預測理論之政府官員職位與職務歷程影響研究 - 政大學術集成"

Copied!
116
0
0

加載中.... (立即查看全文)

全文

(1)國立政治大學資訊科學系 Department of Computer Science National Chengchi University 碩士論文 Master's 政 治Thesis. 大. 立. ‧. ‧ 國. 學 sit. y. Nat. 基於社會網路分析連結預測理論之政府官員職位與 n. er. io. 職務歷程影響研究 a iv Government Post l Candidacy Analysis based on Link n Ch U engchi Prediction in Social Network. 研 究 生:黃俊生 指導教授:劉吉軒. 博士. 中華民國九十九年七月 2010.7..

(2) 基於社會網路分析連結預測理論之政府官員職位與 職務歷程影響研究 Government Post Candidacy Analysis based on Link Prediction in Social Network. 研 究 生:黃俊生政. 立 指導教授: 劉吉軒. 治 Student:Jun-Sheng 大. 博士 Advisor:Jyi-Shane Liu. 學. ‧ 國. Huang. ‧. 國立政治大學. y. Nat. 資訊科學系. er. io. sit. 碩士論文. al. n. v C h A Thesis U n i e n g c hofi Computer Science submitted to Department National Chengchi University in partial fulfillment of the Requirements for the degree of Master in Computer Science 中華民國九十九年七月 2010.7..

(3) 誌. 謝. 時光飛逝,終於能夠完成論文取得碩士學位,在研究求學過程當中接受了許多人的 幫助與關懷,實非三言兩語即能訴盡,僅用誠摯感恩的心向所有幫助與鼓勵過我的人致 謝。 首先,要感謝指導教授劉吉軒博士,老師您悉心的教導及鼓勵,不時的指引我正確. 政 治 大 口試教授沈錳坤博士與陳光華博士所給予的建議、指導,使本論文謬誤之處得以修正, 立 的方向,使我在這些年中獲益匪淺,在此謹致上最誠摯的敬意與謝意;同時,還要感謝. ‧ 國. 學. 特此致謝。. 此外,深切感謝永全、忠衛、永文、諭岑、智捷、澤凱、經緯等諸位好友背後的默. ‧. 默支持與鼓勵,給予了我持續前進的動力與勇氣,因為有你們的支持與陪伴,我才能堅. sit. y. Nat. 持到最後完成論文。. io. er. 最後,要感謝我最親愛的家人,謝謝你們不斷的給予我各種精神與物質上的支持、. al. v. n. 信任與包容,讓我能夠無後顧之慮的完成學業,是你們陪伴著我一路成長,讓我能對未. i n C U hengchi 來的挑戰不再感到畏懼,感謝之情永銘於心。. i.

(4) 摘 要. 當面對總體蘊藏資訊量極為龐大,單筆資訊則較為零碎的資料來源時,社會網路分 析同時兼具微觀及巨觀分析特點的方式,提供了一獨特的切入分析角度。目前在社會網 路分析領域中,針對網路性質所發展的分析指標等相關理論,大多以 1-mode 網路為主 要的探討模式,對於 2-mode 網路模式下的著墨則較為稀少。在本研究論文中,以政府. 政 治 大 2-mode 網路,並選擇以適用於 2-mode 網路模式下的連結預測理論為主要核心,建置出 立 人事異動資料庫為主要資料來源,建構出同時具有人物以及職務兩種不同類型節點的. ‧ 國. 學. 職務接替人選預測系統,其後透過配合不同的實驗模式設計進行接替人選的預測行動, 希望能以此來探討單一職位對於其未來接替人選的考量上,受到其歷任人員職務歷程的. ‧. 影響程度。. sit. y. Nat. 實驗數據結果顯示,本研究所建置出的接替人選預測系統,對於不同的職務分類層. io. er. 級以及針對不同部門間的職務預測,均會產生不同的預測成效,而這些成果均可適切反. al. iv n C hengchi U 位接替人選的考量上,較易受到歷任人選於職務歷程方面的影響。 n. 映出因應於升遷法制規範或是部份部門於專業知識上的需求條件,因而使得其在對於職. ii.

(5) Abstract. When coping with the information source which can store quite high information load in total while one piece of that tends to be fragmentary, Social Network Analysis provides a unique viewpoint to contain analyzing characteristics from both of microcosmic and macrocosmic perspectives. To date, when it comes to theories related to analysis indicator. 政 治 大 effort is mainly made to explore 1-mode network. By contrast, little emphasis is put on 立 established from different analyzing characteristics in the field of Social Network Analysis,. ‧ 國. 學. 2-mode network. In this study, the database of government’s personnel change is adopted as the major information source. This study then establishes a 2-mode network with two. ‧. different types of node, that is, personnel and position. Choosing Link Prediction Theory as. sit. y. Nat. the major core with its applicability of 2-mode network, the present study sets up a prediction. er. io. system of position taking-over candidate. Then, in accordance with different designs of. al. n. iv n C U position would be influenced by consideration of future taking-over h candidate e n g cforhai certain experimental model, the prediction is conducted in an attempt to investigate whether the. position courses of all past personnel in this position.. According to the experimental data, the prediction system of position taking-over candidate established in this study shows different prediction efficiency when predicting different position layers and positions from different sectors. These results all appropriately reflect that the consideration of position taking-over candidate is more easily influenced by position courses of past personnel due to the rules of promotion and the conditions of professional knowledge in some sectors. iii.

(6) 目錄 第 一 章. 緒. 論 .............................................................................................................. 1. 1.1. 研究背景 ......................................................................................................................................... 1. 1.2. 研究資料 ......................................................................................................................................... 2. 1.2.1. 總統府公報 ................................................................................................................................ 2. 1.2.2. 政府官員異動資料庫 ................................................................................................................ 3. 1.3. 研究動機與目的 ............................................................................................................................. 4. 1.4. 本研究之貢獻 ................................................................................................................................. 5. 1.5. 論文架構 ......................................................................................................................................... 5. 政 治 大 文獻探討 ................................................................................................................ 7 立. 第 二 章. 社會網路與分析 ............................................................................................................................. 7. 學. ‧ 國. 2.1. 起源與發展 ................................................................................................................................ 7. 2.1.2. 基本定義 .................................................................................................................................... 9. 2.1.3. 網路分析層次 .......................................................................................................................... 10. 2.1.4. 網路性質分析指標 .................................................................................................................. 12. ‧. 2.1.1. Nat. 2.1.4.2. 節點集合(NODE SET)相關分析指標 ................................................................................ 14. 2.1.4.3. 整體網路(NETWORK)相關分析指標 .................................................................................. 16. 2.2.1 2.2.2. sit. er. al. iv n C 基本概念與定義 ...................................................................................................................... 18 hengchi U n. 2.2. y. 節點(NODE)相關分析指標 ............................................................................................... 12. io. 2.1.4.1. 連結預測 ....................................................................................................................................... 18. 相關演算法 .............................................................................................................................. 19. 2.3. 小結 ............................................................................................................................................... 24. 第 三 章. 人物異動網路之建置與系統架構 ........................................................................ 25. 3.1. 人物異動網路建置 ....................................................................................................................... 25. 3.2. 研究方法分析 ............................................................................................................................... 27. 3.3. 系統架構 ........................................................................................................................................ 30. 3.3.1. 系統概述 .................................................................................................................................. 32. 3.3.2. NETWORK MODULE ........................................................................................................................... 33. 3.3.3. SIMRANK ALGORITHM MODULE ........................................................................................................... 37. 3.3.4. PREDICTION LIST MODULE .............................................................................................................. 40. 第 四 章. 實驗設計與分析評估 ........................................................................................... 47 iv.

(7) 4.1. 實驗資料 ....................................................................................................................................... 47. 4.2. 實驗設計模式 ............................................................................................................................... 50. 4.3. 實驗數據結果 ............................................................................................................................... 51. 4.3.1. 相似度遞減係數討論 .............................................................................................................. 51. 4.3.2. 遞迴次數實驗討論 .................................................................................................................. 52. 4.3.3. 訓練年限長度實驗討論 .......................................................................................................... 72. 4.4. 結果分析與討論 .......................................................................................................................... 75. 4.4. 實驗總結 ...................................................................................................................................... 81. 第 五 章. 結論與未來研究方向 ........................................................................................... 82. 5.1. 研究結論 ....................................................................................................................................... 82. 5.2. 未來研究方向 ............................................................................................................................... 84. 四大職務類別職務接替人選推薦列表 ................................................................ 88. 學. ‧. io. sit. y. Nat. n. al. er. 附錄 A. ‧ 國. 參考文獻. 政 治 大 ............................................................................................................................. 86 立. Ch. engchi. v. i Un. v.

(8) 表目錄. 政務官期望預測職位表 .................................................................................... 48 事務官 14 職等期望預測職位表 ...................................................................... 49 事務官 13 職等期望預測職位表 ...................................................................... 49 事務官 12 職等期望預測職位表 ...................................................................... 50 遞迴次數(K)變化實驗數據表:政務官 .......................................................... 53 政務官類別職務預測列表範例(一) ............................................................ 55 政務官類別職務預測列表範例(二) ............................................................ 56 政務官類別職務預測列表範例(三) ............................................................ 56 遞迴次數(K)變化實驗數據表:事務官 14 職等 ............................................ 57 事務官 14 職等類別職務預測列表範例(一) ............................................ 60 事務官 14 職等類別職務預測列表範例(二) ............................................ 60 事務官 14 職等類別職務預測列表範例(三) ............................................ 61 遞迴次數(K)變化實驗數據表:事務官 13 職等 .......................................... 62 事務官 13 職等類別職務預測列表範例(一) ............................................ 64 事務官 13 職等類別職務預測列表範例(二) ............................................ 65 事務官 13 職等類別職務預測列表範例(三) ............................................ 65 遞迴次數(K)變化實驗數據表:事務官 12 職等 .......................................... 66 事務官 12 職等類別職務預測列表範例(一) ............................................ 69 事務官 12 職等類別職務預測列表範例(二) ............................................ 69 事務官 12 職等類別職務預測列表範例(三) ............................................ 70 不同機制預測列表範例 .................................................................................. 72 訓練資料年限長度變化實驗數據表 .............................................................. 73. 立. 政 治 大. ‧. ‧ 國. 學. n. al. er. io. sit. y. Nat. 表 4-1 表 4-2 表 4-3 表 4-4 表 4-5 表 4-6 表 4-7 表 4-8 表 4-9 表 4-10 表 4-11 表 4-12 表 4-13 表 4-14 表 4-15 表 4-16 表 4-17 表 4-18 表 4-19 表 4-20 表 4-21 表 4-22. Ch. engchi. vi. i Un. v.

(9) 圖目錄 圖 3-1 圖 3-2 圖 3-3. 人物異動網路示意圖 ........................................................................................ 26 2-mode 網路 Simrank 演算法計算示意圖 ....................................................... 30 系統架構圖 ........................................................................................................ 31. 圖 3-4 圖 3-5 圖 3-6 圖 3-7 圖 3-8 圖 3-9 圖 3-10 圖 3-11 圖 3-12 圖 4-1 圖 4-2 圖 4-3 圖 4-4 圖 4-5 圖 4-6 圖 4-7 圖 4-8 圖 4-9 圖 4-10 圖 4-11 圖 4-12 圖 4-13 圖 4-14 圖 4-15 圖 4-16 圖 4-17 圖 4-18. 系統運作流程圖 ................................................................................................ 32 Seed Network 示意圖 ....................................................................................... 34 Prediction Network 示意圖 ........................................................................... 35 Network Module 內部二子程序建構 2-mode 網路運作流程圖 ..................... 36 擷取 Seed Network 人物結點轉換為 Seed Person Set 示意圖 .................. 37 Simrank Algorithm Module 運作流程圖 ....................................................... 39 Accumulation procedure 預測列表生成流程圖 ......................................... 41 Weighted accumulation procedure 預測列表生成流程圖 ....................... 43 Vote procedure 預測列表生成流程圖 ......................................................... 45 遞迴次數(K)變化曲線圖:政務官:Top 10 .................................................. 54 遞迴次數(K)變化曲線圖:政務官:Top 5 .................................................... 55 遞迴次數(K)變化曲線圖:政務官:Top 3 .................................................... 55 遞迴次數(K)變化曲線圖:事務官 14 職等:Top 10 .................................... 59 遞迴次數(K)變化曲線圖:事務官 14 職等:Top 5 ...................................... 59 遞迴次數(K)變化曲線圖:事務官 14 職等:Top 3 ...................................... 60 遞迴次數(K)變化曲線圖:事務官 13 職等:Top 10 .................................... 63 遞迴次數(K)變化曲線圖:事務官 13 職等:Top 5 ...................................... 64 遞迴次數(K)變化曲線圖:事務官 13 職等:Top 3 ...................................... 64 遞迴次數(K)變化曲線圖:事務官 12 職等:Top 10 .................................. 68 遞迴次數(K)變化曲線圖:事務官 12 職等:Top 5 .................................... 68 遞迴次數(K)變化曲線圖:事務官 12 職等:Top 3 .................................... 69 訓練資料年限長度變化曲線圖:Top 10 ...................................................... 73 職務類別預測命中率比較直條圖 .................................................................. 77 各部門選取職位與命中職位比率比較圖(一) .............................................. 79 各部門選取職位與命中職位比率比較圖(二) .............................................. 79 各部門選取職位與命中職位比率比較圖(三) .............................................. 80 各部門選取職位與命中職位比率比較圖(四) .............................................. 80. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. vii. i Un. v.

(10) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. viii. i Un. v.

(11) 第一章. 緒論. 1.1 研究背景 近年來,隨著資訊科技的發展突飛猛進,不論是在電腦計算處理能力、硬體儲存技 術、媒體數位化和壓縮技術以及網路傳輸與網際網路技術等方面均大幅提升,促使大量 文物資料的數位化、典藏以及傳播較以往更加便利。藉由文物資料的數位化典藏不僅可 以達到資訊永續保存的目的,同時更容易憑藉網路傳播無遠弗屆的特性,而達到知識全. 政 治 大 這些經由數位化典藏的文物資料,其中經常蘊藏有極為龐大而零碎的資訊量,如何 立. 球化共享的目標。. ‧ 國. 學. 有效對其進行分析、探討自然也就成為值得關注的議題。目前常見的分析方法除了分為 依序針對每筆資料進行討論的微觀層次,以及透過統計方法針對整體資料進行分析的巨. ‧. 觀層次之外,社會網路分析方法(Social Network Analysis)則提供了同時兼具微觀. sit. y. Nat. 與巨觀層次的第三分析角度。社會網路主要是由節點以及節點彼此間的連結所組成的網. io. er. 狀結構,其中節點可以是個人、組織、文章等等,而連結則可以是職場上下屬關係、組. al. iv n C hengchi U 呈現,便可分別探究單一節點的行為表現受其周遭網路結構影響的程度,同時亦可研究 n. 織合作關係、文獻引用關係等等;藉由將數位化的文物資料透過社會網路結構的方式來. 節點彼此間所呈現的互動關係。 藉由社會網路分析方法的獨特分析角度,使得我們能夠對於網路結構中的個體表現 以及整體間的關係有更明確的觀察與理解。但僅是如此尚不足以滿足更多的求知慾望, 是否能夠以對目前網路結構的理解為基礎,進一步的預測未來網路結構可能的發展情況 呢?基於這樣的概念,連結預測(Link Prediction)相關領域因而開始逐漸受到重視。 連結預測理論主張在考量一社會網路時應加入時間的概念,其將社會網路視為一動態結 構,認為不同時間點的社會網路結構其內的連結關係狀況會形成不同的風貌;如何能夠 以既有網路結構中所有節點間的連結關係為基礎進行分析,以有效提升對於未來某一時 1.

(12) 刻中網路節點彼此間連結狀況的預測準確度,自然成為連結預測理論的主要探討核心問 題。. 1.2 研究資料 在本篇研究中所使用的資料庫來源-政府官員異動資料庫,主要是從總統府公報中 的人事任免命令中,經由資訊擷取技術彙整累積而成的資料庫。因而以下將針對總統府 公報以及政府官員異動資料庫的相關資訊,依序進行詳述:. 立. 1.2.1 總統府公報. 政 治 大. ‧ 國. 學. 總統府公報為政府提供相關訊息的公開措施,其發行的主要目的是希望藉由透過此. ‧. 種方式,可以做為提供人們獲取並瞭解有關政府目前相關資訊的管道。基於此種理念,. sit. y. Nat. 我國政府自民國元年開始正式發行政府公報,迄今已經歷九十七年載,其間由於歷經數. io. al. er. 次政府體制的變更,因而使得公報名稱亦產生多次變動,其名稱先後為臨時政府公報、. v. n. 臨時公報、政府公報、陸海軍大元帥大本營公報、國民政府公報以及目前採行的總統府 公報之稱。. Ch. engchi. i Un. 總統府公報最初的發行單位是由總統府第五局負責,而後改由第三局負責發行,民 國八十五年由於總統府組織法進行修正程序,針對府內相關業務職掌進行調整,因而目 前是由第二局負責發行。公報的發行方式最初採行每日發行,其後改為每週發行二到三 次,自民國 84 年 7 月 1 日起後則改為每週三發行,其中若觸及公布法律之日而非週三 時,則額外增刊發行。此外,自民國 86 年 7 月 2 日第 6164 號公報開始,所有發行的公 報均同時刊載於「總統府全球資訊網」網站上,並釋放電子文本以供民眾下載。 總統府公報自民國元年開始發行至今,所公告的資訊內容隨著時代的變遷產生了多 次變動,而目前公報的主要內容則包含了特載(如元旦、國慶公告以及聯合公報等)、 2.

(13) 總統令(如公布法律、任免官員、授予勳章、明令褒揚、題頒匾額等) 、府屬機關令(如 中央研究院、國史館等) 、專載(如國賓抵台訪問、呈遞到任國書、總統府月會等典禮)、 總統及副總統活動紀要、總統府新聞稿、司法院令以及公告(如總統府、國家安全會議、 國家安全局、中央研究院、國史館等)等等。. 1.2.2 政府官員異動資料庫 總統府公報中蘊藏有極為豐富的資訊,其內不僅記載了不同時期我國家元首的重要. 政 治 大. 公告內容,同時也彙整了我國近代民主發展的重要典章制度等等重要的相關文獻資料。. 立. 而為了能夠達到資訊永續保存與發展的目的,政治大學資訊科學系與政大圖書館秉持著. ‧ 國. 學. 數位典藏化的精神,選擇以總統府公告中的人事任免命令為處理核心,藉由資訊擷取. ‧. (Information Retrieval)技術的研發,自動解析自然語言文件並從中萃取出重要核 心資訊,進而累積建置為中華民國政府人事異動資料庫,以供後續進一步的加值處理與. er. io. sit. y. Nat. 應用。. 在本篇研究中是以政府官員異動資料庫為資料來源,其中由於考量到總統府公報前. n. al. Ch. i Un. v. 後期的格式與刊載條件有所不同,故進行實驗時所採用的資料是以民國 77 年 1 月 1 日. engchi. 至民國 97 年 9 月 18 日之間的異動記錄為主,其中總計有 253,059 筆異動記錄,包含有 168,914 個不同人物;其中,由於在資料庫中部份職務類型(如薦任公務人員、警階升 遷等)的異動記錄中並不具有異動的部門資料,僅有異動的職務名稱,其所提供的資訊 量不足以進行後續有效的分析評斷,故選擇將此類型的異動記錄予以排除;此外,由於 總統府公告的人事命令中並未包含非由總統任命的民選官員(如縣市長、總統等等民選 公務人員),為了能夠盡量補齊我國近代政治生態的資料完整性,故針對上述所選定的 異動範圍期間,額外從中央選舉委員會所建置的選舉資料庫中取出相關的資訊予以補足。 總計最後進行系統實驗階段時包含有 54,168 筆異動記錄以及 18,741 個不同人物;其中. 3.

(14) 每筆異動記錄中,均包含有下列資料欄位:姓名、任免(上任或免職)、部門、職務、 職等、公報期數、出刊年月日以及異動公告年月日。. 1.3. 研究動機與目的 為了能夠有效運用人力資源,並迅速反應整體大環境的改變以及組織業務上的需求. 變化,而對組織成員的職位予以適切的調整與變動,此為人員異動管理的主要目的。良 好的異動管理,不僅可以能夠協助組織拔擢優秀的人才、降低成員的流動率、提高成員. 政 治 大. 間的工作士氣,同時還可協助成員發揮工作潛能;所以可以推知人員的異動配置不論對. 立. 於組織或是成員而言,均具有極大的重要性與影響力。因此,長久以來針對影響組織中. ‧ 國. 學. 空缺職位接替人選決定因素進行深入的議題便深受許多不同領域的高度重視。在本篇論. ‧. 文中,從眾多影響人員異動的不同因素中,選擇以曾經擔任過的職務歷程的相似影響程 度作為主要的探討核心。. y. Nat. er. io. sit. 本研究選擇以我國政府官員異動資料庫作為研究資料來源,其中蘊藏了從民國 77 年至民國 97 年間我國政府官員的人事異動記錄。由於在異動資料庫中的資料量極為龐. n. al. Ch. i Un. v. 大,且單一筆異動資料所能提供的資訊較少,若以傳統方式對其進行分析實難從中獲得. engchi. 足夠的意義成果;但藉由社會網路分析方法,由於其是以節點彼此間的連結關係為核心, 單一節點所具有的特性則轉為輔助分析角色,適切於異動資料庫中所具有的資料特性; 且其可從整體網路結構中的連結情況來針對節點表現的影響進行分析,亦可探討節點彼 此間的連結互動情況,同時兼具微觀與巨觀的分析層次,因而在本研究中選擇以政府官 員異動資料為基礎架構出一社會網路結構,並運用連結預測理論針對特定職位進行預測 未來的可能接替人選,期望藉由從整體的預測準確度成果來衡量歷任職位歷程的相似度 對於特定職位接替人選選定的影響程度。. 4.

(15) 1.4 本研究之貢獻 本研究中以政府官員異動資料庫為主要資料來源,其內蘊藏有極為龐大的職位異動 記錄資料。首先,我們依據所設定期望預測的各式職位以及時間,從相關的異動記錄中 擷取出異動人員的姓名、異動部門、異動職位、職等以及異動時間等重要欄位的資訊, 建構出屬於 2-mode 型態社會網路結構的人物異動網路,以完整呈現各人物與其歷任職 位間的異動連結情況。其後,再藉由以適用於 2-mode 網路型態下的 Simrank 演算法為 核心建置而成的職位接替人選預測系統,從社會網路分析中連結預測理論的角度切入分. 政 治 大. 析,以針對所設定期望預測的職位,產生出相對應的接替人選推薦列表。. 立. 其後,再經由多種不同的實驗模型設計,不僅依序探究 Simrank 演算法中諸多係數. ‧ 國. 學. 的調整對於系統預測效果的影響程度,同時亦針對所得的各類實驗數據結果,從不同的. ‧. 角度搭配相關的領域知識進行分析研究,以從中挖掘出不同層級的職位階層以及政府各 式部門,在對於其內職位的接替人選的考量上,各別受到歷任人員職務歷程的影響程度,. y. Nat. n. al. er. io. sit. 並進一步從所呈現的預測成果中,歸納分析影響其預測效果的淺藏因素。. 1.5 論文架構. Ch. engchi. i Un. v. 本論文後續的章節架構如下圖所示;在第二章中將先針對社會網路分析以及連結預 測領域的相關文獻進行回顧探討;第三章首先針對系統依據所使用資料來源特性建構出 的社會網路結構以及所選擇採用之連結預測演算法進行說明,其後針對整體系統架構予 以詳細闡述;第四章則呈現系統實驗的結果數據與以及相關分析討論;最後,第五章為 整篇研究的結論以及未來研究方向。. 5.

(16) 第一章 研究背景. 研究資料來源. 研究動機與目的. 第二章 社會網路分析文獻. 連結預測文獻. 第三章 網路特性與演算法. 系統架構分析. 第四章 實驗設計與數據. 數據結果分析 治 政 大 第五章. 立 結論. 未來研究方向. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 6. i Un. v.

(17) 第二章. 文獻探討. 本章將依序簡介與研究主題相關的文獻資料,首先針對社會網絡的起源、定義、構 成要素以及網路性質分析理論的相關文獻進行回顧,其後則針對研究的核心理論-連結 預測(Link Prediction)-相關文獻進行探討,希望能對與本研究相關的文獻資料有 更完整的理解,以能更確立研究的方向。. 2.1. 社會網路與分析. 政 治 大 社會網路的基本概念是由個體形成的集合以及個體彼此間的關係建構而成,其分析 立. ‧ 國. 學. 理論不同於一般理論針對單一個體的能力、特質差異進行個別討論,或是專注於整體網 路環境進行特質分析的視點,而主要是著重於提供研究者針對網路中個體彼此間的互動. ‧. 連結關係,以及其與所屬整體網路間的關係進行研究;因而在各種不同的學術領域中,. sit. y. Nat. 如社會學、人類學、心理學、經濟學、生物學、物理學、資訊科學等等,均已將其視為. io. al. er. 一重要的分析理論工具。以下我們將依序介紹社會網路理論的起源與發展、定義與構成. n. 要素、以及相關的分析觀點理論。. 2.1.1. Ch. engchi. i Un. v. 起源與發展. 社會網路(Social Network)的概念最早是起源於西方社會學及人類學相關之研究。 19 世紀末,Émile Durkheim 與 Ferdinand Tönniesy 率先提出了社會網路的初步構想, 因而被認為是社會網路研究領域的先驅;Émile Durkheim 認為社會群體(social group) 可能因為具有相同的價值觀、信仰,或者由於形式上、可利用的社會關係,而在彼此間 產生連結關係;而 Ferdinand Tönniesy 則提出了部分社會現象的發生是起因於社會個 體間連結關係的交互作用影響,而非起因於個體本身的特質因素。 20 世紀初,Georg Simmel 針對個體間的交互關係,認為其構成鬆散網路結構的概 7.

(18) 念;1930 年代,J.L. Moreno 開始嘗試以系統化的方式記錄並分析小群體(如班級、工 作小組)內的社會性相互關係;W.L loyd Warner 以及 Elton Mayo 也開始針對工作上人 際關係相互影響的現象進行研究分析;1940 年代,西方人類學家開始著手針對英國皇室 血源以及對南非與英國的都市化研究,開啟了社會網路分析理論的發展,其中英國的人 類學家 S.F. Nadel1[11]所提出的社會結構理論,更是深深的影響了後續社會網路分析 研究的方向。 到了 1954 年代,人類學家 Barnes 於針對挪威漁村進行社會結構的研究時發現,無. 政 治 大. 法單以傳統分析團體之結構功能理論中的社會結構角色(如社會階級、職業、地位等等). 立. 來解釋整個漁村內部的實際運作狀況,因而正式提出了社會網路一詞,改以居民個體間. ‧ 國. 學. 的非正式關係(如親屬、朋友、鄰居等等)為基礎建構而成的互動網路概念,來解釋漁 村內居民彼此間的互動行為。而後至 1960 至 1970 年代,社會網路概念開始逐漸被學者. ‧. 所接受,並開始嘗試運用於社會科學領域方面的研究之中,其中由 Harrison White 與. Nat. sit. y. 其兩位學生 Mark Granovetter 及 Barry Wellman 所共同組成的哈佛團隊,有鑑於當時. n. al. er. io. 社會學研究領域的兩大學說均尚有可以補足之處:由當代社會學權威之一的 Talcott. i Un. v. Parsons 所提出的結構功能主義(structural Functionalism)過於忽略微觀下的特徵,. Ch. engchi. 而由 George Homans 所提出的方法論中的個人主義(methodological individualism) 則過於強調個體間的差異性,而忽略了巨觀下群體的影響;因而專注於社會網路分析的 研究領域,加上其他許多團隊共同對於社會網路分析的關注與研究,使得當代的許多學 術理論成為日後社會網路分析領域的研究基石。 由於社會網路分析的核心理論主要在於探討個體彼此間的互動關係,以及整體網路 環境特性對其個體所產生的影響,此一特點展現出與傳統分析理論截然不同的切入觀點, 因而近年來開始跳脫最初發展的社會科學領域,廣泛的應用於其他各種研究領域之中; 如在商業、管理領域方面,開始嘗試運用社會網路的概念針對企業組織間的商業結盟關 係進行研究分析;而在知識管理領域方面,亦開始有學者運用社會網路分析的概念,來 8.

(19) 研究組織中知識訊息的傳播與散佈模式,以協助組織中的知識管理並期望達成知識創新、 提升組織競爭優勢的最終目的;其他如政治學、經濟學、犯罪防治、文獻推薦等研究領 域,同樣也開始運用社會網路的概念及分析的方法,以擴充並強化自身研究領域在研究 方法上的應用以及理論的解釋能力。. 2.1.2. 基本定義. 社會網路理論主要是藉由透過圖形(Graph)的概念來呈現社會結構,其基本定義. 政 治 大. 是指:一群節點(node)的集合,透過節點與節點間存在的特定關係(relationship). 立. 於彼此間產生了連結,而其所形成的整體社會結構可用於說明單一節點所產生的行為、. ‧. 1.. ‧ 國. 別說明:. 學. 現象;根據社會網路理論的定義,我們可將其構成要素分為節點與關係兩大類,以下分. 節點(node):. Nat. sit. y. 社會網路中的節點可以是任何的個人、群體、社區、企業、組織、國家等等,甚至. n. al. er. io. 可以延伸至非生命的事物,如字詞、圖像、經濟體、文獻資料等等。在一社會網路中並. i Un. v. 不限於僅能存在一種類型的節點,亦可能同時存在有數種不同的節點類型,而分別於各. Ch. engchi. 關係網路中扮演不同的角色。當一社會網路內部僅含有一種類型的節點時,將之稱為 1-mode 網路,其內的節點彼此間屬性上會產生差異,但本質上仍屬於相同類型,舉例來 說,一般常見的人與人所構成的網路即為此類;而當網路中的節點分屬兩種類型時,則 稱之為 2-mode 網路,例如以顧客與其所購買商品所構成的網路即為 2-mode 網路[9]; 一般而言,2-mode 網路僅在不同類型的節點間產生關係連結,相同類型的節點間若亦產 生關係連結,則將對於整體網路的性質定義與分析方面提升不少難度;基於相同的理由, 當一社會網路中的節點類型愈多時,對於該網路的分析將會造成更複雜的難題,因而目 前三種以上節點類型的網路結構較不常見。 2.. 關係(relationship): 9.

(20) 所謂的關係,從構成內容(content)來看,其建構的型態與範圍非常廣泛,常見 的關係型態如最基礎的血緣及姻緣的親屬關係、友誼及夥伴關係、市場上的買賣交易關 係、團體組織層級下的正式職權及角色關係、上下屬以及同事關係等等,不同型態的關 係會呈現不同的特徵,並產生不同的網路連結,一切端視研究對象的不同而可以有不同 層次的觀察選擇來進行探討。 而依方向性(direction)的角度來看,關係則可區分為有方向性(directional) 與無方向性(non-directional);舉例來說,以當 A、B 兩行為者是否同時參予一專案. 政 治 大. 計畫做為建立關係的標準時,此時所建立的關係即為無方向性;而以 A、B 兩行為者彼. 立. 此間是否為朋友以建立友誼關係時,由於可能出現 A 行為者將 B 行為者視為好友,而 B. ‧ 國. 學. 行為者則僅將 A 行為者視為普通朋友的情形,故此時所建立的友誼關係便具有方向性。 此外,若從關係的強度(strength)角度來看,關係又可分為二元關係以及權重關. ‧. 係;所謂的二元關係是指,僅單純考量兩行為者間是否具有關係的存在;而所謂的權重. Nat. sit. n. al. er. io. 值。. y. 關係,則會依據兩行為者間彼此接觸頻率的多寡,而給定其彼此間的關係不同的權重. i Un. v. 綜合上述對於社會網路的基本定義,可以瞭解到雖然社會網路理論最初起源於探討. Ch. engchi. 人際間的互動關係,但由於其理論核心概念主要在於探討節點間彼此的關係,以及整體 網路結構對節點行為表現的影響,因而使其能夠從早期僅運用於人類學、社會學、社會 心理學等領域而快速、廣泛的擴展應用於其他不同領域之中;而社會網路分析(Social Network Analysis)則是由社會網路理論所延伸而出的分析工具,其結合了數學、圖形 理論(Graph theory)、派系(Clique)、社會心理學、社會計量學(Sociometric).. 等等各領域的成果,主要是藉由提供許多通用的分析計算法則,同時從巨觀以及微觀的 層次來協助分析所建構的網路資料,以供人們從中獲取所需的資訊。. 2.1.3. 網路分析層次 10.

(21) 社會網路的分析層次可以隨著研究者的研究目的以及資料收集方式的不同,而區分 為若干不同的層次。Knoke & Kuklinski(1982)將社會網路分析分為下列四種層次: 自我中心網路(Ego-Centric Network)、成對網路(Dyad Network)、三角網路(Triad Network)以及完整網路系統(Complete Network System);以下將依序分述各層次的 概念與內涵: 1.. 自我中心網路(Ego-Centric Network): 此種網路模型又可稱為主要明星網路(Primary Star Network)、主要範圍網路. 政 治 大. (Primary Zones Network)、第一順序網路(First-order Network)或是個人網路. 立. (Personal Network)。以某一節點為中心向外描繪整個網路,其研究焦點主要關注於. ‧ 國. 學. 中心節點與網路中其他節點間的網路連結關係,而較為忽略其他節點彼此間的關係。當 以自我中心網路為分析觀點時,其探討的議題主要包括該中心節點的行為表現如何受到. ‧. 周遭網路的影響、中心節點與其他節點間的互動關係內容情況、該中心網路的範圍大小、. Nat. sit. y. 密度、差異性以及屬性是否同質等等。此種網路分析觀點一般適合運用於研究資料母體. al. n. 2.. er. io. (Population)非常龐大或是範圍無法明確界定的情況。 成對網路(Dyad Network):. Ch. engchi. i Un. v. 又可稱為派對網路。此種網路分析觀點是以一對(pair)節點間的連結關係為研究 主體,依序檢視整個網路結構中任意兩兩配對節點間的關係,其分析重點除了著重於探 討成對節點各自的屬性差異、彼此間所產生連結關係的內容以及哪些特殊的連結關係有 共同產生的傾向外,常見的相關議題還包括節點間彼此相互影響的程度以及因應不同事 件所產生連結關係強度的差異等等。 3.. 三角網路(Triad Network): 此種網路分析觀點是由德國社會學家 Georg Simmel 於 1908 年時所提出,以三個節. 點間的連結關係為研究主體,主要關注於特定三節點彼此間的連結關係是否存在著傳遞 效果,兩兩節點間的關係是否受到第三節點的影響,並進一步探討三節點間的連結關係 11.

(22) 是否呈現和諧與不和諧(pleasant and unpleasant)、平衡與不平衡(balance and unbalance)以及正向與負向(positive and negative)等現象。 4.. 完整網路系統(Complete Network System): 通常也被稱為社會中心觀點(Social-Centric)。是目前最廣為採用的網路分析階. 層,其主要是在特定範圍下,研究該範圍內所有節點彼此間的關係狀態,並著重於節點 成員在網路結構中的結構分佈情況,其特定範圍可以是團隊、組織、公司、社群、產業、 區域等等。由於此種分析觀點同時考慮範圍內所有節點的關係,故須得到所有節點彼此. 政 治 大. 之間的關係資料。其常見的討論議題包含了中心性(Centrality)分析、凝聚子群分析. 立. 以及節點彼此間的對等性(Equivalence)分析等等。. ‧ 國. 學. 2.1.4. 網路性質分析指標. ‧. 社會網路分析理論發展至今,陸續建構出多樣化的分析與計算指標,以下將依序從. Nat. sit. y. 節點(Node)、節點集合(Node Set)以及整體網路(Network)三角度,介紹相關分析. n. al. er. io. 指標的意義以及計算方式:. 2.1.4.1 1.. Ch. e. ngch 節點(Node)相關分析指標. i. i Un. v. Centrality: 網路中心性(Centrality)是最早被社會網路分析學者所提出的概念之一,其主要. 是起源於計量社會學中的星狀概念。在一社會網路結構中的每一節點均有其所處位置, 而不同的位置會影響到該節點所能控制的資源量的大小,網路中心性便是社會網路分析 中經常用於檢測及計算每一節點取得資源、控制資源流通可能性的結構性指標。Ibarra (1993)提出,一節點若位於網路的中心位置,則其將較可以控制相關的資源並享有較 多的利益。而 Freeman(1979)則將對網路中心性的衡量分為三類:程度中心性(Degree Centrality)、緊密中心性(Closeness Centrality)以及中介中心性(Betweenness 12.

(23) Centrality);此三項中心性的意義與計算公式分述如下: 程度中心性(Degree Centrality):其主要是計算單一節點與其他節點連結數目的 總合,由於僅有與該節點直接相連的連結數目被納入計算,而不考慮間接連結的情況, 因此程度中心性經常被視為是在檢測單一節點的區域中心性(local centrality)。程 度中心性亦可以運用於有向網路中,此時其概念可進一步區分為計算連入單一節點的對 內中心性(in-centrality)以及計算從該節點向外連出的對外中心性(out-centrality)。 程度中心性愈高的節點,代表其在網路中和愈多的節點相連,因而其在該網路中所擁有. 政 治 大. 的資源以及影響力也將愈多。公式一所示即為程度中心性的計算公式:. 立. CDegree (ni ) = degreein (ni ) + degreeout (ni ) �公式 1�. ‧ 國. 學. 緊密中心性(Closeness Centrality):其主要是計算在一網路中,單一節點與其 他節點的距離總和,在此所指的距離是以兩節點間的最短路徑長度來計算,此外由於並. ‧. 非所有節點彼此間皆可直接連結,故緊密中心性的計算同時考慮了間接連結的情況,也. Nat. sit. y. 因此相較於程度中心性被視為代表區域中心性,一般學者普遍認為緊密中心性代表的是. n. al. er. io. 一網路的全域中心性。依據 Freeman 研究顯示,在一群體中全域中心性最高的節點能花. i Un. v. 費最少的成本與全體節點進行資訊交流;而從圖論的角度來看,全域中心性最高的節點,. Ch. engchi. 其到達其他節點所需的花費成本最小。公式二所示即為緊密中心性的計算公式;從公式 二中可以發現,當計算一節點的緊密中心性時,會選擇將距離總和的計算結果取倒數, 其主要原因在於當一節點與其他節點的距離愈近時,也就是該節點愈靠近中心點時,其 距離計算總和將愈小,而這將違背一般直覺認為指標數值愈高愈接近中心的想法,故選 擇將距離計算總和取倒數。 CCloseness (ni ) = �∑j≠i distance�ni , nj ��. −1. �公式 2�. 中介中心性(Betweenness Centrality) :其主要是計算在一網路中,任兩節點 j、 k 之間的所有路徑中,必須經過單一節點 i 的比率。中介中心性主要用於衡量社會網路. 13.

(24) 結構中的中介位置,當一節點在網路中扮演著連接兩群團中介橋梁的角色時,其中介中 心性數值將會較高,同時也代表了該節點佔據了控制資訊流通的關鍵性位置;Burt(1992) 即認為此類型節點將較易從資訊的控制上獲得利益,同時也是組織中較易獲得升遷機會 的成員之一。公式三所示即為中介中心性的計算公式:. 2.. CBetweenness (ni ) = ∑j,k≠i. �path via n �n j ,n k �� i �path total �n j ,n k ��. �公式 3�. Clustering Coefficient:此項指標數值主要用於顯示,單一節點與其周遭節點間. 相互連結的緊密情況;當一節點與其周遭節點彼此間均產生連節時,亦即形成一 clique. 政 治 大. 集 團 時 , 代 表 其 與 周 遭 節 點 間 的 連 結 情 況 極 為 緊 密 , 則 該 節 點 的 Clustering. 立. Coefficient 數值將會最高為 1;相對的,當一節點與其周遭所有節點彼此間全無連結. ‧ 國. 學. 時,代表其與周遭節點間的連結情況極為稀疏,其 Clustering Coefficient 數值將會. i. �公式 4�. y. Nat. i. sit. 2|E�G (n )�|. 1 i CC1 (ni ) = degree (n )�degree (n −1)�. ‧. 最低為 0。公式 4 所示即為其計算公式:. n. al. 2.1.4.2 1.. 節點集合(Node. er. io. 其中上式中的|E�G1 (ni )�|代表該節點ni 與周遭節點間的連結數。. i n C U hengchi Set)相關分析指標. v. Structural Cohesion:此項分析指標與 clustering coefficient 指標同樣均可用. 於顯示節點彼此間連結的緊密程度,但其與之不同之處在於:clustering coefficient 是從單一節點的角度觀察,structural cohesion 則是源自於觀察一群節點;當一群節 點的 structural cohesion 值為 n 時,代表著欲使該群節點集合形成不連通狀態,則至 少須移除 n 個節點。 2.. Structural Equivalence:在一社會網路結構中,當任意兩節點其各自相連的鄰居. 節點均相同時,此時稱這兩個節點彼此互為 structural equivalence;而依據此定義, 當考慮到任兩節點彼此均為孤立點時,由於孤立點的基本定義為該節點並無和任何節點 14.

(25) 相 連 , 故 此 時 也 可 說 任 兩 孤 立 點 彼 此 均 為 structural equivalence 。 藉 由 透 過 structural equivalence 指標,可以協助找出在一社會網路中,佔據相同結構位置或是 扮演相同角色的節點集合,以進一步分析該群節點在整個社會網路中的重要性。. 3.. Cohesion Subgroup:凝聚子群體(cohesion subgroup)對於許多社會現象的呈現,. 經常扮演著極為重要的解釋角色,因而如何發掘凝聚子群體自然成為社會網路分析中常 見的重要議題之一。所謂的凝聚子群體是由一群彼此關係連結較為密切的節點所構成的. 政 治 大. 子集合;相對於網路中其他節點間的連結關係,在凝聚子群體中的節點彼此間的連結關. 立. 係較強、直接,接觸頻率也較為頻繁。以下將依序介紹目前幾種較為常見的凝聚子群體. ‧ 國. 學. 的定義與特性。. (1) Clique:. ‧. clique 的基本定義是指由三個或三個以上的節點所組成的最大完全子圖. Nat. sit. y. (Maximal Complete Sub-graph);也就是說對點(dyad nodes)的情況並不足以. n. al. er. io. 構成一 clique,而所謂的完全子圖則是指在 clique 中的所有節點彼此間均為直接. i Un. v. 相連,此外最大的意思則為該 clique 不能再被其他 clique 所包覆。依據 clique. Ch. engchi. 基本定義,可以歸納出 clique 具有以下幾項特質:一、clique 的密度為 1;二、 一包含 n 個節點的 clique 中,其內任一節點均與 n-1 個節點相連;三、在 clique 中任兩節點彼此間的距離均為 1;四、clique 內外連結關係的比例達到最大。從上 述 clique 的定義中可以發現其要求非常的嚴格,所以當運用至真實的社會網路資 料中時,通常僅能找到極為少數的 clique 且規模通常較小,大幅降低了其實用性, 因而後續許多學者開始針對 clique 的定義提出了改良的方法,以放鬆 clique 的限 制條件。 (2) N-Clique: 在網路中的任一節點集合Ns ,當其滿足下述條件時稱其為 N-Clique:在此節 15.

(26) 點集合中,任兩節點彼此間在整體網路結構下的連結距離均小於或等於門檻值 n, 將其定義形式化如下所示: d(i, j) ≤ n,for all ni , nj ← Ns. 上述中的d(i, j)代表著節點 i 與節點 j 在整體網路下的最短距離。舉例來說, 在 2-clique 中,任兩節點彼此間均直接相連或是透過一共同點而相連。 (3) N-Clan: N-Clan 的基本定義與 N-Clique 相似,其差別主要在於對於兩節點間最短距離. 政 治 大. 的定義有所不同;在 N-Clique 中,所定義的兩節點間的最短距離是在整體網路架. 立. 構考量下進行計算,而在 N-Clan 中,其所定義的兩節點間最短距離則限制須是在. ‧ 國. 學. 該節點集合範圍中的距離;故可推知 N-Clan 的定義較為嚴格,且一 N-Clan 必同時 為一 N-Clique。. ‧. (4) K-Plex:. Nat. sit. y. 在網路中的任一含有 n 個節點的節點集合Ns ,若其內任一節點的 degree 數目. n. al. er. io. 均大於或等於 n-k 值時,也就是其內所有節點均至少和 n-k 個同屬該集合內的其他. i Un. v. 節點直接相連時,則稱此節點集合為 K-Plex。其定義形式化如下所示:. (5) K-Core:. Ch. engchi. d(i) ≥ (n − k),for all ni ← Ns. K-Core 的定義與 K-Plex 恰為相反,其基本定義是當任一節點集合Ns ,其內任. 一節點的 degree 數目均大於或等於 K,也就是其內所有節點均至少和 k 個同屬該集 合內的其他節點直接相連時,則稱此節點集合為 K-Core。其定義形式化如下所示: d(i) ≥ k,for all ni ← Ns. 2.1.4.3 1.. 整體網路(Network)相關分析指標. Network Size:社會網路大小又稱為社會網路廣度(Network Range),是指構成該 16.

(27) 社會網路的節點數目的多寡。 2.. Network Density:社會網路密度(Network Density)主要用於衡量一個社會網路. 結構上的連結緊密程度,其值介於 0 和 1 之間;當一網路中所有節點彼此間均有連結時 密度最大為一,而所有節點彼此接均無相連時密度最小為零。其計算方式為該網路的連 結數目除以相同節點數目且密度最大時的連結數目,計算公式如下所示: |Edge (N)|. 3.. Density(N) = Max |Edge (N)|. �公式 5�. Centralization: 此項指標數值主要用於顯示一社會網路中央集權化的程度;所. 政 治 大. 謂中央集權式的網路,意指當移除該網路中某一節點之後,可能會對其網路結構產生極. 立. 大的影響;而相對於中央集權式網路牽一髮動全身的情況,離散式網路則不論移除任何. ‧ 國. 學. 單一節點,都不會對其整體網路結構產生巨大影響。當一社會網路的 centralization. ‧. 值愈高,即代表該社會網路愈有中央集權化的傾向。而由於 centralization 指標的計 算方式是以節點類型指標之一的中心度(centrality)為基礎,故依據不同的中心度定. y. Nat. sit. io. 義可計算出不同的 centralization 值。計算六所示即為其計算公式,其中n∗ 代表在該. n. al. er. 社會網路中中心度值最高的節點,而Max ∑[Centrality(n∗ ) − Centrality(ni )]則代表與該. Ch. 網路相同節點數下的最大可能值。. 4.. Centralization =. engchi. i Un. v. ∑[Centrality (n ∗ )−Centrality (n i )]. Max ∑[Centrality (n ∗ )−Centrality (n i )]. �公式 6�. Structural Holes:在一社會網路中,可能存在著許多不同大小規模的凝聚子群體,. 而從上述關於凝聚子群體的定義中可以得知,凝聚子群體內的連結關係總是較為緊密, 而這間接造成了在不同凝聚子群體彼此間的連結關係較為稀少、鬆散的情況,造成宛如 一個空洞的存在,此種現象便是結構洞(Structural Holes)理論所關注的核心所在。 結構洞的現象在社會網路分析中之所以會被學者特別提出探討,主要原因在於位於結構 洞區塊中的少數節點,往往扮演著數個不同凝聚子群體彼此間互相溝通連結的重要角色。 Burt(1992)認為結構洞能夠為佔據其中的節點於獲取訊息利益和控制利益方面提供機 17.

(28) 會,進而使得其比網路中其他位置上的節點更具有競爭優勢。 對於結構洞的偵測最常見的方式是透過由 Burt 所提出的 measure of constraint 計算公式,其基本概念在於探討單一節點與其周遭節點彼此間的連結關係;倘若現有單 一節點其周遭的節點數極為稀少,且其周遭節點彼此間的相互連結關係極為頻繁,則可 以合理推斷此單一節點極有可能位於結構洞的區塊之中。公式七所式即為其計算公式, 其中pij 代表從節點 i 連結至節點 j 的連結數在節點 i 的所有連結數中所佔的比例。 2. C = ∑j cij = ∑j �pij + ∑q piq pqj � , i, j ≠ q �公式 7�. 立. 2.2 連結預測. 政 治 大. ‧ 國. 學. 連結預測(Link Prediction)理論是以社會網路分析理論為基礎擴展而來的一嶄. ‧. 新研究領域。常見的社會網路分析理論主要著重於探討資料節點的特質、彼此間的連結. sit. y. Nat. 關係以及整體網路結構對其行為表現的影響程度,較偏向於針對單一社會網路結構,進. io. er. 行靜態形式的分析;而連結預測理論選擇引入了時間的概念,認為社會網路的本質是屬. al. iv n C hengchi U 能夠準備預測哪些節點彼此間未來可能會產生新的連結,即成為連結預測理論所期望探 n. 於動態的架構,節點與節點彼此間可能會隨著時間的流逝而建立新的連結關係,故如何. 討的主要問題核心。以下將依序針對連結預測的基本理論定義以及相關的預測演算法進 行介紹。. 2.2.1. 基本概念與定義. 連結預測(Link Prediction)理論認為社會網路的本質為一動態的架構,隨著時 間的流逝其整體網路規模以及節點與節點彼此間的連結關係亦可能會有所變動;也就是 說,一社會網路可能會因為歷經一段時間過後某些事件的發生而產生新的節點,或者原 先無連結關係的節點間因應新事件的發生,而於彼此間產生了新的連結關係。而連結預 18.

(29) 測理論主要探討的問題核心便在於如何透過一連結預測器(Link Predictor)準確預測、 判定哪些新的關係連結,將出現於經過一段時間過後的社會網路結構中。 在正式給定連結預測理論具體定義之前,首先針對所使用的相關符號予以說明: . G = ⟨V, E⟩:用於代表一社會網路結構,其節點集合為 V,節點彼此間的關係連 結集合為 E。. . ⟨u, v⟩:代表於該社會網路結構中的一連結關係,其中 u,v 均屬於 V 集合中,各. 自代表不同節點。 . 政 治 大. G[t, t ′ ]:代表一社會網路結構 G 於所給定的t至t ′ 時間區段中,其中所有關係連. 立. 結所構成的子圖。. ‧ 國. 學. 根據上述的符號定義,可以給予連結預測理論一具體定義:. ‧. 假設今有一社會網路結構G = ⟨V, E⟩,依序給定四個時間點t 0 、t 0 ′ 、t1 以及t1 ′ ,其中. Nat. t 0 < t 0 ′ < t1 < t1 ′ ,則一連結預測器(Link Predictor)將以G[t 0 , t 0 ′ ]為基礎,依據其. sit. y. 所採行的相似度(Proximity)演算機制,依序計算在G[t 0 , t 0 ′ ]網路結構中所有對點⟨x, y⟩彼. n. al. er. io. 此間的相似度權重值(以score(x, y)表示) ;取得所有對點彼此間的相似度計算結果集合. i Un. v. 後,將其依照降冪順序排列,即可獲得一依照相似度權重值由高至低排序而成的對點集. Ch. engchi. 合,則此對點集合即為該連結預測器以G[t 0 , t 0 ′ ]為依據,預測將會出現於G[t1 , t1 ′ ],而原 先未出現於G[t 0 , t 0 ′ ]的連結集合;其中[t 0 , t 0 ′ ]稱為訓練階段(training interval),而. [t1 , t1 ′ ]則稱為測試階段(test interval)。. 2.2.2. 相關演算法. 連結預測理論相關演算法的共同設計概念主要在於,針對所輸入的社會網路結構, 其中所包含的任一對點⟨x, y⟩,若其彼此間的相似程度(Proximity)愈高,則該對點⟨x, y⟩在 未來某一時段的社會網路結構中,將愈有可能會在彼此之間產生新的連結關係;舉例來. 說,在一以公司為節點、曾經共同參予一合作計畫而建立連結關係的社會網路結構中, 19.

(30) 現有 A、B 兩公司,其彼此間未曾合作而產生連結關係,但若其各自曾經合作過的公司 節點集合相有較高的重複性,則可以合理推斷 A、B 兩公司未來將有較大的可能性相互 合作,亦即其彼此間將可能於未來產生連結關係。在上述的舉例中,是以任兩公司節點 各自的相連公司節點集合的重複性為其相似度的計算法則,而依據針對單一對點⟨x, y⟩彼. 此間相似度計算法則的定義之不同,因此也就衍伸出不同的連結預測演算法。接下來, 將依序介紹目前較為常見的連結預測演算法。 1.. Graph Distance:計算任意兩節點彼此間相似度高低最基礎的方法之一,即是以任. 政 治 大. 意一對點⟨x, y⟩彼此間的最短路徑距離作為計算準則;當兩節點彼此間的最短路徑距離愈. 立. 短時,相似度愈高。公式八所示即為其相似度計算公式;其中值得特別注意的是,當任. ‧ 國. 學. 一對點⟨x, y⟩的最短路徑距離為 1 時,代表該對點在 training interval 階段的社會網路. ‧. 結構中,彼此間已有連結關係相連,不屬於可預測範圍之內,故選擇從最短路徑距離≥ 2. Nat. 的對點集合中,依照各對點所計算出的score(x, y)值依降冪排序,並取出前 n 對對點以. sit. n. al. er. score(x, y) = (negated)Distance(x, y) �公式 8�. io. 2.. y. 作為連結預測的結果。. i Un. v. Common Neighbors:此相似度計算公式的設計概念在於,認為在社會網路結構中任. Ch. engchi. 意兩不相連的節點,若其彼此間擁有愈多的共同鄰居結點時,亦即當兩節點各自的鄰居 節點集合的內含元素重複性愈高時,則該兩節點在未來某一時段的社會網路結構中可能 產生連結關係的機會愈大。公式九所示即為其相似度計算公式;其中Γ(x)代表節點 x 的 鄰居節點集合。. 3.. score(x, y) = |Γ(x) ∩ Γ(y)| �公式 9�. Jaccard's Coefficient:Jaccard's Coefficient 是由 Guha 等人於 1998 年所提出,. 經常運用於資訊擷取(information retrieval)領域,其主要是用於度量兩集合所屬 元素之間的相似程度,現假設有 A、B 兩集合,則公式十所示即為此兩集合透過 Jaccard Coefficient 所呈現的相似度值;而當運用至連結預測領域時,選擇將原先的 A、B 集合 20.

(31) 改以網路中任意二節點 x、y 各自的鄰居節點集合來取代,如公式十一所示,因此便可 藉由 Jaccard's Coefficient 計算出 x、y 鄰居節點集合間的相似度;若二節點其鄰居 節點集合彼此間的相似度高,則可推估該二節點未來彼此間產生新連結關係的機率可能 亦會較高。 |A∩B|. Jaccard′ s Coefficient = |A∪B| |Γ(x)∩Γ(y)|. score(x, y) = |Γ(x)∪Γ(y)|. �公式 10�. �公式 11�. 政 治 大 究目的是用於計算、評估任意二個人網頁彼此間相關連的程度;由於考量到任意單一個 立 4.. Adamic / Adar:由 Adamic 和 Adar 所共同提出的此項相似度計算公式,最初的研. ‧ 國. 學. 人網頁均是由多數以上的特徵元素所構成,所以他們認為當衡量兩個人網頁彼此間的相 似程度時,應將兩個人網頁所共同具有的多項特徵元素一併納入考量;此外又考量到若. ‧. 兩個人網頁所共同擁有的單一項特徵元素愈為特殊,亦即該項特徵元素的出現頻率愈低、. sit. y. Nat. 非為大部分網頁所共同擁有,則可推估此二個人網頁的彼此相關程度應該愈高;綜合上. io. er. 述兩項推論故其相似度計算公式的設計便是以任意二個人網頁所同時具有的多項特徵. al. iv n C h e n gx,y 的計算公式;其中 z 代表任意二個人網頁 i U c h所共同具有的特徵元素。 n. 元素的出現頻率倒數總和為計算基礎。公式十二所示即為其針對個人網頁彼此間相似度. 1. score(x, y) = ∑z log �frequency. (z)�. �公式 12�. 而當將上述個人網頁相似度計算公式運用至社會網路分析領域中時,可將原先考量 的多項共同特徵,轉換為任意二節點所共同擁有的多項鄰居節點,而原先單一特徵元素 的出現頻率,則相對應於轉為該共同鄰居節點的鄰居節點個數。公式十三所示即為當運 用至社會網路分析領域時,任意兩節點彼此間相似程度的計算公式。 1. 5.. score(x, y) = ∑z←Γ(x)∩Γ(y) log |Γ(z)|. �公式 13�. Preferential Attachment:此項理論起源於網路成長模型領域,其所提出的基本. 21.

(32) 假設為:在一網路結構擴展的演化過程中,形成一包含網路中單一節點 x 的新連結關係 的機率將與該節點 x 所擁有的鄰居節點個數成正比。Newman 和 Barabasi 以此項假設為 依據,佐以實驗上的數據成果為輔助,將其進行更深一層的推論而提出:網路結構中任 意兩節點 x,y 彼此間於未來某一時段產生新連結關係的機率將與該 x,y 節點各自的鄰居 節點個數乘積成正比。公式十四所示即為其相似度計算公式。. 6.. score(x, y) = |Γ(x)| ∙ |Γ(y)| �公式 14�. Katz:此項理論選擇從任意兩節點彼此間相互連接的路徑數量多寡的角度切入觀. 政 治 大. 察,其認為當兩節點彼此間相互連接的路徑數量愈多,同時其中又以較短長度的路徑數. 立. 量所佔比率較多時,則可推估該兩節點彼此間的相似程度應該較高;故其相似度計算公. ‧ 國. 學. 式是以任意兩節點彼此間不同長度路徑數量的總和,作為評量該兩節點相似程度的基準, 其中並藉由一設定參數β來調整對於不同長度之路徑的權重計算。其相似度計算公式如. ‧. ⟨ℓ⟩. y. Nat. 公式十五所示,其中pathx,y 代表從節點 x 到節點 y 路徑長度為ℓ的路徑集合。 ⟨ℓ⟩. al. sit. er. io. ℓ score(x, y) = ∑∞ ℓ=1 β ∙ �pathx,y � �公式 15�. iv n C hengchi U 由一遞迴關係概念所構成,認為任意兩節點彼此間的相似程度會因為與該兩節點相連的 SimRank Algorithm:此演算法是由 Glen 與 Jennifer 所提出,其基本理論基礎是. n. 7.. 其他節點彼此間相似程度的高低而受到影響;舉例來說,現欲探討 a、b 兩節點間的相 似程度,其中 a 節點與 c 節點相連,而 b 節點則與 d 節點相連,此時若已知 c 節點與 d 節點彼此間相似程度較高,則可推估 a、b 兩節點彼此間的相似程度應該亦會較高。公 式十六所示即是將上述的基本理論精神以算式方式來呈現。. score(x, y) =. ⎧1 ⎪. ,if x = y. |Γ(x)| |Γ(y)|. �公式 16� c ⎨ � � score �Γi (x), Γj (y)� ,c ← [0,1],if x ≠ y ⎪|Γ(x)||Γ(y)| i=1 j=1 ⎩. 當欲計算任意二節點 x,y 間的相似程度時,若 x 與 y 相同,亦即希望計算單一節點. 22.

(33) 與自身的相似度時,其值為 1;若 x,y 為不同節點時,則須先取得 x 節點的鄰居節點集 合中任一節點(亦即Γi (x))與 y 節點的鄰居節點集合中任一節點(亦即Γj (y))彼此間的. 個別相似度值(亦即score �Γi (x), Γj (y)�),再將所有的個別相似度值依序累加取得總計. 後以做為計算 x,y 二節點相似度的基礎;其中參數 c 為一相似度遞減參數,其值介於 0. 和 1 之間;此參數設計的目的主要是用於顯示任意兩節點彼此間相似度受到其鄰居節點 彼此間相似度的影響效果將會呈現遞減現象;舉例來說,現假設有一節點 a 同時與二節 點 b、c 相連結,而 b、c 間互不相連;則經由 SimRank 演算法原理可知 b、c 二節點彼. 政 治 大. 此間的相似度將可透過 a 節點來進行計算,亦即score(b, c) = socre(a, a),但已知其中 a. 立. 節點與自身的相似度為 1(亦即 score(a,a)=1) ,此時若因此推估節點 b、c 間的相似. ‧ 國. 學. 度為 1,亦即 b、c 兩節點為相同節點將有違一般常理推估,因而設計一遞減參數 c 使得. ‧. score(b, c) = c ∙ socre(a, a),以顯示任意兩節點間相似度受到其周遭鄰居節點彼此間相. 似度影響的遞減現象。. y. sit er. al. n. 1. io. 0. Nat. R 0 (x, y) = �. Ch. |Γ(x)| |Γ(y)|. i Un. v. , if x ≠ y , if x = y. ⎧ c ⎪ � � R k �Γi (x), Γj (y)� ,c ← [0,1] , if x ≠ y R k+1 (x, y) = |Γ(x)||Γ(y)| �公式 17� i=1 j=1 ⎨ ⎪1 ,if x = y ⎩. engchi. 公式十六中所示為 SimRank 演算法的基本理論精神,而公式十七所示則為實際進行. 任意二節點間相似度計算時的遞迴公式;其中R k (x, y)代表當進行至第 k 次遞迴時節點 x、 y 間的相似度,而 k 值代表了所期望進行的遞迴次數,可依照實際計算需求自行設定; 從上述公式中可以得知,每次進行第k + 1次相似度計算(R k+1 (x, y))時,均是以第k次. (R k (x, y))所得的相似度值為基礎累積計算;其中並明確定義出當進行至第 0 次遞迴. 計算(R 0 (x, y))時節點 x、y 間的相似度計算法則,以做為整個遞迴流程的計算終止點。 而根據 Glen 與 Jennifer 所提出的數學推論證明中可以得知,當 k 值設定趨近於無限大 23.

(34) 時,也就是在經過無限次的遞迴計算過程後,所得的R k (x, y)將會趨近於score(x, y),也. 就是趨近於節點 x、y 間真正的相似度值。如公式十八所示。 limk→∞ R k (x, y) = score(x, y). �公式 18�. 2.3 小結 透過上述針對社會網路分析領域以及連結預測理論方面的文獻整理,可發現社會網 路分析兼具微觀與巨觀的切入角度,對於誠如政府人事異動資料庫此種總體資料量龐大,. 政 治 大. 但從單筆資料來看,從中所能獲得的資訊卻較為有限的特性,提供了一種極為適切的觀. 立. 察方式;此外,連結預測理論中所引入的時間以及相似度的概念,亦可符合我們對於在. ‧ 國. 學. 探討職務歷程的相似程度,是否會對職位接替人選的抉擇上造成影響的研究需求。. ‧. 因而在本篇研究中,主要便是從政府人事異動資料庫中擷取出相關的異動資訊,透 過以網路結構的方式,具體呈現出在人事異動過程中,每一人員與其曾經擔任過的職位. y. Nat. er. io. sit. 間的連結關係,其後再經由從社會網路分析領域的角度切入,運用連結預測理論的相關 演算法,期望能藉由其內關於相似度計算的核心概念,針對所選定的任一特定職位,找. n. al. Ch. i Un. v. 出與其歷任人員的職務歷程相似度較高的人選,以作為未來可能擔任該職位的預測人選. engchi. 之一;之後再藉由套用至不同的實驗設計模式之中,取得預測準確率的實驗數據結果, 以來分析探討各個部門的不同職位,對於其後續接替人選的考量上,各別受到其歷任人 員的職務歷程的影響程度。. 24.

(35) 第三章. 人物異動網路之建置與系統架構. 每當政府機構中一重要職位產生空缺時,往往總是會立刻成為社會大眾關注的焦點 新聞之一。該職位後續的接替人選可能包括哪些政治人物呢;接替該職位所需具備的條 件有哪些呢;該職位歷任官員的經歷是否有相似之處呢;以及曾經擔任過的相關職務歷 程是否會成為影響上位者決定接替人選的篩選條件之一呢;上述種種相關論述均是針對 預測職位接替人選時的常見相關推論,為了能夠以數據化的方式呈現上述推論,因而在 本研究中選擇以政府官員異動資料庫中的人事異動記錄為基礎,建置出人物異動社會網. 政 治 大. 路,並藉由針對特定職位進行預測接替人選的方式,分析所得預測結果實驗數據,以呈. 立. 現並探討歷任官員職務歷程的相似程度對於後續接替職位人選的影響程度。. ‧ 國. 學 ‧. 3.1 人物異動網路建置. sit. y. Nat. 在本研究中所建置的人物異動網路,主要是依據政府官員異動資料庫中的人事異動. io. er. 紀錄建置而成。從所設定的異動時間區段中,依序取出每一筆異動紀錄中的姓名、職等、. al. iv n C hengchi U 一種類型的節點,稱為人物節點;而異動部門和異動職位資訊則共同結合產生另一種類 n. 異動部門、異動職位以及異動公告年月日相關欄位的資訊,將其中的人物姓名資訊形成. 型的節點,稱之為職務節點;故我們所建置的人事異動網路實質上為一 2-mode 網路, 其中包含有兩種類型的節點:人物節點和職務節點。 依據每一筆異動紀錄中的資訊,可得知該名人物在公告時間點時被調動至不同的部 門和職位,因而將所產生的人物節點和職務節點間建立連結;由於單一人物在異動時間 區隔內可能產生多次異動,故單一人物節點可與多個不同職務節點產生連結;相對的, 單一職務節點在異動時間區隔內,亦有可能依序由不同的人物負責擔任,故單一職務節 點也可與多個不同人物節點產生連結。而在相同類型的節點彼此間,例如不同人物節點 或者不同職務節點彼此間,則無連結關係的建立。 25.

(36) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. 圖 3-1. engchi. i Un. v. 人物異動網路示意圖. 綜合上述所言可知,我們所建置的人物異動網路是一 2-mode 網路,其中包含有人 物節點與職務節點兩種不同類型的節點,而網路中的連結關係主要是建立於二種不同類 型的節點之間,相同類型的節點彼此間則無連結的建立。透過此種設計模式所建立的社 會網路,可藉由參數的設定不同來調整所建置之網路規模大小,其中可供調整的參數分 為異動時間區隔以及職等設定二類。圖 3-1 中所示即為異動時間區隔設定為 20 年,職 位階層在主管以上層級的人物異動網路示意圖,其中綠色節點代表職務節點,黃色節點 則代表曾經擔任過該職務的人物節點,所有的連結關係僅建立於不同類型節點之間。 26.

(37) 藉由設定不同的異動時間區隔,可以以此來觀察不同年代的異動資料,是否會對於 特定職位接替人選的預測準確率造成不同程度的影響;而職等參數的設定,則可以協助 我們將整體資料量極為龐大的政府官員異動資料庫劃分為事務官與政務官兩種層級進 行分析。 由於在目前現行的公務人員制度規範下,僅有事務官(如司長等)具有職等的規定, 且其所訂定的最高職等為 14 職等,所以在本研究中沿用[3]的制訂方式,以事務官的最 高職等(14 職等)為基準,賦予政務官以及各高階職務中未有職等規定的職務一虛擬職. 政 治 大. 等,如縣市長及其副官分別為 16 與 15 職等、各級部長及其秘書長為 16 職等、副部長. 立. 為 15 職等、各院會院長及其副院長分別為 18 與 17 職等、總統則為 19 職等;並選擇將. ‧ 國. 學. 資料庫中 14 職等以下的職位歸類為事務官,而 15 職等以上的職位則歸類為政務官,以 各別進行預測分析;透過此種職等設計的方式,我們便可選擇以低於所期望預測職位職. ‧. 等二職等的所有人員及其相關的異動資訊,來建構出系統進行預測時所需的人物異動網. Nat. sit. y. 路,以有效控制建置出的社會網路的規模大小,同時這也是考量到在一般情況下政府機. n. al. er. io. 構中的人事調動,其在一次職位調動的過程中,通常較少出現一次跨越 3 職等以上的情. i Un. v. 形;亦即當進行人事調動時,若其原先的職位職等為 12 職等,則調動後的職位職等通. Ch. engchi. 常不會出現一次即調動至 15 職等以上的情形。. 3.2 研究方法分析 為了探討特定職位的接替人選抉擇受到與歷任人物的職位歷程相似度的影響程度, 我們希望能夠以曾經擔任過該特定職位的所有人物集合為基礎,依序找出曾經擔任過的 職務歷程與前述人物極為相似的候選人物集合,經過綜合評比分析取出職務歷程相似度 值最高的前 n 名,以做為該特定職務的預測接任人選集合;其後若實際的接任人選確實 出現於預測接任人選集合中,則可依此推估當該特定職位產生空缺時,上位者在斟酌其. 27.

數據

圖 3-4  系統運作流程圖
圖 3-5  Seed Network 示意圖
圖 3-6  Prediction Network 示意圖
圖 3-7  Network Module 內部二子程序建構 2-mode 網路運作流程圖
+3

參考文獻

相關文件

勞動部勞動力發展署桃竹苗分署-幼 獅職業訓練場(前行政院勞工委員會 職業訓練局青年職業訓練中心)、臺 北市立南港高級工業職業學校 39 資訊與網路技術 1 林家諄

中華人民共和國於 1949 年建立。建國初期,政府提出建設社會主義的目標,推 行不同的政治、經濟和社會的規劃與建設;但在 1966 年至

但三路之中左右兩 路的主要目的是牽 制敵人,中間沿穎 水南下一路才是主 戰力所在。又,前 秦動員規模過於龐 大,在軍事行動展

職業 教師 輔導員 神職人員 社會工作者 記者.

全國人民代表大會常務委員會在徵詢其所屬的香港特別行政區基本法委

本書立足中華文化大背景,較為深入系統地分析研究了回族傳統法文化的形成基礎、發展歷

香港特別行政區應當通 過學校、社會團體、媒 體、網絡等開展國家安 全教育B. 香港特別行政區應當盡早

本研究將針對 TFT-LCD 產業研發單位主管與研發人員進行 探討,並就主管於研發人員對職能重視程度作差異性分析。因此