第一章 前言
1.4 論文架構
本研究分爲四個章節,第一章概述研究動機及目的,第二章介紹雇主品牌的 定義及相關的研究,第三章説明我們所提出用來分析雇主品牌的幾個工具,包括 分析雇主吸引力及雇主品牌忠誠,第四章是實驗結果及結論。
4
5
Turban & Greening 針對企業社會績效(Corporate Social Performance, CSP)、 企業聲譽(Corporate Reputations)與企業對潛在僱員的吸引力(attractiveness)
的關係做了研究,結果顯示,具有良好企業社會績效及企業聲譽的公司,對潛在 僱員也有較高的吸引力[19]。
圖 2.1 Backhaus & Tikoo’s Employer branding framework [7]
對於分析雇主品牌的方式,主要延伸自傳統的產品品牌或公司品牌研究的方 法,有質化研究及量化研究兩類方式[14]。質化研究主要是由研究員定義研究範 疇,招募相關受訪者,透過各種形式的訪談,由研究員歸納後給出綜合結論。量 化研究先由研究員定義與雇主品牌相關的題目、受測對象及衡量指標,透過問卷 調查的形式,蒐集相關回饋後,採用統計方法分析數據,由研究人員歸納後提出 報告,附錄一是雇主品牌調查的問卷設計範例[4]。
企業管理者需要知道自己的公司跟其他公司間的雇主品牌差異,用來理解所 屬 企 業 在 市 場 中 的 定 位 及 競 爭 力 , 這 時 就 需 要 有 能 夠 做 比 較 的 標 竿
(Benchmarking)。傳統雇主品牌研究的比較基準通常來自該研究機構過去曾經 執行的專案所蒐集的資訊,但因爲單一機構能執行的專案有限,所以涵蓋的樣本 不足且可能有時效的問題。另外一個方法是取用媒體(如富比世、Fortune、Cheers
6
7
(Linkedin)提出 LinkedIn Talent Brand Index[23],並包裝成產品銷售給客戶用 以提升企業對潛在僱員的吸引力。LinkedIn Talent Brand Index 的意義是在特定 企業觸及(Reach)的潛在僱員中同時對該企業感興趣的比率,雖然該指標沒有 公開詳細演算法,但提及其關係因子,對該企業感興趣的使用者(Talent Brand Engagement)統計了有拜訪該企業公司頁或職涯發展頁(Linkedin 的僱主品牌產
8
品)的使用者、追蹤該企業的使用者、瀏覽該企業工作及應徵該企業工作的使用 者等,該企業觸及的使用者(Talent Brand Reach)則統計看過曾任或現任該公司 僱員的個人檔案及與該公司僱員有連結(Connection)的使用者,然後定義企業 的 LinkedIn Talent Brand Index 為企業品牌觸及的人選中同時對其感興趣的比率,
企業可藉由此工具了解其對潛在雇員的吸引力。
9
第三章 研究方法
3.1 問題定義
雇主品牌主要目的是對外塑造一個留在潛在僱員心中的印象,傳達公司的文 化、價值觀等,希望能吸引他們願意到企業工作,此即雇主吸引力。對內建立員 工對公司願景的認同與提升向心力,希望能持續留住人才,此即雇主品牌忠誠。
因此衡量雇主品牌意味著衡量雇主吸引力(對潛在僱員)及衡量雇主品牌忠誠(對 現有僱員)。
我們希望研究的結果能提供未來產品應用所需的技術,預期產品架構如圖 3.1。雇主品牌分析工具有兩個主要功能,一是雇主吸引力分析,一是雇主品牌 忠誠度的分析,並能依據時間、職類等維度切割,且提供競業間比較。
圖 3.1 預期雇主品牌產品架構圖
10
11
或被動接受系統推薦等方式取得職缺資訊,每一個使用者看一次職缺廣告的行爲 稱爲一次的職缺廣告曝光(Pageview),同一個人看同一個職缺廣告兩次就會產 生該職缺廣告兩次曝光,但因爲是同一個人,所以對該廣告的不重複訪客數
(Unique User)只有一個。
一個公司會刊登超過一個以上的職缺廣告,若將一定期間內該公司所有的職 沒有考慮到徴才條件的難易度及人才市場供給的狀況。Barrow & Mosley 的研究 中提到雇主品牌經營的目的是確保能建立夠大的人才庫,再從中篩選出品質滿足 企業要求的優秀人才,夠大的人才庫的前提是能吸引到的夠多的人才量,也就是
12 Endorsement Network G。
G(V,E) 是一個 Directed Weighted Graph,V 是公司的集合,E 是在兩 公司間的轉職行爲形成的 Edge 的集合,如下圖 3.2。其中,edge <a, b>
上的權重代表由 a 公司轉職到 b 公司的人數。
13
圖 3.2 透過經歷資料庫建立的公司關聯圖
2. 透過圖形分析及網路探勘的演算法,找出影響力高的節點。我們選用以 下五種演算法,
PageRank[12]
PageRank 是爲了提升網頁搜尋體驗設計的演算法,改善傳統資訊 檢索的缺點。PageRank 假設每個網頁都有一個重要性分數,被越 多人連結到的網頁就越重要,利用網頁間有向的連結結構所形成的 Graph ,經過遞迴計算,最後會收斂幫每個網頁算出一個排名的分 數。
14
d:damping factor,依照網路結構繼續轉職的機率,預設 0.85
HITS (Hubs / Authorities) [15]
HITS (Hyperlink-Induced Topic Search)演算法是利用網頁間的連 結結構來分析網頁的重要性。HITS 演算法假設一個好的目錄頁會 蒐集夠多的好資訊頁的連結,透過 Hyperlink 指到多個有用的網頁;
反之一個權威資訊的網頁會被很多個目錄頁面連結到。每個網頁同 時存在這兩種特質,Hubs 跟 Authorities,遞迴計算整個網路中的 所有節點的 Authority 及 Hub。
15
Eigenvector Centrality[11]
在圖形理論(Graph Theory)中,Eigenvector Centrality 的假設是 一 個 節點 的重 要性 要看 它 是否 被其 他重 要的 節 點連 到。 根 據 Perron–Frobenius theorem 我們可以找到一個最大的 eigenvalue 𝜆 使得 eigenvector 𝑥 的所有元素皆為正數,並將 𝑥 的元素定義為
Betweenness Centrality[13]
在圖形理論中,Betweenness Centrality 的假設是在一個圖形中,如 果某節點影響力高,表示其他節點要相連時都需要經過它。
16
Closeness Centrality[9]
在圖形理論中,Closeness Centrality 的假設是重要的節點離大家比 較近。其方法是計算這個點到其他點的最短路徑的距離的平均值取
3. 分析步驟 2 計算的 PageRank、Authority、Hub、Eigenvector Cetrality、
Betweeness Centrality、Closeness Centrality 即可瞭解各公司的雇主品牌 對潛在僱員的吸引力差異。
17 模型』(Retention Model),並透過比較不同公司的留任模型差異將公司分群,各 群的結果聚合後得到基準模型,未來其他公司就能跟基準模型比較,瞭解自己公 司的留才模型與市場的距離,與哪些標竿企業較接近,以評估是否符合期望或需 要調整留才策略,詳細步驟如下述。
1. 計算人力銀行的履歷資料庫資料中每份經歷在公司的任職期間,如圖 3.3 。
18
2. 利用 Kernel Density Estimation(KDE)[17] 將各公司的不同任職期間 的人數轉換成機率密度函數(Probability Density Function),我們定義 它爲該公司的員工留任模型,如圖 3.4。
圖 3.3 計算每份經歷任職期間長度
圖 3.4 透過 KDE 轉換出公司的員工留任模型
19
3. 透過 Kullback–Leibler Divergence(KL 散度,或稱 Relative Entropy,
相對熵)[16] 計算各公司的員工留任模型彼此之間的距離。但因 KL Divergence 是非對稱的,即
𝐷
𝐾𝐿(𝑃 ∥ 𝑄) ≠ 𝐷
𝐾𝐿(𝑄 ∥ 𝑃)
( 9 )𝑃,𝑄:兩個不同的機率分佈 𝐷𝐾𝐿:Kullback–Leibler Divergence
所以我們定義兩個公司的員工留任模型的距離爲
𝐷𝑖𝑠𝑡
𝑎,𝑏= min(𝐷
𝐾𝐿(𝑃
𝑎∥ 𝑃
𝑏) , 𝐷
𝐾𝐿(𝑃
𝑏∥ 𝑃
𝑎))
( 10 )𝑃𝑎,𝑃𝑏:a, b 兩公司的留任模型,是兩個機率分佈 𝐷𝐾𝐿:Kullback–Leibler Divergence
計算後得到一個兩兩公司間的距離矩陣。
20
( PageRank 、 HITS 、 Eigenvector Cetrality 、 Betweeness Centrality 、 Closeness Centrality)分析,將計算的結果與『職缺廣告的曝光數』及
『不重複訪客數』透過相關係數(Spearman's rank correlation coefficient)
做相關性分析,藉此評估演算法的有效性。
3. 針對 3.3 『衡量雇主品牌忠誠』,我們先透過 Kernel Density Estimation 將各公司的履歷資料轉化成員工留任模型,再用 KL Divergence 計算 所 有 公 司 彼 此 間 員 工 留 任 模 型 的 距 離 , 然 後 將 公 司 依 照 距 離 用 Hierarchical Clustering 分群,觀察後決定分割的群數,最後計算各群的 平均模型。
21
4.2 資料來源
人力銀行經歷資料庫(至 2013 年底)
用途:透過所蒐集的所有求職會員履歷建立公司關係圖。
資料量:約 650 萬會員(詳細數字爲公司的營業祕密無法公開)。
人力銀行求職者行爲記錄(2017/01 - 2017/06)
用途:計算各公司職缺廣告曝光作爲衡量演算法效果的依據。
資料量:99,847,890 筆 / 涵蓋 915 家上市櫃及五百大公司。
此資料爲 2017 年 104 Hackathon 公開資訊[20]。
4.3 資料前處理
整併履歷資料中公司名稱的歧異,建立同義詞庫,如下例,
7-11/統一超商 7-11/統一 7-11/統一超商
台灣積體電路股份有限公司/台積電/TSMC
排除使用者填寫了不具體的公司名稱,如下例,
藥品公司/環保公司/XX 科技
排除提及數量小於 100 的公司名稱。
上述步驟完成後,還有 284 萬筆經歷資料,涵蓋 5,699 間公司。
22
firm_name page_view unique_user
1 台積電 1,237,481 113,774
23
圖 4.1 是各公司的職缺廣告的曝光數與不重複訪客數間的關係,左上角及 右下角是兩個變數的機率分佈狀況,觀察可知兩個變數間具有高度相關性,且兩 變數的分佈皆類似 Power law distribution 。由職缺廣告的曝光數與不重複訪客數 的分佈狀況(圖 4.1 左下)可發現,大部分的公司僅吸引到少量的求職者,僅有 少數公司能吸引到大量的求職者,兩者之間的數量差異相當懸殊。
圖 4.1 職缺廣告的曝光數與不重複訪客數關係圖
24
4.4.2 衡量雇主吸引力:公司網路探勘
接著執行步驟 3.2.2 公司網路探勘,先將經歷資料庫轉換成 Entriprise Endorsement Network,圖形的節點代表公司,共有 5,699 家不同的企業,圖形 的邊代表兩公司之間有發生的轉職行爲,累計轉職人數爲該 Edge 的權重,共有 460,921 條邊。點與點的最短路徑平均距離是 2.38。
圖 4.2 是公司轉職關係圖的 Degree 分佈,近似 Power law 分佈,Degree 平均是 80.9,有 79.47% 的公司 Degree 介於 0-100 之間。
圖 4.2 公司轉職關係圖的 Degree Distribution
25
圖 4.3 是 In-Degree 跟 Out-Degree 的關係,藍色虛線上方是 Out-Degree 大於 In-Degree 的公司,其意義是離開這類型的公司後選擇的出路很多元,以標 示紅色的點爲例,包含連鎖便利商店、速食店、加油站等,推測主要原因是很多 勞工會選擇進入門檻較低的服務業作爲初入職場或轉換職務過程中的過渡工作,
待有更符合自身專業的工作後就會轉換到較能發揮的領域,因此進入與流向都很 多元。
圖 4.3 公司的 In-Degree 及 Out-Degree 關係圖
接著分別計算 PageRank (pr)、HITS - Authority (auth) & Hub (hub) 、 Eigenvector Centrality (ec)、Betweenness Centrality (bc)、Closeness centrality (cc),
並與上述職缺廣告曝光數及不重複訪客數比較其相關性,結果如下表 4.2 。
26 有選用 Pearson product-moment correlation coefficient 來分析。但若不考慮分佈
26 有選用 Pearson product-moment correlation coefficient 來分析。但若不考慮分佈