第三章 研究方法
3.2 隨機效應模型法
Chin et al.(2015)便提出以 lock-free scheduling 解決此問題,根據安排的 線程數 𝑠 ,系統會將區塊至少分割成 (𝑠 + 1) × (𝑠 + 1) 個區塊,如此能確保在最 多 𝑠 塊被同步運行時,必定至少有一塊獨立區塊可供先完成線程接續運行。
另外,SGD 是隨機選取樣本點來進行更新,必然會不連續地訪問內存記憶 體中的數據,進而造成memory discontinuity,又 Chin et al.(2015)實驗顯示若 將運算過程完全依使用者或項目排序後訪問,收斂結果可能不如隨機訪問來得 好。
Chin et al.(2015)便折衷提出了 partial random method,當一個線程要訪問 一個新的區塊,是從被訪問次數最少的幾個獨立區塊中隨機選擇一個,為提高
rectools 封包由 Matloff(2017)開發,是個整合最近鄰法、矩陣分解法、
隨機效應模型法等協同過濾技術,以及平行化運算的封包,本研究會使用到當 中與隨機效應模型法相關的函數。
3.2.1 最大概似法
Rectools 封包中使用到 Bates et al.(2017)所開發的 lme4 封包,以最大概 似法處理隨機效應模型和混合效應模型,然而隨機效應模型不過是混合效應模 型的特例,因此本小節會以較一般的混合效應模型結構進行論述。
‧
relative covariance factor, 𝛬𝜃 與 variance-component parameter, 𝜃 有關,根據下式 生成 𝑞 × 𝑞 的共變異數矩陣 𝛴𝛴𝜃 = 𝜎2𝛬𝜃𝛬𝜃𝑇 (3.7)
再定義一個spherical random effects, 𝒰 ~ 𝑁(0, 𝜎2𝐼𝑞) 並令其與 ℬ 的關係為
ℬ = 𝛬𝜃𝒰 (3.8)
重新表現(3.7)式的條件分配為
‧
Bates et al.(2015)以最大概似法配適模型時,會不斷的利用到懲罰最小平 方法(Penalized Least Squares, PLS),具體來說,就是要最小化受懲罰的加權殘 差平方和(Penalized Weighted Residual Sum of Squares)
𝑟2(𝜃, 𝛽, 𝑢) = ‖𝑊1/2(𝑦 − 𝑋𝛽 − 𝑍𝛬𝜃𝑢)‖2+ ‖𝑢‖2 (3.10) Cholesky decomposition
[𝛬𝜃𝑇𝑍𝑇𝑊𝑍𝛬𝜃+ 𝐼 𝛬𝜃𝑇𝑍𝑇𝑊𝑋
‧
概似法(Restricted Maximum Likelihood),相較於一般的最大概似法,限制最大 概似法最大化一個移除固定效應影響的概似函數,以獲取不偏的變異數成分(Variance Component)估計值,較適用於具有隨機效應的統計模型上。
本研究便選擇以限制最大概似法估計參數,其概似函數會與一般的最大概
Rectools 封包以 Gao & Owen(2016)所提出的方法為基礎,開發以動差法 處理隨機效應模型的函數。若 𝑟𝑢𝑖 作為反應變數表使用者 𝑢 對項目 𝑖 的評分,則
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
20
其中 𝜇 為固定效應,表示不受使用者和項目影響下的平均評分; 𝜏𝑢 、 𝛼𝑖 為隨 機效應,分別表示評分來自第 𝑢 個使用者和第 𝑖 個項目的影響,以 𝜎𝛵2 、 𝜎𝛢2 描 述其異質性; 𝜀𝑢𝑖 表示評分來自其他未知因素之影響,以 𝜎𝐸2 描述其異質性。
Gao & Owen(2016)使用動差法來估計變異數成分,並應用其在估計未知 的 𝑟𝑢𝑖 上,他們從最佳線性預測量(Best Linear Predictor)角度切入,得到一個 在計算效率不是那麼好的結果,因此考慮一個限制較多的線性預測量稱作 shrinkage predictor,並給出一個定理。
若 𝑁𝑢∙ 表示第 𝑢 個使用者的評分數, 𝑁∙𝑖 表示第 𝑖 個項目的被評分數,假設 對於某個 𝜂 ∈ (0, 1) 滿足 1 𝜂⁄ ≤ 𝑁𝑢∙≤ 𝜂𝑁 和 1 𝜂⁄ ≤ 𝑁∙𝑖 ≤ 𝜂𝑁 ,且 0 < 𝜇2, 𝜎𝐴2, 𝜎𝐵2, 𝜎𝐸2 < ∞ ,那麼使用者 𝑢 對項目 𝑖 的預測評分 𝑟̂𝑢𝑖 可得
𝑟̂𝑢𝑖 = (𝑟̅𝑢∙+ 𝑟̅∙𝑖− 𝑟̅∙∙)(1 + 𝑂(𝜂)), as 𝜂 → 0 (3.20)
其中 𝑟̅𝑢∙ 為使用者 𝑢 的平均評分, 𝑟̅∙𝑖 為項目 𝑖 的平均評分, 𝑟̅∙∙ 為整個歷史資料 的平均評分。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
21