隨機效應模型法 - 研究方法 - 矩陣分解法與隨機效應模型法應用於電影評分資料分析比較

第三章研究方法

3.2 隨機效應模型法

Chin et al.（2015）便提出以 lock-free scheduling 解決此問題，根據安排的線程數 𝑠 ，系統會將區塊至少分割成 (𝑠 + 1) × (𝑠 + 1) 個區塊，如此能確保在最多 𝑠 塊被同步運行時，必定至少有一塊獨立區塊可供先完成線程接續運行。

另外，SGD 是隨機選取樣本點來進行更新，必然會不連續地訪問內存記憶體中的數據，進而造成memory discontinuity，又 Chin et al.（2015）實驗顯示若將運算過程完全依使用者或項目排序後訪問，收斂結果可能不如隨機訪問來得好。

Chin et al.（2015）便折衷提出了 partial random method，當一個線程要訪問一個新的區塊，是從被訪問次數最少的幾個獨立區塊中隨機選擇一個，為提高

rectools 封包由 Matloff（2017）開發，是個整合最近鄰法、矩陣分解法、

隨機效應模型法等協同過濾技術，以及平行化運算的封包，本研究會使用到當中與隨機效應模型法相關的函數。

3.2.1 最大概似法

Rectools 封包中使用到 Bates et al.（2017）所開發的 lme4 封包，以最大概似法處理隨機效應模型和混合效應模型，然而隨機效應模型不過是混合效應模型的特例，因此本小節會以較一般的混合效應模型結構進行論述。

‧

relative covariance factor, 𝛬_𝜃 與 variance-component parameter, 𝜃 有關，根據下式生成 𝑞 × 𝑞 的共變異數矩陣 𝛴

𝛴_𝜃 = 𝜎²𝛬_𝜃𝛬_𝜃^𝑇 （3.7）

再定義一個spherical random effects, 𝒰 ~ 𝑁(0, 𝜎²𝐼_𝑞) 並令其與 ℬ 的關係為

ℬ = 𝛬_𝜃𝒰 （3.8）

重新表現（3.7）式的條件分配為

‧

Bates et al.（2015）以最大概似法配適模型時，會不斷的利用到懲罰最小平方法（Penalized Least Squares, PLS），具體來說，就是要最小化受懲罰的加權殘差平方和（Penalized Weighted Residual Sum of Squares）

𝑟²(𝜃, 𝛽, 𝑢) = ‖𝑊^1/2(𝑦 − 𝑋𝛽 − 𝑍𝛬_𝜃𝑢)‖²+ ‖𝑢‖² （3.10） Cholesky decomposition

[𝛬_𝜃^𝑇𝑍^𝑇𝑊𝑍𝛬_𝜃+ 𝐼 𝛬_𝜃^𝑇𝑍^𝑇𝑊𝑋

‧

概似法（Restricted Maximum Likelihood），相較於一般的最大概似法，限制最大概似法最大化一個移除固定效應影響的概似函數，以獲取不偏的變異數成分

（Variance Component）估計值，較適用於具有隨機效應的統計模型上。

本研究便選擇以限制最大概似法估計參數，其概似函數會與一般的最大概

Rectools 封包以 Gao & Owen（2016）所提出的方法為基礎，開發以動差法處理隨機效應模型的函數。若 𝑟_𝑢𝑖 作為反應變數表使用者 𝑢 對項目 𝑖 的評分，則

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

其中 𝜇 為固定效應，表示不受使用者和項目影響下的平均評分； 𝜏_𝑢 、 𝛼_𝑖 為隨機效應，分別表示評分來自第 𝑢 個使用者和第 𝑖 個項目的影響，以 𝜎_𝛵² 、 𝜎_𝛢² 描述其異質性； 𝜀_𝑢𝑖 表示評分來自其他未知因素之影響，以 𝜎_𝐸² 描述其異質性。

Gao & Owen（2016）使用動差法來估計變異數成分，並應用其在估計未知的 𝑟_𝑢𝑖 上，他們從最佳線性預測量（Best Linear Predictor）角度切入，得到一個在計算效率不是那麼好的結果，因此考慮一個限制較多的線性預測量稱作 shrinkage predictor，並給出一個定理。

若 𝑁_𝑢∙ 表示第 𝑢 個使用者的評分數， 𝑁_∙𝑖 表示第 𝑖 個項目的被評分數，假設對於某個 𝜂 ∈ (0, 1) 滿足 1 𝜂⁄ ≤ 𝑁_𝑢∙≤ 𝜂𝑁 和 1 𝜂⁄ ≤ 𝑁_∙𝑖 ≤ 𝜂𝑁 ，且 0 < 𝜇², 𝜎_𝐴², 𝜎_𝐵², 𝜎_𝐸² < ∞ ，那麼使用者 𝑢 對項目 𝑖 的預測評分 𝑟̂_𝑢𝑖 可得

𝑟̂_𝑢𝑖 = (𝑟̅_𝑢∙+ 𝑟̅_∙𝑖− 𝑟̅_∙∙)(1 + 𝑂(𝜂)), as 𝜂 → 0 （3.20）

其中 𝑟̅_𝑢∙ 為使用者 𝑢 的平均評分， 𝑟̅_∙𝑖 為項目 𝑖 的平均評分， 𝑟̅_∙∙ 為整個歷史資料的平均評分。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

在文檔中矩陣分解法與隨機效應模型法應用於電影評分資料分析比較 - 政大學術集成 (頁 22-27)

隨機效應模型法

第三章 研究方法

3.2 隨機效應模型法

‧

‧

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

第三章研究方法

立政治大學

立政治大學