• 沒有找到結果。

二階段矩陣分解:插補矩陣與奇異值分解

第四章 實證研究

4.4 二階段矩陣分解:插補矩陣與奇異值分解

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

30

因此,由圖 4.2 與圖 4.3 得知,由於使用者對項目的評分筆數增加,使得評 分矩陣能夠較為完整,降低評分稀疏性質,RMSE 大幅降低,造成推薦系統能夠 更準確地提供項目給予使用者,明顯提升其推薦的效能。

4.4 二階段矩陣分解:插補矩陣與奇異值分解

本節利用 MovieLens 100K,詴圖利用潛在因子模型與奇異值分解再加上資 料插補的方式來改善推薦系統的效能。

4.4.1 基本想法與改進方法步驟

我們先利用潛在因子模型來獲得預測的評分矩陣,並將原始評分矩陣補齊,

接著將補齊的評分矩陣進行奇異值分解,而對角矩陣的維度則取f=10,最後,

利用“奇異值分解插補改進方法”找出的預測評分矩陣,使用此矩陣求得到模型 改進後的 RMSE。

本研究將模型改進方法的步驟整理如下:

1. 使用訓練集並利用潛在因子模型求出預測的評分矩陣。

2. 將預測評分矩陣插補至原始的評分矩陣,將原本空缺的評分補足。

3. 利用補齊後完整的原始評分矩陣進行奇異值分解(奇異值分解)。

數學式子表示如下:

𝑅̂ = 𝑈

𝑓 𝑓

𝑆

𝑓

𝑉

𝑓 𝑇

其中𝑅 ∈ ℝ

𝑚×𝑛

,𝑈 ∈ ℝ

𝑚×𝑘

,𝑆 ∈ ℝ

𝑘×𝑘

,𝑆 ∈ ℝ

𝑛×𝑘

𝑈

𝑓

、𝑆

𝑓

、𝑉

𝑓 𝑇

為降維後的矩陣

此處,本研究的 f 一律取 10,因此可得到一個降維後的預測評分矩陣,也 就是𝑅̂ 。

𝑓=10

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

31

4. 使用測詴集針對“奇異值分解插補改進方法”所得到預測評分矩陣求出 RMSE。

關於奇異值分解中的 f 之選取, 其概念類似於主成分分析中該如何選取多 少個主成分來代替原來的變數,為了達成精簡的目標,本研究選取 f 的原則為由 奇異值對奇異值個數畫散佈圖,又稱除坡圖(Scree Plot)。找到圖中開始平坦的 點,即為我們所需要的 f 個數。

首先,將未加入偏誤項的隨機梯度下降法所得到的預測結果,插補於原矩陣 中,進行奇異值分解,其除坡圖如圖 4.3。從圖中可以發現,在 f 為 10 後,下 降速度減慢,趨為平緩,因此在奇異值分解插補改進方法─未加入偏誤項的隨機 梯度下降法中,f 取 10。

將加入偏誤項的隨機梯度下降法所得到的預測結果,插補於原矩陣中,進行 奇異值分解,其除坡圖如圖 4.4。從圖中可以發現,在 f 為 10 後,下降速度減 慢,趨為平緩,因此在奇異值分解插補改進方法─加入偏誤項的隨機梯度下降法 中,f 取 10。

接著討論奇異值分解插補改進方法─未加入偏誤項的交替最小平方法與加 入偏誤項的交替最小平方法。觀察其除坡圖,在圖 4.5 與圖 4.6 可以發現在 f 為 10 後,下降速度減慢,趨為平緩,因此在奇異值分解插補改進方法─未加入 偏誤項的交替最小平方法與加入偏誤項的交替最小平方法中,f 皆取 10。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

32

圖 4.3 奇異值對奇異值個數─未加入偏誤項的隨機梯度下降法

圖 4.4 奇異值對奇異值個數─加入偏誤項的隨機梯度下降法

圖 4.5 奇異值對奇異值個數─未加入偏誤項的交替最小平方法

圖 4.6 奇異值對奇異值個數─加入偏誤項的交替最小平方法

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

34

雖然『奇異值分解 +加入偏誤項的隨機梯度下降法』的 RMSE 大於『奇異值 分解 +加入偏誤項的交替最小平方法』,但觀察運算時間時,隨機梯度下降法的 模型的運算時間約四分鐘,所需時間遠遠短於交替最小平方法。

確實,藉由加入偏誤項的交替最小平方法能夠得到精確的預測結果,但卻 犧牲運算時間,需要花較多的時間進行預測以達到更精確的結果。相反地,隨 機梯度下降法縮短運算時間,犧牲了能夠得到更小的 RMSE,但卻藉由“奇異值 分解插補改進方法”大幅降低 RMSE,得到一個還算不錯的預測結果。因此,在 時間與精確度的選擇以及模型的改進,都是設計推薦系統的人需要從中做出取 捨與改變。

相關文件