12 這組起始值是Ratings這個package中,生成MCMC樣本的指令ordrating裡所預設的起始值。

國

立政治大學

‧

N a

tio na

l C h engchi U ni ve rs it y

訓練蠱蠰蠰次衍術衅包含資訊

測試集平均數最小值最大值變異數變異係數蠱蠰蠮蠹蠰蠳蠴蠰蠮蠹蠰蠳蠱蠰蠮蠹蠰蠳蠵蠰蠮蠰蠰蠰蠰蠷蠰蠮蠰蠰蠷蠷蠥蠲蠰蠮蠸蠹蠷蠴蠰蠮蠸蠹蠶蠸蠰蠮蠸蠹蠷蠶蠰蠮蠰蠰蠰蠰蠶蠰蠮蠰蠰蠶蠹蠥蠳蠰蠮蠸蠸蠹蠳蠰蠮蠸蠸蠸蠷蠰蠮蠸蠸蠹蠳蠰蠮蠰蠰蠰蠰蠹蠰蠮蠰蠱蠰蠥蠴蠰蠮蠸蠹蠸蠳蠰蠮蠸蠹蠸蠳蠰蠮蠸蠹蠸蠴蠰蠮蠰蠰蠰蠱蠷蠰蠮蠰蠱蠹蠥蠵蠰蠮蠹蠰蠹蠷蠰蠮蠹蠰蠹蠱蠰蠮蠹蠱蠰蠴蠰蠮蠰蠰蠰蠱蠵蠰蠮蠰蠱蠶蠥

表蠴蠮蠳蠰蠺衍衯衶衩补行补衮衳資料中用衁行術試驗蠱蠰蠰次的衍術衅資訊蠬U的起始值以N 蠨蠰, 蠱蠩生成由於衍衯衮衤衯和衍衯衶衩补行补衮衳兩筆資料的密集程度不同蠬因此進行比較的時候以變異係數衡量兩筆資料在進行蠱蠰蠰次試驗之下的分散程度。根據表蠴蠮蠲蠷以及表蠴蠮蠲蠹的結果比較蠬衍衯衶衩补行补衮衳不但在蠱蠰蠰次衍術衅的平均和變異數都比衍衯衮衤衯還小、變異係數也比衍衯衮衤衯小很多。我們猜測在評分資料稀疏的狀況之下有各種收斂後的U和C之結構組合蠬由於衍衯衮衤衯評分資料太少蠬每次估計出的U和C可能會不穩定蠬因此不同組合之下預測測試集的資料就會有不同的預測值蠬變異性會比較大蠻而衍衯衶衩补行补衮衳資料較完整蠬估計的U和C的組合大致上也較穩定蠬變異性也相對比較小。

4.5 預預預測測測結結結果果果比比比較較較

由於在使用衉衒衔模型法的過程中蠬較大的資料矩陣必須經過前處理後蠬在生成衍衃衍衃樣本的時候程式才能運作蠬因此若能夠以原始資料的訓練集進行預測才會得到真正的預測結果蠬尤其對衍衯衶衩补行补衮衳這筆資料來說更是如此蠬因為這筆資料在衉衒衔模型法中生成衍衃衍衃樣本時刪除了評分次數少於蠱蠲蠰的評分者。相關係數法和矩陣分解法雖然沒有這樣的問題蠬但是為了方便比較蠬因此這兩種方法也以刪除過後的資料進行預測。

表蠴蠮蠳蠱的左右欄分別為衍衯衮衤衯和衍衯衶衩补行补衮衳資料在情況衁之下以衉衒衔模型法、相關係數法、以及交錯最小平方法用蠱蠰次不同的訓練測試集所得到的衍術衅值。表中衉衒衔模型法所使用的是第二組的γ起始值¹²蠬雖然從表蠴蠮蠴和表蠴蠮蠱蠲標為粗體字的數值可看出γ的收斂值跟起始值相同時所做出來的預測結果比較好蠬但是並沒有想出有何理論能夠解釋這現象蠬因此比較表上沒有列出這一類起始值的預測結果。矩陣分解法則是因為不論U用衕蠨−蠱, 蠱蠩或N 蠨蠰, 蠱蠩生成結果都差不多蠬因此僅列出以衕蠨−蠱, 蠱蠩生成U所做出的結果。

這組起始值是Ratings這個package中,生成MCMC樣本的指令ordrating裡所預設的起始值。

蠴蠵

‧

1 2.296 2.354 1.563 2.454

2 2.476 1.980 1.515 2.049

3 2.437 2.068 1.913 2.307

4 2.650 2.544 2.383 2.645

5 2.646 2.204 1.811 2.335

6 2.272 2.058 1.661 2.166

7 2.583 2.228 1.883 2.243

8 2.262 2.019 2.218 2.327

9 2.233 1.976 1.854 2.173

10 2.301 2.223 1.786 2.344

MovieLens 預測方法

訓練 IRT模型法 IRT模型法相關矩陣分解

測試集 ^β^r^{> 0} ^β^r不限制係數法平均

1 0.973 0.973 0.912 0.9033

2 0.963 0.965 0.911 0.8970

3 0.944 0.944 0.914 0.8991

4 0.987 0.989 0.923 0.8988

5 0.982 0.984 0.932 0.9100

表蠴蠮蠳蠱蠺預測衍衯衮衤衯和衍衯衶衩补行补衮衳資料的衍術衅比較

‧ 國

立政治大學

‧

N a

tio na

l C h engchi U ni ve rs it y

Chapter 5 結結結論論論與與與建建建議議議

衉衒衔模型法原本的目的是透過建立模型蠬再以圖型的方式展示評分者評比一個項目之中各種評分分數的機率值蠬使其能夠一目了然。用來作預測時是取決於最高機率值對應的評分項作為預測數值的標準蠬但是只要機率不是蠰蠬該評分數值就有被評分的可能蠬而當所有評分分數被預測到的機率都很相近時蠬取最大機率值預測更容易出現錯誤蠬這種情況下可以照蠴蠮蠲蠮蠴節的作法。

而在γ呈現收斂的情況下蠬評分為蠲的機率由於都不會是最高的蠬導致預測的資料完全不會有評分為蠲的數值蠬就實務上來看可能不合理蠻另外項目判別能力一致的假設蠨βr > 蠰蠩在實務上可看情況放寬成不限制也許會得到比較合理的結果。

相關係數法的優點在於只要利用現有的評分資料就能夠預測使用者的評分蠬不需要進行參數的假設蠬但是缺點則包含了蠱蠮蠱蠮蠱節所提及在推薦系統本身都會有的評分稀疏性問題以及冷起始問題蠬在沒有參數假設之下蠬只能被動地等評分數多一些才能較準確地推薦使用者可能喜歡的項目。而因為評分稀疏性使得無法預測的問題蠬在本研究中因為沒有其他和使用者及項目有關的資訊蠬因此統一保守預測為蠳蠻建議可以和內容導向式推薦系統作結合蠬如此因為評分稀疏性問題而無法用相關係數法進行預測時蠬也可以按照自己過往評分經驗作為項目的推薦依據。

矩陣分解法做出的分量cp和ur雖然很難解釋，因為只是將蠨蠲蠮蠱蠱蠩式最佳化之後所得到的結果蠬但若使用者和產品能夠有更多的資訊，則建議可以增加其他的變數，如時間因素、使用者偏好、項目平均品質等蠬針對cp或u_r的初始值是否能夠給予特徵點使其能預測更準確。

將以上的結果做一個總結蠬推薦系統的策略運作可根據企業重視的層面決定預測方法。

若重視的是預測能力蠬可以使用相關係數法和矩陣分解法蠻若重視的是變數間的解釋蠬則推薦使用衉衒衔模型法蠬或是有更多使用者和產品的資訊則也可以在矩陣分解法加入這些資訊。在後續的研究中也可以綜合這些方法蠬找出更好的預測和推薦方式。

12 這組起始 值是Ratings這個package中,生成MCMC樣本的指令ordrating裡所預設的起始值。

國

立 政 治 大 學

‧

N a

tio na

l C h engchi U ni ve rs it y

4.5 預 預 預測 測 測結 結 結果 果 果比 比 比較 較 較

這組起始 值是Ratings這個package中,生成MCMC樣本的指令ordrating裡所預設的起始值。

‧

‧ 國

立 政 治 大 學

‧

N a

tio na

l C h engchi U ni ve rs it y

Chapter 5 結 結 結論 論 論 與 與 與建 建 建議 議 議

‧ 國

立 政 治 大 學

‧

N a

tio na

l C h engchi U ni ve rs it y

12 這組起始值是Ratings這個package中,生成MCMC樣本的指令ordrating裡所預設的起始值。

立政治大學

4.5 預預預測測測結結結果果果比比比較較較

這組起始值是Ratings這個package中,生成MCMC樣本的指令ordrating裡所預設的起始值。

立政治大學

Chapter 5 結結結論論論與與與建建建議議議

立政治大學