國
立 政 治 大 學
‧
N a
tio na
l C h engchi U ni ve rs it y
訓練 蠱蠰蠰次衍術衅包含資訊
測試集 平均數 最小值 最大值 變異數 變異係數 蠱 蠰蠮蠹蠰蠳蠴 蠰蠮蠹蠰蠳蠱 蠰蠮蠹蠰蠳蠵 蠰蠮蠰蠰蠰蠰蠷 蠰蠮蠰蠰蠷蠷蠥 蠲 蠰蠮蠸蠹蠷蠴 蠰蠮蠸蠹蠶蠸 蠰蠮蠸蠹蠷蠶 蠰蠮蠰蠰蠰蠰蠶 蠰蠮蠰蠰蠶蠹蠥 蠳 蠰蠮蠸蠸蠹蠳 蠰蠮蠸蠸蠸蠷 蠰蠮蠸蠸蠹蠳 蠰蠮蠰蠰蠰蠰蠹 蠰蠮蠰蠱蠰蠥 蠴 蠰蠮蠸蠹蠸蠳 蠰蠮蠸蠹蠸蠳 蠰蠮蠸蠹蠸蠴 蠰蠮蠰蠰蠰蠱蠷 蠰蠮蠰蠱蠹蠥 蠵 蠰蠮蠹蠰蠹蠷 蠰蠮蠹蠰蠹蠱 蠰蠮蠹蠱蠰蠴 蠰蠮蠰蠰蠰蠱蠵 蠰蠮蠰蠱蠶蠥
表 蠴蠮蠳蠰蠺 衍衯衶衩补行补衮衳資料中用衁行術試驗蠱蠰蠰次的衍術衅資訊蠬U的起始值以N 蠨蠰, 蠱蠩生成 由於衍衯衮衤衯和衍衯衶衩补行补衮衳兩筆資料的密集程度不同蠬因此進行比較的時候以變異係數衡量 兩筆資料在進行蠱蠰蠰次試驗之下的分散程度。根據表蠴蠮蠲蠷以及表蠴蠮蠲蠹的結果比較蠬衍衯衶衩补行补衮衳不 但在蠱蠰蠰次衍術衅的平均和變異數都比衍衯衮衤衯還小、變異係數也比衍衯衮衤衯小很多。我們猜測在 評分資料稀疏的狀況之下有各種收斂後的U和C之結構組合蠬由於衍衯衮衤衯評分資料太少蠬每次估 計出的U和C可能會不穩定蠬因此不同組合之下預測測試集的資料就會有不同的預測值蠬變異 性會比較大蠻而衍衯衶衩补行补衮衳資料較完整蠬估計的U和C的組合大致上也較穩定蠬變異性也相對比較 小。
4.5 預 預 預測 測 測結 結 結果 果 果比 比 比較 較 較
由於在使用衉衒衔模型法的過程中蠬較大的資料矩陣必須經過前處理後蠬在生成衍衃衍衃樣本的 時候程式才能運作蠬因此若能夠以原始資料的訓練集進行預測才會得到真正的預測結果蠬尤其 對衍衯衶衩补行补衮衳這筆資料來說更是如此蠬因為這筆資料在衉衒衔模型法中生成衍衃衍衃樣本時刪除了 評分次數少於蠱蠲蠰的評分者。相關係數法和矩陣分解法雖然沒有這樣的問題蠬但是為了方便比 較蠬因此這兩種方法也以刪除過後的資料進行預測。
表蠴蠮蠳蠱的左右欄分別為衍衯衮衤衯和衍衯衶衩补行补衮衳資料在情況衁之下以衉衒衔模型法、相關係數 法、以及交錯最小平方法用蠱蠰次不同的訓練測試集所得到的衍術衅值。表中衉衒衔模型法所使用的 是第二組的γ起始值12蠬雖然從表蠴蠮蠴和表蠴蠮蠱蠲標為粗體字的數值可看出γ的收斂值跟起始值相同 時所做出來的預測結果比較好蠬但是並沒有想出有何理論能夠解釋這現象蠬因此比較表上沒有列 出這一類起始值的預測結果。矩陣分解法則是因為不論U用衕蠨−蠱, 蠱蠩或N 蠨蠰, 蠱蠩生成結果都差 不多蠬因此僅列出以衕蠨−蠱, 蠱蠩生成U所做出的結果。
12
這組起始 值是Ratings這個package中,生成MCMC樣本的指令ordrating裡所預設的起始值。
蠴蠵
‧
1 2.296 2.354 1.563 2.454
2 2.476 1.980 1.515 2.049
3 2.437 2.068 1.913 2.307
4 2.650 2.544 2.383 2.645
5 2.646 2.204 1.811 2.335
6 2.272 2.058 1.661 2.166
7 2.583 2.228 1.883 2.243
8 2.262 2.019 2.218 2.327
9 2.233 1.976 1.854 2.173
10 2.301 2.223 1.786 2.344
MovieLens 預測方法
訓練 IRT模型法 IRT模型法 相關 矩陣分解
測試集 βr> 0 βr不限制 係數法 平均
1 0.973 0.973 0.912 0.9033
2 0.963 0.965 0.911 0.8970
3 0.944 0.944 0.914 0.8991
4 0.987 0.989 0.923 0.8988
5 0.982 0.984 0.932 0.9100
表 蠴蠮蠳蠱蠺 預測衍衯衮衤衯和衍衯衶衩补行补衮衳資料的衍術衅比較
‧ 國
立 政 治 大 學
‧
N a
tio na
l C h engchi U ni ve rs it y
Chapter 5 結 結 結論 論 論 與 與 與建 建 建議 議 議
衉衒衔模型法原本的目的是透過建立模型蠬再以圖型的方式展示評分者評比一個項目之中各 種評分分數的機率值蠬使其能夠一目了然。用來作預測時是取決於最高機率值對應的評分項作 為預測數值的標準蠬但是只要機率不是蠰蠬該評分數值就有被評分的可能蠬而當所有評分分數被預 測到的機率都很相近時蠬取最大機率值預測更容易出現錯誤蠬這種情況下可以照蠴蠮蠲蠮蠴節的作法。
而在γ呈現收斂的情況下蠬評分為蠲的機率由於都不會是最高的蠬導致預測的資料完全不會有評分 為蠲的數值蠬就實務上來看可能不合理蠻另外項目判別能力一致的假設蠨βr > 蠰蠩在實務上可看情況 放寬成不限制也許會得到比較合理的結果。
相關係數法的優點在於只要利用現有的評分資料就能夠預測使用者的評分蠬不需要進行參 數的假設蠬但是缺點則包含了蠱蠮蠱蠮蠱節所提及在推薦系統本身都會有的評分稀疏性問題以及冷起 始問題蠬在沒有參數假設之下蠬只能被動地等評分數多一些才能較準確地推薦使用者可能喜歡的 項目。而因為評分稀疏性使得無法預測的問題蠬在本研究中因為沒有其他和使用者及項目有關 的資訊蠬因此統一保守預測為蠳蠻建議可以和內容導向式推薦系統作結合蠬如此因為評分稀疏性問 題而無法用相關係數法進行預測時蠬也可以按照自己過往評分經驗作為項目的推薦依據。
矩陣分解法做出的分量cp和ur雖然很難解釋,因為只是將蠨蠲蠮蠱蠱蠩式最佳化之後所得到的結 果蠬但若使用者和產品能夠有更多的資訊,則建議可以增加其他的變數,如時間因素、使用者 偏好、項目平均品質等蠬針對cp或ur的初始值是否能夠給予特徵點使其能預測更準確。
將以上的結果做一個總結蠬推薦系統的策略運作可根據企業重視的層面決定預測方法。
若重視的是預測能力蠬可以使用相關係數法和矩陣分解法蠻若重視的是變數間的解釋蠬則推薦使 用衉衒衔模型法蠬或是有更多使用者和產品的資訊則也可以在矩陣分解法加入這些資訊。在後續的 研究中也可以綜合這些方法蠬找出更好的預測和推薦方式。
蠴蠷