• 沒有找到結果。

網路評比資料之統計分析 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "網路評比資料之統計分析 - 政大學術集成"

Copied!
53
0
0

加載中.... (立即查看全文)

全文

(1)國立政治大學商學院統計學系 碩士論文 衄补衰衡衲衴衭补衮衴 衯衦 術衴衡衴衩衳衴衩衣衳 衃衯衬衬补衧补 衯衦 衃衯衭衭补衲衣补 衎衡衴衩衯衮衡衬 衃表补衮衧衣表衩 衕衮衩衶补衲衳衩衴衹 衍衡衳衴补衲 衔表补衳衩衳. 政 治 大 網路評比資料之統計分析 立. ‧ 國. 學. Statistical Analysis of Online Rating Data. ‧. n. er. io. sit. y. Nat. al. Ch. e. i. i n U. v. h 撰 n g c張孫浩 研究生: Student: Sun-Hao Chang 指導教授: 翁久幸 博士 Advisor: Ruby Chui-Hsing Weng, Ph.D. 中華民國 100 年 6 月 June, 2011.

(2) 摘要 隨著網路的發達蠬各式各樣的資訊和商品也在網路上充斥著蠬使用者尋找資訊或是上網購物時蠬有 的網站有推薦系統蠨衲补衣衯衭衭补衮衤补衲 衳衹衳衴补衭蠩能提供使用者相關資訊或商品。若推薦系統能夠讓 消費者所搜尋的相關資訊或商品能夠符合他們的習性時蠬便能讓消費者增加對系統的信賴程 度蠬因此系統是否能準確預測出使用者的偏好就成為一個重要的課題。本研究使用兩筆資料蠬並 以相關研究的三篇文獻進行分析和比較。這三篇文獻分別為衉衒衔模型法蠨衉衒衔 衭衯衤补衬蠭衢衡衳补衤. 政 治 大. 衭补衴表衯衤蠩、相關係數法蠨衣衯衲衲补衬衡衴衩衯衮蠭衣衯补蠎衣衩补衮衴 衭补衴表衯衤蠩、以及矩陣分解法蠨衭衡衴衲衩衸 衦衡衣衴衯衲衩衺衡蠭. 立. 學. ‧ 國. 衴衩衯衮蠩。. 在經過一連串的實證分析後蠬歸納出以下結論蠺. 蠱蠮 衉衒衔模型法在預測方面雖然精確度不如其他兩種方法來的好蠬但是模型有解釋變數之間的. ‧. 關係以及預測機率的圖表展示蠬因此這個方法仍有存在的價值。. Nat. sit. y. 蠲蠮 相關係數法容易因為評分稀疏性的問題而無法預測蠬建議可以搭配內容式推薦系統的運作. n. al. er. io. 方式協助推薦。. i n C 際上無法解釋這些分量和數字的意義。 hengchi U. v. 蠳蠮 矩陣分解法在預測上雖然比衉衒衔模型法還好,但分量的數字只是一個最佳化的結果,實. 關鍵字蠺 線上評分、推薦系統、衉衒衔模型法、相關係數法、矩陣分解.

(3) Abstract 街衩衴表 衴表补 衧衲衯衷衴表 衯衦 衴表补 衩衮衴补衲衮补衴蠬 衷补衢衳衩衴补衳 衡衲补 衦衵衬衬 衯衦 衡 衶衡衲衩补衴衹 衯衦 衩衮衦衯衲衭衡衴衩衯衮 衡衮衤 衰衲衯衤衵衣衴衳蠮 街表补衮 衵衳补衲衳 蠌衮衤 衴表补 衩衮衦衯衲衭衡衴衩衯衮 衯衲 衳衵衲衦 衴表补 衩衮衴补衲衮补衴 衴衯 衳表衯衰衰衩衮衧蠬 衳衯衭补 衷补衢蠭 衳衩衴补衳 衰衲衯衶衩衤补 衵衳补衲衳 衲补衣衯衭衭补衮衤补衲 衳衹衳衴补衭 衴衯 蠌衮衤 衷衩衴表 衷表衩衣表 衲补衬衡衴补衤蠮 衈补衮衣补蠬 衷表补衴表补衲 衴表补 衲补衣衯衭衭补衮衤补衲 衳衹衳衴补衭 衣衡衮 衰衲补衤衩衣衴 衴表补 衵衳补衲衳蠧 衰衲补衦补衲补衮衣补 衩衳 衡衮 衩衭衰衯衲衴衡衮衴 衴衯衰衩衣蠮 衔表衩衳 衳衴衵衤衹 衵衳补衤 衴衷衯 衤衡衴衡蠬衷表衩衣表 衡衲补 蠢衍衯衮衤衯蠢 衡衮衤 蠢衍衯衶衩补行补衮衳蠢蠬 衡衮衤 衷补 衵衳补衤 衴表衲补补 衲补衬衡衴补衤 衲补衦补衲蠭 补衮衣补衳 衴衯 衡衮衡衬衹衺补 衡衮衤 衣衯衭衰衡衲补 衴表补衭蠮 衔表补 衴表衲补补 衲补衦补衲补衮衣补衳 衡衲补 衦衯衬衬衯衷衩衮衧蠺 衉衒衔 衭衯衤补衬蠭衢衡衳补衤. 政 治 大. 衭补衴表衯衤蠬 衃衯衲衲补衬衡衴衩衯衮蠭衣衯补蠎衣衩补衮衴 衭补衴表衯衤蠬 衡衮衤 衍衡衴衲衩衸 衦衡衣衴衯衲衩衺衡衴衩衯衮蠮. 立. 衁衦衴补衲 衴表补 衤衡衴衡 衡衮衡衬衹衳衩衳蠬 衷补 衧补衴 衴表补 衦衯衬衬衯衷衩衮衧 衣衯衮衣衬衵衳衩衯衮衳蠺. ‧ 國. 學. 蠱蠮 衉衒衔 衭衯衤补衬蠭衢衡衳补衤 衭补衴表衯衤 衩衳 衷衯衲衳补 衴表补衮 衯衴表补衲 衭补衴表衯衤衳 衩衮 衰衲补衤衩衣衴衩衮衧蠬 衢衵衴 衩衴 衣衡衮 补衸衰衬衡衩衮 衴表补 衲补衬衡衴衩衯衮衳表衩衰 衯衦 衶衡衲衩衡衢衬补衳 衡衮衤 衤衩衳衰衬衡衹 衴表补 衧衲衡衰表 衯衦 衰衲补衤衩衣衴衩衮衧 衰衲衯衢衡衢衩衬衩衴衩补衳蠮. Nat. y. ‧. 衈补衮衣补 衴表衩衳 衭补衴表衯衤 衳衴衩衬衬 表衡衳 衩衴蠧衳 衶衡衬衵补蠮. al. er. io. 衩衴 衷衩衴表 衣衯衮衴补衮衴 蠌衬衴补衲衩衮衧 衡衰衰衲衯衡衣表蠮. sit. 蠲蠮 衃衯衲衲补衬衡衴衩衯衮蠭衣衯补蠎衣衩补衮衴 衭补衴表衯衤 衩衳 表衡衲衤 衴衯 衰衲补衤衩衣衴 衢补衣衡衵衳补 衯衦 衳衰衡衲衳衩衴衹蠮 街补 衣衡衮 衣衯衮衮补衣衴. n. iv n C 衴表补 衶补衣衴衯衲衳 衩衳 衡 衲补衳衵衬衴 衯衦 衯衰衴衩衭衩衺衡衴衩衯衮蠮 h e n g c h衉衴 i衭衡衹U 衢补 表衡衲衤 衴衯 补衸衰衬衡衩衮 衴表补 衭补衡衮衩衮衧 衯衦. 蠳蠮 衁衬衴表衯衵衧表 衭衡衴衲衩衸 衦衡衣衴衯衲衩衺衡衴衩衯衮 衩衳 衢补衴衴补衲 衴表补衮 衉衒衔 衭衯衤补衬蠭衢衡衳补衤 衭补衴表衯衤 衩衮 衰衲补衤衩衣衴衩衮衧蠬. 衴表补 衶补衣衴衯衲衳蠮. 衋补衹 街衯衲衤衳蠺 衯衮衬衩衮补 衲衡衴衩衮衧蠬 衲补衣衯衭衭补衮衤补衲 衳衹衳衴补衭蠬 衉衒衔 衭衯衤补衬蠭衢衡衳补衤 衭补衴表衯衤蠬 衣衯衲衲补衬衡衴衩衯衮蠭衣衯补蠎衣衩补衮衴 衭补衴表衯衤蠬 衭衡衴衲衩衸 衦衡衣衴衯衲衩衺衡衴衩衯衮.

(4) 謝辭 不知不覺已經過了兩年,每週都要和教授咪挺會面, 程式要寫加上衰衡衰补衲要念,天天都忙著和論文周旋衾. 兩年的時光一轉眼就過去了。首先我要感謝翁久幸教授在這一年的指導蠬才能夠使我這篇 論文在畢業之前完成蠬並順利通過論文口試。每次衭补补衴衩衮衧時老師總是不厭其煩的和我討論目前. 政 治 大. 論文該做的結果蠬並糾正我論文中的錯字以及不順的語句蠬在論文的寫作上給了我精確的建議。 除此之外也告訴我未來在職場上可能碰到的問題和經驗蠬在各方面都給了我不少幫助蠬讓我了解. 立. 進入職場時該怎麼應對蠬以及如何活用在大學和碩士班所學會的東西。. ‧ 國. 學. 除此之外也感謝洪英超老師和陳定立助理擔任碩士論文的口試委員蠬在口試所提及的問題 以及給予的建議都令我受惠良多蠬才能夠使我的論文更加完整。. ‧. y. Nat. 也謝謝這些年來蠬陪我一起度過的碩士班同學們以及師長們蠬雖然我在你們印象中可能比較. sit. 不起眼蠬但是透過彼此的交流也讓我學到了不少東西蠻在這邊也要一併感謝在研究本論文的矩陣. al. er. io. 分解法時蠬博士班學長蘇建郎的協助蠬沒有他用衍衡衴衬衡衢在這方面協助我蠬這一部份的程式恐怕很難. n. 寫出來蠻沒有和他討論論文蠬可能我的論文上還會出現不少漏洞蠻沒有找他口試預演蠬口試的時候可. Ch. 能會有講不好的地方自己確未發現蠬在此一併致謝。. engchi. i n U. v. 最後蠬我要感謝支持我的朋友們以及我父母。因為有你們的支持蠬我才能如願考上碩士班蠬並 在這兩年內順利完成我的學業。 張孫浩 謹識 於政治大學統計學系研究所 九十九年六月.

(5) 目錄 1 緒論 蠱蠮蠱. 6 研究背景 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮. 蠶. 推薦系統簡介 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮. 蠷. 政 治 蠮蠮蠮蠮蠮蠮蠮蠮蠮蠮蠮蠮蠮蠮蠮蠮蠮蠮 研究目的 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 大 立. 蠸. 蠱蠮蠱蠮蠱 蠱蠮蠱蠮蠲 蠱蠮蠲. 目前網路評分呈現的瑕疵 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮. 2 文獻回顧. 蠹 10. ‧ 國. 學. 衉衒衔模型法 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠱蠰. 蠲蠮蠲. 相關係數預測法 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠱蠳. 蠲蠮蠳. 矩陣分解理論 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠱蠵 18. sit. y. Nat. 3 研究方法. ‧. 蠲蠮蠱. 蠳蠮蠲. 相關係數預測法 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠱蠹. 蠳蠮蠳. 矩陣分解法 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠲蠰. n. al. er. 衉衒衔模型法 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠱蠸. io. 蠳蠮蠱. 4 實證研究. Ch. engchi. i n U. v. 21. 蠴蠮蠱. 實證資料 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠲蠱. 蠴蠮蠲. 衉衒衔模型法分析 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠲蠲. 蠴蠮蠳. 蠴蠮蠲蠮蠱. βr 是否限制大於蠰 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠲蠲. 蠴蠮蠲蠮蠲. 衍衯衮衤衯預測結果 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠲蠵. 蠴蠮蠲蠮蠳. 衍衯衶衩补行补衮衳預測結果 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠳蠳. 蠴蠮蠲蠮蠴. 衉衒衔模型法的改進 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠳蠷. 相關係數法分析 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠳蠸 蠱.

(6) 蠴蠮蠴. 蠴蠮蠵. 蠴蠮蠳蠮蠱. 衍衯衮衤衯預測結果 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠳蠸. 蠴蠮蠳蠮蠲. 衍衯衶衩补行补衮衳預測結果 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠴蠰. 矩陣分解法分析 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠴蠲 蠴蠮蠴蠮蠱. 衍衯衮衤衯預測結果 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠴蠲. 蠴蠮蠴蠮蠲. 衍衯衶衩补行补衮衳預測結果 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠴蠲. 預測結果比較 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠴蠵. 5 結論與建議. 47. 參考文獻及相關書目. 48. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 蠲. i n U. v.

(7) 表目錄 蠲蠮蠱. 相關係數法說明範例 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠱蠴. 蠴蠮蠱. 衍衯衮衤衯資料下兩兩評分者相關係數的衰蠭衶衡衬衵补小於蠰蠮蠰蠵的分布表 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠲蠳. 蠴蠮蠲. 衍衯衶衩补行补衮衳資料下兩兩評分者相關係數的衰蠭衶衡衬衵补小於蠰蠮蠰蠵的分布表 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠲蠳. 蠴蠮蠳. 衉衒衔模型法所使用的γ起始值 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠲蠷. 蠴蠮蠴. 蠲蠷. 學. ‧ 國. 蠴蠮蠵. 政 治 大 衉衒衔模型法在不同的γ起始值之下預測衍衯衮衤衯資料的結果 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 立 衉衒衔模型法在不同的γ起始值之下蠬預測第一組訓練測試集衍衯衮衤衯資料後收斂. 的γ平均值 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠲蠸 蠴蠮蠶. 衉衒衔模型法在βr > 蠰之下預測衍衯衮衤衯資料的結果蠬取自γ起始值二的第一次訓練 衉衒衔模型法在βr 不限制之下預測衍衯衮衤衯資料的結果蠬取自γ起始值二的第一次訓. Nat. y. 蠴蠮蠷. ‧. 測試集 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠲蠹. al. er. ∗(k) k k 試驗yrp 落在γ收斂值時πrp1 , . . . , πrp5 的機率蠬取自γ起始值二的第一次訓練測. io. 蠴蠮蠸. sit. 練測試集 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠲蠹. n. 試集 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠳蠰 蠴蠮蠹. Ch. i n U. v. 衉衒衔模型法在βr > 蠰之下預測衍衯衮衤衯資料的結果蠬取自γ起始值七的第九次訓練. engchi. 測試集 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠳蠲 蠴蠮蠱蠰 衉衒衔模型法在βr 不限制之下預測衍衯衮衤衯資料的結果蠬取自γ起始值七的第九次訓 練測試集 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠳蠲 ∗(k) k k 蠴蠮蠱蠱 令γ (k) 收斂值為起始值五蠬試驗yrp 落在γ收斂值時πrp1 , . . . , πrp5 的機率 蠮 蠮 蠮 蠮 蠮 蠳蠲. 蠴蠮蠱蠲 衉衒衔模型法在不同的γ起始值之下預測衍衯衶衩补行补衮衳資料的結果 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠳蠴 蠴蠮蠱蠳 衉衒衔模型法在不同的γ起始值之下蠬預測第一次衍衯衶衩补行补衮衳資料後收斂的γ平均值 蠮 蠳蠴 蠴蠮蠱蠴 衉衒衔模型法在βr > 蠰之下預測衍衯衶衩补行补衮衳資料的結果蠬取自γ起始值二的第一次 訓練測試集 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠳蠵. 蠳.

(8) 蠴蠮蠱蠵 衉衒衔模型法在βr 不限制之下預測衍衯衶衩补行补衮衳資料的結果蠬取自γ起始值二的第一 次訓練測試集 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠳蠵 ∗(k) k k 蠴蠮蠱蠶 令γ (k) 收斂值為起始值五蠬試驗yrp 落在γ收斂值時πrp1 , . . . , πrp5 的機率 蠮 蠮 蠮 蠮 蠮 蠳蠶. 蠴蠮蠱蠷 衉衒衔模型法的改進方法在βr > 蠰之下預測衍衯衮衤衯資料的各評分個數以及衍術衅值蠬取 自γ起始值二的第一次訓練測試集 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠳蠸 蠴蠮蠱蠸 衉衒衔模型法的改進方法在βr > 蠰之下預測衍衯衮衤衯資料的各評分個數以及衍術衅值蠬取 自γ起始值七的第九次訓練測試集 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠳蠸 蠴蠮蠱蠹 相關係數法預測衍衯衮衤衯資料的衍術衅 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠳蠹 蠴蠮蠲蠰 相關係數法預測衍衯衮衤衯第一次訓練測試集的結果 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠳蠹 蠴蠮蠲蠱 相關係數法預測衍衯衮衤衯資料的數字 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠴蠰 蠴蠮蠲蠲 相關係數法預測衍衯衶衩补行补衮衳資料的衍術衅 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠴蠱. 政 治 大. 蠴蠮蠲蠳 相關係數法預測衍衯衶衩补行补衮衳第一次訓練測試集的結果 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠴蠱. 立. 蠴蠮蠲蠴 相關係數法預測衍衯衮衤衯資料的數字 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠴蠱. ‧ 國. 學. 蠴蠮蠲蠵 衍衯衮衤衯資料經過五次的五摺交叉驗證後得到的平均衍術衅 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠴蠳 蠴蠮蠲蠶 衍衯衮衤衯資料中用衁行術試驗蠱蠰蠰次的衍術衅資訊蠬U的起始值以衕蠨−蠱, 蠱蠩生成 蠮 蠮 蠮 蠮 蠴蠳 蠴蠮蠲蠷 衍衯衮衤衯資料中用衁行術試驗蠱蠰蠰次的衍術衅資訊蠬U的起始值以N 蠨蠰, 蠱蠩生成 蠮 蠮 蠮 蠮 蠮 蠴蠴. ‧. 蠴蠮蠲蠸 衍衯衶衩补行补衮資料經過五次的五摺交叉驗證後得到的平均衍術衅 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠴蠴. y. Nat. 蠴蠮蠲蠹 衍衯衶衩补行补衮衳資料中用衁行術試驗蠱蠰蠰次的衍術衅資訊蠬U的起始值以衕蠨−蠱, 蠱蠩生成 蠮 蠮 蠴蠴. sit. 蠴蠮蠳蠰 衍衯衶衩补行补衮衳資料中用衁行術試驗蠱蠰蠰次的衍術衅資訊蠬U的起始值以N 蠨蠰, 蠱蠩生成 蠮 蠮 蠮 蠴蠵. n. al. er. io. 蠴蠮蠳蠱 預測衍衯衮衤衯和衍衯衶衩补行补衮衳資料的衍術衅比較 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠴蠶. Ch. engchi. 蠴. i n U. v.

(9) 圖目錄 蠱蠮蠱. 目前一些網站的評分展示方式 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮. 蠱蠮蠲. 衁衭衡衺衯衮網站的商品評分範例蠺該商品雖然平均是蠳分蠬可是看評分內容會發現實 際上是個評價兩極化的產品 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮. 蠲蠮蠱. 政 治 大 分圖表蠬中間欄為衍衯衤补衬蠭衢衡衳补衤 術衴衡衲衰衬衯衴蠬右欄為衍衯衤补衬蠭衢衡衳补衤 衂衡衲衰衬衯衴。 立. 蠸. 蠹. 評比圖表一覽蠺衍衯衮衤衯資料經過處理後所得到的評比圖表蠬左欄為一般網站的評 蠮 蠮 蠮 蠮 蠱蠲. 衍衯衮衤衯資料下兩兩評分者相關係數的衰蠭衶衡衬衵补小於蠰蠮蠰蠵分布的直方圖 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠲蠳. 蠴蠮蠲. 衍衯衶衩补行补衮衳資料下兩兩評分者相關係數的衰蠭衶衡衬衵补小於蠰蠮蠰蠵分布的直方圖 蠮 蠮 蠮 蠮 蠮 蠲蠴. 蠴蠮蠳. 衍衯衮衤衯資料前蠱蠲個新聞媒體的衭衯衤补衬蠭衢衡衳补衤 衳衴衡衲衰衬衯衴蠬左半部是βr > 蠰做出的結. ‧. ‧ 國. 學. 蠴蠮蠱. 果蠬右半部是不限制βr 做出的結果 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠲蠵 衍衯衮衤衯資料下評衇衲补衡衴 衆衡衬衬衳 衔衲衩衢衵衮补的六個人 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠲蠶. 蠴蠮蠵. ∗(k) k k 以γ1 , . . . , γ4 為分界蠬yrp 落在各個區間的πrp1 , . . . , πrp5 的機率範圍蠬取自γ起始. io. sit. y. Nat. 蠴蠮蠴. 蠴蠮蠷. al. iv n C 組γ起始值蠬假設收斂後的γ值與起始值完全一樣 hengchi U 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 n. 蠴蠮蠶. er. 值二的第一次訓練測試集 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠳蠱 ∗(k) k k 以γ1 , . . . , γ4 為分界蠬yrp 落在各個區間的πrp1 , . . . , πrp5 的機率範圍蠬取自第五. 蠳蠳. ∗(k) k k 以γ1 , . . . , γ4 為分界蠬yrp 落在各個區間的πrp1 , . . . , πrp5 的機率範圍蠬取自γ起始. 值二的第一次訓練測試集 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠮 蠳蠶. 蠵.

(10) Chapter 1 緒論 1.1. 研究背景. 政 治 大. 隨著時代的進步蠬使用網路的人也愈來愈多蠬網路現在已經在一般的生活上扮演著不可或缺. 立. 的角色。如今各式各樣的資訊、網站也在網路上充斥著蠬使用者大多都會透過網路去搜尋相關. ‧ 國. 學. 資訊蠬包含實體商品、網路文章、學術文獻蠮 蠮 蠮 等等。當使用者找到他們所需要的資訊之後蠬他們 可能會對相關或類似性質的資訊感興趣蠬進而繼續去尋找那方面的資訊。例如蠺張三在研讀一篇 關於貝氏統計的文獻後蠬他希望知道更多關於貝氏統計的知識和應用。. ‧. 推薦系統就是在這樣的情形之下誕生蠬希望能藉由評分者尋找到他們所想要的資訊後蠬順勢. y. Nat. 向評分者推薦其他相關的資訊。而許多企業網站或網路商店也希望他們的產品能夠銷售給消費. io. sit. 者蠬因此紛紛在網站上使用推薦系統蠬讓消費者買了一樣產品之後順勢推薦他類似性質的產品與. er. 其相關資訊。但是在網路這片充斥著各式各樣資訊的茫茫大海中蠬這些資訊有好也有壞蠬可能這. al. n. iv n C 用者想找的資訊是實體物件而發生了這樣的事蠬浪費的不只有上網搜尋資料的時間蠬還有消費該 hengchi U. 個推薦系統會推薦到比較壞的那一個而不是比較好的那一個蠬讓使用者浪費了多餘的時間蠻若使. 產品的時間和金錢。. 例如蠺李四看過一部電影衁後意猶未盡想再看另一部電影蠬推薦系統因此向他推薦電影衂蠬但 是李四看過電影衂後卻反而感到失望蠬對他來說蠬浪費了看電影衂的錢以及待在電影院的兩個小時 多的時間。所以網站的推薦系統一旦做得不好蠬發生像李四這樣的情形可能導致使用者就會不 再使用這樣的網站。由於對商家來說蠬他們希望他們的產品能夠賣出去蠻對使用者來說蠬他們希望 系統的推薦方式不會讓他們失望。因此不論對商家還是使用者都希望推薦系統的推薦方式能夠 符合使用者的需求蠬讓使用者增加對系統的信賴程度蠬因此系統能否準確預測使用者的偏好就成 為一項重要課題。 蠶.

(11) 1.1.1. 推薦系統簡介. 推薦系統蠨衲补衣衯衭衭补衮衤补衲 衳衹衳衴补衭蠩就是針對評分者在所有的項目蠨衩衴补衭蠩之中蠬包含產品、文 章等蠬從中推論出每位評分者的喜好、再對評分者給予建議的一種系統蠬藉由這樣的運作方式推 薦評分者想得到或是他們可能會喜歡的資訊。推薦系統的運作策略分成兩大類。第一類是內容 導向式推薦系統蠨衣衯衮衴补衮衴 蠌衬衴补衲衩衮衧 衡衰衰衲衯衡衣表蠩蠬對於所有的項目提供一連串的屬性並對於各種屬 性賦與數值蠨如動畫方面就有劇情、人物刻化、畫風等屬性蠬劇情生動的動畫作品在劇情方面的 屬性值就很高蠩蠬再按照評分者的個人資料蠨衰衲衯蠌衬补蠩和項目的各種屬性作比對蠬藉此推薦符合該位 評分者可能喜歡的項目蠻第二類是合作式推薦系統蠨衣衯衬衬衡衢衯衲衡衴衩衶补 蠌衬衴补衲衩衮衧蠩蠬是根據評分者之間 與項目之間的相互依賴程度之關係作為推薦的依據蠺這個方法是選取與評分者有相似喜好的其. 政 治 大. 他評分者們並將這些評分者形成一個群體蠨衧衲衯衵衰蠩使得群體內的評分者之間都擁有相似指數蠬而. 立. 這些評分者也對一部份項目有喜好程度的評估蠬結合評分者間的相似指數與他們對項目的喜好. ‧ 國. 學. 程度這兩項關係蠬便能推薦評分者其他可能有興趣的項目。合作式推薦系統的優點在於包含領 域的廣泛以及不需要像內容導向式推薦系統一樣需要賦與項目各種屬性蠬只要有評分者對項目 的評分資料就能直接運作。衋衯衲补衮蠨蠲蠰蠱蠰蠩也提到因為如此蠬合作式推薦系統在最近十年受到了相. ‧. 當大的注意蠬因此被一些成功的商業系統所採用蠬如衁衭衡衺衯衮蠬衔衩衖衯蠬和衎补衴蠍衩衸。. y. Nat. 雖然合作式推薦系統已經在廣泛被商業界以及網站所採用蠬但是由於評分者通常只會對某. sit. 些項目評分蠬使得整體的評分資料過於稀疏蠨衳衰衡衲衳补蠩蠬而且有新評分者加入時蠬並沒有他的相關資. n. al. er. io. 訊能夠作為推薦依據蠬這就是衋衯衮衳衴衡衮等人蠨蠱蠹蠹蠷蠩指出合作式推薦系統的兩個主要問題蠺. Ch. i n U. v. 蠱蠮 評分稀疏性問題蠨衲衡衴衩衮衧衳 衳衰衡衲衳衩衴衹 衰衲衯衢衬补衭蠩蠺一般來說評分者都只會評分幾個他們使用過. engchi. 的項目蠬例如看過的電影、買過的書藉等蠬而不會對系統上所有提供的項目都給予分數。 若系統提供的項目過多蠬則容易造成評分資料太過稀疏蠨衳衰衡衲衳补蠩蠬也會使得兩兩評分者共同 評分的項目太少蠬不容易計算彼此之間的相似指數。 蠲蠮 冷起始問題蠨衣衯衬衤蠭衳衴衡衲衴 衰衲衯衢衬补衭蠩蠺新評分者加入的當下並不會有任何他的相關資訊蠬因此 系統沒有辦法當下作推薦的動作蠬需要等他評分一定的次數以後才有辦法對這位評分者作 推薦。. 蠷.

(12) 1.1.2. 目前網路評分呈現的瑕疵. 社會大眾一般在利用網路購物時蠬網路提供的產品大部份都會展示產品的平均評分蠬以表示 這項產品的平均品質。有些網站是直接顯示產品的平均分數數值蠬這些評分數值對評分者來說 是一項產品品質的參考根據蠬而多數網站則是以星星的個數來代替評分數值蠬圖蠱蠮蠱列出了一些 網站展示的評分方式。像著名的線上購物網站衁衭衡衺衯衮蠬滿分為五顆星蠬然後再以所有評分者評 分的平均分數來填滿實際的星星數目蠬例如一項產品的平均分數是蠳分蠬則該產品就會呈現三顆 星。而使用者在消費了產品之後蠬也可以根據本身對這項產品的感覺蠬到購物網站替這項產品打 分數。打完分數後蠬擁有推薦系統的網站便會根據評分者的評分推薦其他該位評分者可能會喜 歡的產品蠬如果結合推薦產品的平均評分蠬就能夠給評分者對於推薦產品更多的參考依據。. 立. 政 治 大. ‧ 國. 學 圖 蠱蠮蠱蠺 目前一些網站的評分展示方式. ‧. 但是衈衯和衑衵衩衮衮蠨蠲蠰蠰蠸蠩對這樣的網路評分展示方式蠬提出了三點瑕疵蠺. y. Nat. sit. 蠱蠮 首先是沒有考慮到統計上的不確定性。使用者通常只看網路的平均評分或是星星的數. er. io. 目判斷產品品質蠬但是比較少注意到所有評分者的評分資訊蠬一部份網站也不會顯示這類. al. n. iv n C 均分數是蠳分蠬可是觀察分別評蠱分至蠵分的評分者數目蠬發現這是一項評分相當兩極化的產 hengchi U. 的資訊。我從衁衭衡衺衯衮網站發現了一個產品之評分細節並列在圖蠱蠮蠲蠬這項產品評分的平. 品蠬在蠷蠶蠵個評分者中就有蠳蠱蠹個評分蠱分蠬而有蠲蠶蠹個評分蠵分蠬這些評分人數就占了總評分 人數的蠷蠶蠮蠹蠥蠬平均下來的分數就相當接近蠳分蠬但實際上評分蠳分的人卻不多。因此這項產 品雖然平均只顯示三顆星蠬可是實際上卻是依評分者的感覺不同而評分兩極化的產品。. 蠲蠮 其次是一部份的評分者對於產品品質較無判別能力。這些判別能力較弱的評分者在評分 時大多都會只評分一項特定的分數例如一律評蠳分或蠵分蠬這些分數可能會誤導其他人對項 目的品質認知。 蠳蠮 第三是目前大多數網站的呈現的評分數都以「蠱分、蠲分、蠳分、蠴分、蠵分」表示蠬並將整 蠸.

(13) 體的評分平均數經過四捨五入的處理蠬使得損失了小數點部份的資訊。雖然有一些評分網 站如衁衭衡衺衯衮的平均分數有呈現半顆星星的評分代表蠰蠮蠵分蠬可是仍有上述的問題蠬僅少數 的網站評分保留了一位小數位數蠬如衎补衴蠍衩衸。. 圖 蠱蠮蠲蠺 衁衭衡衺衯衮網站的商品評分範例蠺該商品雖然平均是蠳分蠬可是看評分內容會發現實際上是 個評價兩極化的產品. 研究目的. ‧ 國. 學. 1.2. 立. 政 治 大. 以上述第一點來說蠬平均分數為蠳分的產品有可能大部份的評分都集中在蠳分蠬也有可能如. ‧. 圖蠱蠮蠲所展示的評分大部份都在蠱分和蠵分導致評分呈現兩極化的現象。因為一項產品的評分中 包含了各式各樣的統計資訊蠬平均分數只是這些統計資訊中的其中一項而已蠬若再進一步分析或. y. Nat. sit. 許有能找出各種不同的統計資訊蠬如上述所說的評分分散性。此外蠬研究背景也提到推薦系統是. er. io. 否能準確預測使用者的偏好是個重要的課題蠬以便於推薦使用者可能喜歡的產品蠬推薦的依據即 為預測使用者對於該項產品的評分。蠱蠮蠱蠮蠱節也提到合作式推薦系統是根據使用者之間與項目. n. al. i n U. v. 之間的相互依賴程度之關係作為推薦的依據蠬牽涉到相關係數的運算蠬因此也統計也脫離不了關. Ch. engchi. 係。因此本論文的目的在於以統計的角度探討這些問題蠺. 蠱蠮 針對衈衯和衑衵衩衮衮的方法評論其優缺點蠬並利用他們方法作評分的預測蠬因為他們的文獻並 沒有提及預測方法。 蠲蠮 比較不同的預測方法蠬並討論各種方法所預測的精確性蠨衡衣衣衵衲衡衣衹蠩。 本論文一共分為五章蠺第一章為緒論蠬說明研究背景以及研究目的蠻第二章為回顧相關文 獻蠻第三章為研究方法蠻第四章為實證研究蠬介紹研究資料來源、實證結果和各種方法在預測上的 比較蠻第五章為結論與建議。 蠹.

(14) Chapter 2 文獻回顧 本章介紹相關研究的三篇文獻蠺第一節介紹由衈衯和衑衵衩衮衮蠨蠲蠰蠰蠸蠩所提出的衉衒衔模型法的內. 治 政 介紹衋衯衲补衮等人蠨蠲蠰蠰蠹蠩提出的矩陣分解理論。 大 立. 容以及圖表蠨衭衯衤补衬蠭衢衡衳补衤 蠌衧衵衲补蠩蠬第二節介紹衒补衳衮衩衣衫等人蠨蠱蠹蠹蠴蠩所提出的相關係數法蠬第三節. IRT模 模型 法. ‧ 國. 學. 2.1. 蠱蠮蠱蠮蠲節曾經提到蠬衈衯和衑衵衩衮衮蠨蠲蠰蠰蠸蠩對於目前網路上的評分展出方式提出有三點瑕疵。他. ‧. 們針對這三點問題的作法是利用試題反映理論蠨衉衴补衭 衒补衳衰衯衮衳补 衔表补衯衲衹蠬衉衒衔蠩作為研究的起始 點蠬並將各種分數可能被評分的後驗機率以圖型的方式呈現。試題反映理論原本是在測量一位. y. Nat. sit. 受試者在作答某一試題的表現情形蠬可由他們所具備的潛在能力或特質加以預測或解釋蠬而他們. er. io. 在此運用這項理論為他們建立模型的基礎蠬以解釋評分者評分項目的各個可能性。. al. n. 令R為 至 少 評 比 一 個 項 目 的 評 分 者 之 集 合蠬P 為 至 少 有 被 評 分 一 次 的 項 目 之 集 合蠬並. Ch. i n U. v. 利用r和p分別作為評分者和項目代碼的指標。令Y為一個由所有評分者和所有項目構成. engchi. obs 的|R| × |P |維之評分矩陣蠬第r個人評比項目p的分數為yrp 蠬其中再定義yrp 為所見得的評分值。. 假設最低評蠱分蠬最高評C分蠬則    c. ∗ ⇔ yrp ∈ 蠨γc−1 , γc 衝蠦zrp 蠽 蠰 obs yrp 蠽  衭衩衳衳衩衮衧 ⇔ zrp 蠽 蠱. 蠨蠲蠮蠱蠩. ∗ 其中蠬zrp 為遺漏值的指標蠬γ0 蠽 −∞ < γ1 蠽 蠰 < · · · < γC 蠽 ∞則為一序列的切點蠻yrp 為由以下. 的參數組合所構成的潛在變數蠺 iid. ∗ yrp 蠽 αr 蠫 βr θp 蠫 rp , rp ∼ N 蠨蠰, 蠱蠩, p ∈ P, r ∈ R. 蠱蠰. 蠨蠲蠮蠲蠩.

(15) 這些參數中蠬αr 為第r個評分者的評分基準蠬評分基準愈高則αr 的值愈高蠻βr 為第r個評分者判別項 目品質能力的指標蠺文獻中假設對所有評分者的βr 值皆為正數蠬若數值愈高表示對品質愈有判別 能力蠬βr 在蠰附近表示評分者對品質毫無判別能力蠻θp 則是代表第p個項目品質的優劣程度蠻rp 則是 誤差項。因此βr θp 代表第r個人對於項目品質的判別能力和項目p品質的交互作用蠬再加一個評 ∗ 分基準αr 和誤差項rp 即為第r個人評項目p的一項數值yrp 蠬再根據它所落在切點的範圍而得到對. 應的評分數值c分。 衈衯和衑衵衩衮衮是採用事後預測分配蠨衰衯衳衴补衲衩衯衲 衰衲补衤衩衣衴衩衶补 衤衩衳衴衲衩衢衵衴衩衯衮蠩的方式蠬目的在於推論 出當以隨機選取一位使用者評分一項項目時蠬會評某個分數蠨蠱蠬蠲蠬蠮 蠮 蠮 蠬C分蠩的事後機率。因此在 給定現有的評分資料之下使用衂衡衹补衳衩衡衮方法加以配適模型。因此對於上述模型蠬寫成概似函數 如下式蠺 衐蠨Yobs |α, β, θ, γ蠩 蠽. Y. 立. 政 治 大. {蠈蠨γyrp obs − αr − βr θp 蠩 − 蠈蠨γy obs −1 − αr − βr θp 蠩} rp. p,r:zrp =0. 蠨蠲蠮蠳蠩. obs 其中 γyrp obs 蠽 γc ⇔ yrp 蠽 c蠬 蠈蠨.蠩表常態分配的累積分佈函數。而從聯合分配衐蠨α, β, θ, γ蠩更. ‧ 國. iid. iid. 學. 能夠幫助我們去尋找事後分配 衐蠨α, β, θ, γ|Yobs 蠩。對於聯合分配衐蠨α, β, θ, γ蠩中各參數的先 iid. iid. 驗分配為αr ∼ N 蠨蠱, 蠱蠩蠬βr ∼ N 蠨−蠵, 蠲蠰蠩之中取正數蠬γ ∼ 衉衭衰衲衯衰补衲 衕衮衩衦衯衲衭蠬θp ∼ N 蠨蠰, 蠱蠩蠬並. ‧. 且每個參數皆獨立蠬並藉由 衍衡衲衫衯衶 衃表衡衩衮 衍衯衮衴补 衃衡衲衬衯 蠨衍衃衍衃蠩抽出參數的後驗分配。 由於一般來說評分者只會評比幾項項目蠬因此需要透過建立模型的方式以便於算出這些機. al. y. rep 衐蠨yrp |αr , βr , θp , γ蠩. 蠨蠲蠮蠴蠩. ×衐蠨αr , βr , θp , γ|Yobs 蠩dαr dβr dθp dγ. iv n C 衤衡衴衡衰衯衩衮衴蠬因為需要計算y h e n g c h i 蠽U蠱, y. n rep 其中yrp 代表衲补衰衬衩衣衡衴补衤. Z Z Z Z. sit. io. rep 衐蠨yrp |Yobs 蠩 蠽. er. Nat. 率值。對於上述模型蠬yrp 的後驗預測機率如方程式蠨蠲蠮蠴蠩蠺. rep rp. rep rp. rep 蠽 蠲, · · · , yrp 蠽 C等機率值。. 從蠨蠲蠮蠴蠩式的事後分配衐蠨αr , βr , θp , γ|Yobs 蠩中給定M 個 衍衯衮衴补 衃衡衲衬衯 樣本 {αr(m) , βr(m) , θp(m) , γ (m) }M m=1 蠬此式子可以約略寫成 rep πrpc 蠽 衐蠨yrp 蠽 c|Yobs 蠩 M 蠱 X ≈ {蠈蠨γc(m) − αr(m) − βr(m) θp(m) 蠩 M m=1. 蠨蠲蠮蠵蠩. (m). −蠈蠨γc−1 − αr(m) − βr(m) θp(m) 蠩} 蠨蠲蠮蠵蠩式就是在目前所有的觀察值之下蠬所計算出評分者r會對項目p分別評蠱分、蠲分蠮 蠮 蠮 至 評C分的機率πrpc 蠬藉此可看出該位評分者最有可能對該項目評比的分數蠬包含已評分與未評分的 蠱蠱.

(16) 所有項目。我們在蠳蠮蠱節對提到預測的方法是從πrp1 , . . . , πrpC 取其最大的機率值蠬預測該位評分 者評比該項項目的分數。 由於他們有興趣的是一項項目p之中蠬對所有的評分者而言求出評分蠱至C分的事後機率。 用數學式子表示項目p被評c分的事後機率如下式蠺 τpc 蠽. 蠱 X 蠱 X rep 衐蠨yrp 蠽 c|Yobs 蠩 蠽 πrpc |R| r∈R |R| r∈R. 蠨蠲蠮蠶蠩. 方程式蠨蠲蠮蠶蠩從數學式看來蠬它只是單純的將所有的評分者在現有的觀察值之下將他們會 rep 對項目p評C分的機率值取平均蠻進一步來看蠬由於τpc 是所有衐蠨yrp 蠽 c|Yobs 蠩, r ∈ R的集合蠬因 0. 此也可視為給定目前的評分資料下蠬從評分者集合R中以同等機率抽取任意一位評分者r 蠬對項 目p評c分的機率。. 政 治 大 方式稱為 衜衍衯衤补衬蠭衢衡衳补衤 術衴衡衲衰衬衯衴蠢蠬首先分別將C顆星分別作為蠱分、蠲分蠮 蠮 蠮 至C分蠬然後再根 立 據τ 的值將這C顆星以深淺的程度上色蠬顏色愈深代表評比該分數的機率愈大。第二種方式稱 在解出τpc 之後蠬利用兩種統計圖將項目分別被評為蠱分至C分的機率加以呈現。第一種. pc. ‧ 國. 學. 為 衜衍衯衤补衬蠭衢衡衳补衤 衂衡衲衰衬衯衴蠢蠬以長條圖的方式呈現τpc 的值蠬可以一目了然看出每個分數被評比的 機率何者為最大。圖蠲蠮蠱呈現最原始的評分圖以及經過統計上修正後於上述所提及兩種呈現方. ‧. 式的圖表蠬藉此將評分的圖形用另一種觀點展示。. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 蠲蠮蠱蠺 評比圖表一覽蠺衍衯衮衤衯資料經過處理後所得到的評比圖表蠬左欄為一般網站的評分圖 表蠬中間欄為衍衯衤补衬蠭衢衡衳补衤 術衴衡衲衰衬衯衴蠬右欄為衍衯衤补衬蠭衢衡衳补衤 衂衡衲衰衬衯衴。 蠱蠲.

(17) 舉例來說蠬圖蠲蠮蠱的媒體衃衯衬衯衲衡衤衯 衐衵衢衬衩衣 衒衡衴衩衯在未經過統計修正前的評分是蠵顆星蠬也就是 評分最好的那一項蠨即衇衲补衡衴蠩蠬但是由於評分的人數只有兩人蠬因此可能會有人對這項媒體的品 質抱持著懷疑蠻但是經過上述的模型修正後所呈現出來的圖表可知蠬隨機選取一位評分者蠬他會評 分衇衲补衡衴的機率是最高的蠬因此經過模型修正後的圖表可以確保這項媒體的品質蠻文獻中也對評 分這項媒體的這兩個人做分析蠬結果發現這兩人對於媒體的品質都相當具有鑑別力蠬因此就算只 有這兩個人評衇衲补衡衴蠬我們也可以相信這項媒體確實具有相當良好的品質。. 相關係數預測法. 2.2. 衒补衳衮衩衣衫等人蠨蠱蠹蠹蠴蠩提出了衇衲衯衵衰行补衮衳 ─使用的是以相關係數法來衡量使用者之間相似程 度的合作式推薦者系統蠬用於衎补衴衮补衷衳的文章推薦蠬以使用者對文章的評分為依據去尋找喜好相. 治 政 大 由於作為推薦與否的依據是根據評分的預測蠬因此以下說明該系統預測的運作情形蠺想要預 立 測評分者r評分項目p的分數蠬首先要先找出有評該項目的其他評分者蠬然後計算評分者r與其他評. 似的評分者評分過的文章作為推薦依據。. y衞rp 蠽 y r. 蠫. 蠨yjp − y j. 蠩 × ρ衞rj. j∈R∗. X. 蠨蠲蠮蠷蠩. ‧. ‧ 國. X. 學. 分者間的相關係數蠬以觀察評分者彼此之間的相似度蠬並從蠨蠲蠮蠷蠩式預測評分者評分的分數。. |衞 ρrj |. j∈R∗. Nat. sit. y. 其中y r. 為評分者r所有評分數的平均蠬但評分項目p的分數不列入計算蠻R∗ 為有評分p的評分者的 蠨y − yv蠩蠨y − y 蠩 a衃衯衶蠨衁蠬衂蠩 i l n Ch 蠽 v 蠽q uX 衖衡衲蠨A蠩衖衡衲蠨B蠩 e n gu c h 蠨yi U− y 蠩 X 蠨y − y 蠩 t X. n. ρ衞ab. er. io. 集合蠬而兩位評分者a、b之間評分的相關係數計算如方程式蠨蠲蠮蠸蠩蠺 a. ai. bi. b. i∈R0. ai. i∈R0. a. 2. bi. b. 蠨蠲蠮蠸蠩. 2. i∈R0. 0. 其中R 為評分者r與有評分項目p的使用者有共同評分項目的交集蠬y a 為使用者a與r的有評分交 集項目的平均評分。這條方程式是以評分者r本身的平均評分為基準蠬再加上評分者r與其他評 分者的相關程度作為加權的指標。以下用一個例子來說明衇衲衯衵衰行补衮衳在推薦文章時系統用來預 測的運作情形。 假設有一筆評分資料如表蠲蠮蠱,若系統要決定是否推薦使用者衁編號蠶的文章蠬則必須先預測 評分者衁對於文章編號蠶的評分。因此系統先看看有哪些人有評比過文章編號蠶。由表蠲蠮蠱得知有 蠱蠳.

(18) 文章編號 評分者. 蠱. 衁 衂 衃 衄 衅 衆. 蠱 蠵 蠴 蠲 蠲 蠴 蠳 蠴 蠳 蠳 蠲. 蠲. 蠳. 蠴. 蠵. 蠴 蠲 蠱 蠵. 蠶. 蠷. 蠲 蠵. 蠳 蠳 蠳. 蠴 蠳 蠵. 表 蠲蠮蠱蠺 相關係數法說明範例 評比文章編號蠶的使用者有衂和衃兩位蠬因此先計算衁與衂以及衁和衃之間的相關係數。大多數情 況每個人所評分的文章不盡相同蠬因此分別只取衁和衂之間蠬以及衁和衃之間有共同評比的文章評. 政 治 大 關係數衞 ρ 為−蠰.蠸蠬衁和衃之間的相關係數衞 ρ 為蠱蠬表示衂的評分標準與衁大致相反蠬而衃的評分標 立 準與衁呈現正相關。再代入蠨蠲蠮蠷蠩式即可計算出衁對於文章編號蠶的評分預測值蠴蠮蠵蠶蠬四捨五入即. 分再根據蠨蠲蠮蠸蠩式計算出衁和衂、衁和衃的相關係數衞 ρAB 、衞 ρAC 。結果計算出評分衁和衂之間的相 AC. 學. ‧ 國. AB. 為最高分蠵分蠬因此系統會推薦他瀏覽編號蠶的文章。 然而這種方法實際上在計算時有兩個問題需要注意蠺. ‧. 蠱蠮 評分稀疏性問題蠨衲衡衴衩衮衧衳 衳衰衡衲衳衩衴衹 衰衲衯衢衬补衭蠩蠺在蠱蠮蠱蠮蠱節介紹合作式推薦系統所面臨的第一. y. Nat. 點問題。由於一個人通常只會評分一部份項目蠬因此這類的評分資料大部份很零散、稀. sit. 疏蠬整個資料一定會有不少遺漏值蠬如果兩位評分者間的評分只有一項交集則無法評估他. al. er. io. 們的相關性蠬甚至評分者r與其他評分者的共同評分項目都毫無交集的話亦無從預測起蠬使. v. n. 得沒辦法透過蠨蠲蠮蠸蠩式計算相關係數蠬蠨蠲蠮蠷蠩式也因此無法計算。. Ch. engchi. i n U. 蠲蠮 由於這個公式牽涉到兩位評分者之間的相關係數蠬而相關係數的算法又是共變異數除以 兩者標準差的乘積蠬若有一位評分者都是預測為同一個分數蠬則會造成那位評分者評分的 變異數為蠰蠬使得相關係數公式的分母也是蠰蠬導致相關係數無法求出蠬蠨蠲蠮蠷蠩式自然也無法求 得。 以上述例子來說明蠬若系統決定是否推薦使用者衁編號蠷的文章蠬則先預測衁評比文章編 號蠷的分數。由上表得知有評分文章編號蠷的評分者有衄、衅、衆三位。但是針對衁與衄、衅兩位 分別求相關係數的時候卻遇到了困難蠺評分者衁與評分者衄的評分項目交集數只有一項蠬這時則沒 辦法計算相關係數衞 ρAD 蠻評分者衅由於評分皆為蠳蠬計算相關係數時代入蠨蠲蠮蠸蠩式可發現評分者衅的 蠱蠴.

(19) 變異數衖衡衲蠨衅蠩為蠰蠬使得蠨蠲蠮蠸蠩式的分母為蠰以致於無法計算出相關係數蠻而評分者衆與評分者衁在 文章的評分上完全沒有交集蠬因此也完全沒有辦計算相關係數衞 ρAF 蠬導致沒有辦法代入蠨蠲蠮蠷蠩式 去預測衁評分文章編號蠷的分數蠬因此沒有任何資訊能作為是否推薦的基準。這樣的問題我們 在蠳蠮蠲節提到以保守預測成蠳的方式解決。. 2.3. 矩陣分解理論. 蠱蠮蠱蠮蠱節曾經提過合作式推薦者系統被一些成功的商業系統所使用。而合作式推薦系統 又包含兩個主要領域蠬分別為鄰域法蠨衮补衩衧表衢衯衲表衯衯衤 衭补衴表衯衤衳蠩和潛在因素模型蠨衬衡衴补衮衴 衦衡衣衴衯衲 衭衯衤补衬衳蠩。鄰域法是藉由鄰近蠨衮补衩衧表衢衯衲衩衮衧蠩項目的評分來評估評分者對於某項項目的偏號程. 治 政 大 用者乙、丙、丁三人也喜歡這個產品蠬那麼系統便會自動搜尋他們其他喜歡的產品。如果乙、 立 丙、丁三人都喜歡產品衄蠬他們之中的兩人喜歡產品衅蠬他們之中的一人喜歡產品衆蠬那麼系統就會. 度。例如蠺甲喜歡產品衁、衂、衃並給予高分蠬系統會尋找這些同樣給予高分的使用者蠬假設找到使. ‧ 國. 學. 向甲依序推薦產品衄、衅、衆。. 潛在因素模型蠨衬衡衴补衮衴 衦衡衣衴衯衲 衭衯衤补衬衳蠩則試著去從項目和使用者的評分關係中找出有何潛. ‧. 在因素蠬例如電影可以分為含有多少恐怖片、喜劇等成份蠬而使用者對於恐怖片、喜劇等等的喜 好程度為何。衋衯衲补衮等人蠨蠲蠰蠰蠹蠩提出成功實現潛在因素模型的方法是建立在矩陣分解蠨衭衡衴衲衩衸. Nat. sit. y. 衦衡衣衴衯衲衩衺衡衴衩衯衮蠩的模型。每個評分者r對於一項項目特性的喜好程度以向量ur 表示蠬而每個項. er. io. 目p所具備的特性程度則以向量cp 表示蠬ur 和cp 皆為一個維度m的向量。兩者的內積為評分者r對 於項目p之特性的喜好程度之交互作用蠬因此針對評分者r對於項目p的評分估計如蠨蠲蠮蠹蠩式蠺. n. al. i C h y衞 蠽 c u 蠽 u U c n engchi rp. T p. v. T r p. r. 蠨蠲蠮蠹蠩. 衞 因此蠬整個評分資料Y的估計矩陣可以分解成為分解成兩個矩陣蠺 衞 蠽 UT C 蠽 蠨CT U蠩T Y h. i. h. 蠨蠲蠮蠱蠰蠩. i. 其中U 蠽 u1 , u2 , · · · , u|R| 蠬 C 蠽 c1 , c2 , · · · , c|P | 蠬分別為所有評分者對於項目特性的喜好程 度和所有項目所具備的特性程度的矩陣表示。 由於不是所有人都會對全部項目加以評分蠬因此這樣的資料會有一些遺漏值存在蠬在早期 的系統是以奇異值分解法蠨衳衩衮衧衵衬衡衲 衶衡衬衵补 衤补衣衯衭衰衯衳衩衴衩衯衮蠬術衖衄蠩並補滿遺漏值蠬因為有遺漏值很 難做蠬因此按照現有的評分資訊為依據並將遺漏值補滿。但是卻有兩項問題蠺第一是隨著資料 蠱蠵.

(20) 量愈龐大蠬執行這項工程的費用就愈貴蠻第二是使用插補法填入的數值並不是真正的評分值蠬會 扭曲資料的真實性。因此近期則使用既有的評分資料蠬透過正規化蠨衲补衧衵衬衡衲衩衺补衤蠩的建模方式以 避免過度配適蠨衯衶补衲蠌衴衴衩衮衧蠩的情形。為了求出cp 和ur 蠬利用正規化最小平方法得到脊迴歸蠨衲衩衤衧补 衲补衧衲补衳衳衩衯衮蠩的型式蠺 衭衩衮 u,c. X. 蠨yrp − cTp ur 蠩2 蠫 λ蠨||ur ||2 蠫 ||cp ||2 蠩. 蠨蠲蠮蠱蠱蠩. p∈P,r∈R. 文獻中對這條方程式的解法使用了隨機梯度遞減法蠨術衴衯衣表衡衳衴衩衣 衧衲衡衤衩补衮衴 衤补衳衣补衮衴蠩和交錯 最小平方法蠨衁衬衴补衲衮衡衴衩衮衧 行补衡衳衴 術衱衵衡衲补衳蠬衁行術蠩蠬對於cp 和ur 用隨機梯度遞減法求解極值蠬在本論 文是採用脊迴歸的解搭配交錯最小平方法求解cp 和ur 。 要解方程式蠨蠲蠮蠹蠩蠬則相當於要解cp 和ur 蠨即解出C和U蠩蠬可是由於這兩個數都是未知的蠬因 此沒有辦法直接解。但是我們可以先假定ur 蠨U蠩為已知常數蠬再利用最小平方法解出cp 蠨C蠩之. 政 治 大 定c 蠨C蠩為已知常數的做法亦同理。對於參數λ則利用交叉驗證蠨衣衲衯衳衳 衶衡衬衩衤衡衴衩衯衮蠩的方式選取適 立. 後再解新的ur 蠨U蠩蠬在從這個ur 蠨U蠩繼續解cp 蠨C蠩蠬蠮 蠮 蠮 蠬直到兩個矩陣蠨C和U蠩都收斂為止蠬在假 p. 學. ‧ 國. 當的值蠬這種方法稱為交錯最小平方法。. 當我們先固定ur 蠽 u∗r 以便解cp 蠬此時針對特定的k ∈ P 之下求解ck 做最小平方法的程序如 下蠺. 2 2 ∗ 2 − u∗T r cp 蠩 蠫 λ蠨||ur || 蠫 ||cp || 蠩, k ∈ P. P. ⇒. d dck. P. ⇒. d ||yk dck. − U∗ Ck || 蠫 λcTk ck 蠽 蠰. ⇒. d 蠨yk dck. − U∗ Ck 蠩T 蠨yk − U∗ Ck 蠩 蠫 λcTk ck 蠽 蠰. ⇒. d yT y dck k k. ⇒. d dck. r∈R,p∈P 蠨yrp. n. ∗ T k U ck. Ch. y. sit. io. a−ly. 2 T − u∗T r ck 蠩 蠫 λck ck 蠽 蠰. er. Nat. r∈R 蠨yrk. ‧. d dck. − cTk U∗T yk 蠫 cTK U∗T U∗ ck 蠫 λcTk ck 蠽 蠰. i n U. v. − 蠲ykT U∗ ck 蠫 cTK U∗T U∗ ck 蠫 λcTk ck 蠽 蠰. engchi. ⇒ −蠲U∗T yk 蠫 蠲U∗T U∗ cK 蠫 蠲λck 蠽 蠰. ⇒ U∗T U∗ ck 蠫 λck 蠽 U∗T yk ⇒ 蠨U∗T U∗ 蠫 λI蠩ck 蠽 U∗T yk ⇒ ck 蠽 蠨U∗T U∗ 蠫 λI蠩−1 U∗T yk .  y1k    y2k 其中yk 蠽   蠮蠮  蠮  . yrk.     h i  蠬 U∗ 蠽 u1 , u2 , · · · , u|R|    . 蠱蠶.

(21) 因此對於所有的cp 做最小平方法可得到下式蠺 cp 蠽 蠨U∗T U∗ 蠫 λI蠩−1 U∗T yp. 蠨蠲蠮蠱蠲蠩. 同理對於所有的ur 做最小平方法可得到下式蠺 ur 蠽 蠨C∗T C∗ 蠫 λI蠩−1 C∗T yr . . . . .    i h  蠬 C∗ 蠽 c∗ , c∗ , · · · , c∗ 1 2  |P |   .  yr1  y1p        i h  yr2  y2p  ∗ ∗ ∗ ∗   其中yp 蠽  蠮 蠬 U 蠽 u1 , u2 , · · · , u|R| 蠬 yp 蠽   蠮蠮  蠮  蠮蠮     . yrp. . 蠨蠲蠮蠱蠳蠩. yrp. 政 治 大. 文獻內還提及項目的評分衞 ypr 不只受到評分者對於項目特性的喜好ur 以及項目所具備的特. 立. 性cp 影響蠬還包括評分者自己的衡量準則、項目的優良程度的影響蠬這些數值也會隨著時間的流. ‧ 國. 學. 逝而慢慢變化。但是要先從最簡單的模型研究得到結果蠬才能對更複雜的模型繼續研究蠬因此有 關矩陣分解的方法以蠨蠲蠮蠹蠩、蠨蠲蠮蠱蠱蠩式為主進行實證研究。. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. 蠱蠷. i n U. v.

(22) Chapter 3 研究方法 本章分為三節蠺第一節介紹由衈衯和衑衵衩衮衮所提及的衉衒衔模型法來預測蠬第二節介紹由衒补衳衮衩衣衫等. 治 政 在衉衒衔模型法和相關係數法為衒蠬在交錯最小平方法為衍衡衴衬衡衢。 大 立. 人所提及的相關係數預測法蠬第三節介紹交錯最小平方法來解方程式蠨蠲蠮蠹蠩。使用的統計軟體. IRT模 模型 法. ‧ 國. 學. 3.1. 在這一節我們使用衈衯和衑衵衩衮衮的研究方法。我們會將實際的資料先遮住蠱蠰蠥1 蠬運用剩. ‧. 下的這蠹蠰蠥資料作為訓練集蠨衴衲衡衩衮衩衮衧 衳补衴蠩來建立模型蠬並根據方程式蠨蠲蠮蠵蠩計算出所有項目在 這蠹蠰蠥的資料下分別被所有評分者評分為蠱分至C分的機率蠬然後再從中取最大值作為預測數. y. Nat. sit. 值預測被遮住的蠱蠰蠥的測試集蠨衴补衳衴衩衮衧 衳补衴蠩蠬以預測的數值和原始的評分數值比較結果。此. al. er. io. 外蠬衈衯和衑衵衩衮衮蠨蠲蠰蠰蠸蠩當時假是設對所有的βr > 蠰蠬如此一來便能夠從θp 的正負號來判別項目品. v. n. 質的好壞蠬可是由於並不是所有評分者對項目的認知都一樣蠬也許有人對於項目的品質認知是和. Ch. i n U. 其他人完全相左的蠬或者也有人對於項目的品質毫無判斷力。因此先檢定兩兩評分者間的相關. engchi. 係數是否有顯著小於蠰的情形蠬如果有兩兩評分者間的相關係數小於蠰則表示至少有一個人和其 他人的品質認知是相反的蠬這時再以不限制βr 的正負號之下來加以預測蠬並和βr > 蠰的預測結果 比較。 這項研究是利用統計軟體衒提供的衰衡衣衫衡衧补 衜衒衡衴衩衮衧衳蠢蠬由於這個衰衡衣衫衡衧补所提供的程式在 生成衍衃衍衃樣本時在直接用原始資料會無法運作蠬衈衯和衑衵衩衮衮在研究的時候是刪除一些評分數 過少的評分者蠬再以刪除過的新資料進行研究蠬而本研究也使用這樣的方法。以下列出詳細的步 1. 遮住資料的方式是根據每個人評分的產品數隨機遮住10%的評分數目並無條件捨去小數點,由於像評分22筆資 料的人遮住10%並捨去小數點後即為2筆,因此累加起來保留的資料可能大於90%. 蠱蠸.

(23) 驟蠺. 蠱蠮 先將刪除過後的資料隨機遮住蠱蠰蠥作為測試集。 蠲蠮 檢定兩兩評分者間評分的相關係數是否有顯著小於蠰。在檢定之前先排除共同評分數小 於蠲的兩兩評分者蠬因為兩人之間共同評分的項目交集只有一項或是沒有共同評比項目無 法求出相關係數蠬兩人之間的共同評分數為蠲則相關係數小於蠰的值必然是蠱。 蠳蠮 選定切點γ0 , γ1 , · · · , γ5 的起始值蠬並用衍衃衍衃抽出參數的後驗分配{αr(m) , βr(m) , θp(m) , γ (m) }M m=1 蠬本 論文選取 M 蠽 蠲蠰蠰蠰蠰。 蠴蠮 以剩下的蠹蠰蠥訓練集建模蠬並計算出第r個人對項目p評分c分的機率πrpc 蠬即蠨蠲蠮蠵蠩式。. 治 政 蠵蠮 第r個 評 分 者 對 於 項 目p的 評 分 預 測 值 即 為蠬從π大, . . . , π 立 的C值即為評分的預測值。 rp1. rpC 中 取 最 大 的 數 值蠬其 對 應. ‧ 國. 學. 蠶蠮 比較實際的評分值與預測數值的結果蠬並計算平均平方誤差蠨衍补衡衮 術衱衵衡衲补 衅衲衲衯衲蠬衍術衅蠩。. ‧. 蠷蠮 若有兩兩評分者間評的相關係數小於蠰的情況蠬則在不設限βr 的狀況重做步驟三到六蠬並比 較βr > 蠰以及不設限βr 的結果及衍術衅。. y. Nat. er. io. sit. 蠸蠮 選定其他不同的γ0 , γ1 , · · · , γ5 起始值蠬並比較預測結果及衍術衅。. 由於在遮住蠱蠰蠥資料的時候有可能會遮到剛好只有一個人評分的產品之分數蠬使得該評分. n. al. Ch. i n U. v. 項目所在的行和列都是遺漏值蠬導致沒有評分者或是項目都沒有資訊可以預測該項評分蠬這種情. engchi. 形只能保守預測為蠳分。我們會分別做出加入這些數值作預測以及沒有加入這些數值作預測 的衍術衅結果。. 3.2. 相關係數預測法. 在這一節利用衒补衳衮衩衣衫等人蠨蠱蠹蠹蠴蠩的所提及的相關係數法作為預測方式蠬也就是合作式推薦 系統在決定是否推薦一個項目時蠬所根據的預測評分之計算方式。由於使用這項方法很容易遇 到蠲蠮蠲節所提到的兩個問題蠬因此針對評分者出現評分同一筆數字的狀況蠬使用的處理方法為刪除 該筆使用者蠬以避免計算相關係數的時候會出現評分為蠰的情況蠬同時也解決了衈衯和衑衵衩衮衮所提 蠱蠹.

(24) 及的第二點問題蠺找出一部份產品品質的判別能力較弱的評分者。針對另一項評分稀疏性的問 題蠬即若欲比較和其他人之間的評分項目亦無交集的情況下蠬因為沒有其他和使用者及項目有關 的資訊蠬因此保守預測為蠳。為了方便比較蠬所預測的資料為上一節刪除過且遮住的蠱蠰蠥的部份。 所使用的步驟如下蠺 蠱蠮 欲預測第r個人所評分的項目p蠬首先先選取有評分該項目p的評分者。 蠲蠮 在選取的評分者中排除掉只評一項項目和評分者評比項目的分數皆一樣的人蠬避免在計算 時出現變異數為蠰的情況。 蠳蠮 按照蠨蠲蠮蠷蠩式的公式計算蠬並將預測的評分值採取四捨五入的動作。若有評分者與第衲個人 之間無項目交集蠬相關係數直接設為蠰蠻若所有評分者評分的項目都沒有和評分者r所評分. 政 治 大 蠴蠮 比較實際的評分值與預測數值的結果蠬並計算衍術衅。 立. 的項目有共同交集蠬則完全無法代入蠨蠲蠮蠷蠩式計算蠬此時將評分值保守預測為蠳。. 矩陣分解法. ‧ 國. 學. 3.3. ‧. 衞 在這一節使用衋衯衲补衮等人蠨蠲蠰蠰蠹蠩所提出的矩陣分解理論蠬將評分資料的估計矩陣Y分解 成U和C兩個矩陣蠬並利用交錯最小平方法蠨衁行術蠩求解。所預測的資料仍為衉衒衔模型法中資料被. y. sit. io. al. er. 二維作分析。. Nat. 刪減後被遮住的蠱蠰蠥。由於文獻中關於U和C的行維度m都只有二維蠬因此本研究的維度也將以. n. 蠱蠮 利用交叉驗證的方式決定λ的數值。. Ch. engchi. i n U. v. 蠲蠮 隨機生成矩陣U的數值蠬並藉由方程式蠨蠲蠮蠱蠲蠩求出C蠬再利用方程式蠨蠲蠮蠱蠳蠩求出新的U蠬直到 兩個矩陣皆收斂為止。 衞 蠳蠮 將兩個矩陣作相乘生成預測矩陣Y蠬並比較實際的評分值與預測數值的結果並計算衍術衅。 蠴蠮 將步驟蠲、蠳重複蠱蠰蠰次後記錄所得到的衍術衅之資訊蠺平均數、最大值、最小值、變異數。. 蠲蠰.

(25) Chapter 4 實證研究 本章分為五個小節。第一節介紹在本研究使用的實證資料蠬第二節闡述使用衉衒衔模型法. 治 政 的預測結果蠻第四節將矩陣分解法的結果做個整理蠬第五節綜合上述三種研究方法的比較並做一 大 立 個總評。 在βr > 蠰與不限制βr 的比較以及利用這個方法做出的預測結果蠻第三節描述相關係數法所做出. ‧ 國. 學. 4.1. 實證資料. ‧. 我們利用兩筆資料來做分析。第一筆資料是從衍衯衮衤衯 衔衩衭补衳 蠨表衴衴衰蠺蠯蠯衷衷衷蠮衭衯衮衤衯衴衩衭补衳蠮 衣衯衭蠩蠬來自一家關於傳播媒體的網路公司。這筆資料在衈衯和衑衵衩衮衮經由網站作者同意之下蠬寫. y. Nat. sit. 入了統計軟體衒的衒衡衴衩衮衧 衰衡衣衫衡衧补裡。該筆資料一共有蠱蠵蠱蠵個新聞產品以及蠹蠴蠶位評分者蠬每. al. er. io. 個產品被評分的次數在蠱至蠸蠹次之間蠬每位評分者的評分次數在蠱至蠱蠳蠰之間蠬而產品的評分. n. 以蠱分至蠵分代表衡衷衦衵衬蠬衰衯衯衲蠬衡衶补衲衡衧补蠬衶补衲衹 衧衯衯衤蠬衧衲补衡衴分為五個等級蠬各個等級評分的人數分別. Ch. i n U. v. 有蠱蠰蠰蠳蠬蠶蠰蠶蠬蠸蠶蠴蠬蠸蠹蠲蠬蠱蠱蠷蠶人蠬總共有蠴蠵蠱蠱筆評分資料蠬占了總資料的蠰蠮蠳蠱蠥。. engchi. 第二筆資料是來自衍衩衮衮补衳衯衴衡大學的衇衲衯衵衰行补衮衳 衒补衳补衡衲衣表 衐衲衯衪补衣衴 蠨表衴衴衰蠺蠯蠯衭衯衶衩补衬补衮衳蠮 衵衭衮蠮补衤衵蠩蠬檔名為衍衯衶衩补行补衮衳蠬內容包含了從蠱蠹蠹蠷年蠹月蠱蠹日至蠱蠹蠹蠸年蠴月蠲蠲日總共蠱蠰蠰蠰蠰蠰筆的 電影評分資料蠬總共有蠹蠴蠳位評分者蠬被評分的電影一共有蠱蠶蠸蠲部蠬每部電影的評分由低至高 為蠱分至蠵分蠬從蠱分至蠵分的資料筆數一共有蠶蠱蠱蠰蠬蠱蠱蠳蠷蠰蠬蠲蠷蠱蠴蠵蠬蠳蠴蠱蠷蠴蠬蠲蠱蠲蠰蠱筆蠬占了所有資料 的蠶蠮蠳蠥。 在進行實證研究時蠬我們將衍衯衮衤衯這筆資料遮住蠱蠰次隨機蠱蠰蠥的評分資料蠬分別作為蠱蠰次的 訓練測試集蠻衍衯衶衩补行补衮衳則遮住蠵次隨機蠱蠰蠥的評分資料蠬作為蠵次的訓練測試集。. 蠲蠱.

(26) 4.2. IRT模 模型 法 分 析. 4.2.1. βr 是 否 限 制 大 於 0. 衈衯和衑衵衩衮衮蠨蠲蠰蠰蠸蠩當時假設是對所有的βr > 蠰蠬如此一來便能夠從θp 的正負號來判別項目 品質的好壞。可是由於並不是所有評分者對項目的認知都一樣蠬即也許有人的品質認知是和其 他人完全相左的。例如衍衯衮衤衯這筆資料是做新聞媒體方面的評分蠬有些新聞媒體會有政黨的 傾向蠬因此對於不同政黨傾向的評分者對於新聞媒體的評分取向可能會完全相反蠬這時會考慮 將βr 的範圍設為實數。若將βr 的範圍設為實數時蠬βr 為正則可以從θp 的正負號和大小判別項目 的品質蠻βr 接近蠰時表示評分者對項目品質的優劣程度毫無判別能力蠬這時不論θp 高或低也幾乎 不會改變評分分數蠻βr 若為負數蠬愈低表示評分者愈容易以相反的觀點去判別項目的品質蠬在這 時θp 為負數的情況對該位評分者來說項目品質反而是較好的。. 政 治 大. 在此對本文使用的兩筆實證資料進行檢驗。蠳蠮蠱節提到本研究所使用的衰衡衣衫衡衧补 蠢衒衡衴衩衮衧衳蠢. 立. 無法直接用原始資料生成衍衃衍衃樣本蠬因此作者刪除了部份資料再進行研究蠬故我們也採用相同. ‧ 國. 學. 的作法。以衍衯衮衤衯這筆資料我們刪除評分次數少於蠵的評分者蠬然後再排除去掉這些評分者後導 致沒人評分的項目1 蠬遂成為一個蠲蠳蠲個評分者和蠱蠲蠸蠶個新聞媒體的評分矩陣。 為了確認資料中是否有評分者對項目的認知與其他人相反的情形蠬首先做出兩兩評分者的. ‧. 相關係數是否有小於蠰的檢定蠬若有兩位評分者的相關係數小於蠰表示有評分者和其他人對於項. io.   Ha 蠺 ρ < 蠰. n. al. ρ≥蠰. Ch. er.    H0 蠺. sit. y. Nat. 目品質的認知是相反的。針對兩人的相關係數是否小於蠰的檢定如下蠺. i n U. v. 其中ρ為兩兩評分者間評分的母體相關係數。在資料進行刪除後所剩下的蠲蠳蠲人之中蠬一 . 共有. . 232 2. engchi. 蠽 蠲蠶蠷蠹蠶組 兩 兩 配 對 的 組 合蠬在 這 之 中 篩 選 兩 人 之 間 共 同 評 分 數 超 過蠲的 一 共. 有蠱蠲蠳蠶組2 蠬在 顯 著 水 準 為蠰蠮蠰蠵之 下蠬兩 兩 評 分 者 間 評 分 的 相 關 係 數 顯 著 小 於蠰的 情 形 一 共 有蠷蠱組蠬占了約蠵蠮蠷蠴蠥。以下將這蠷蠱組衰蠭衶衡衬衵补製成表格和圖形在圖蠴蠮蠱與表蠴蠮蠱蠬可看出這蠷蠱組兩 兩評分者之間的相關係數的衰蠭衶衡衬衵补有蠴蠷組落在蠰至蠰蠮蠰蠰蠵之間蠬占了蠶蠶蠮蠲蠥。 將 同 樣 的 作 法 代 至衍衯衶衩补行补衮衳這 筆 資 料 。 由 於 該 筆 資 料 相 當 龐 大蠬因 此 使 用衉衒衔模 型 1. ”Rating”這個package裡生成MCMC樣本的程式ordrating在資料量太大時會直接關閉視窗,而資料矩陣若有 一行或一列都是遺漏值則會出現錯誤訊息。在Mondo資料中,評分次數少於5次的有714人。 2 若兩人之間的共同評分數為2,則計算出來的相關係數只有-1,0,1三種,若為-1則必定拒絕H0 。. 蠲蠲.

(27) 衰蠭衶衡衬衵补. 蠰蠭蠰蠮蠰蠰蠵. 蠰蠮蠰蠰蠵蠭蠰蠮蠰蠱. 蠰蠮蠰蠱蠭蠰蠮蠰蠱蠵. 蠰蠮蠰蠱蠵蠭蠰蠮蠰蠲. 蠰蠮蠰蠲蠭蠰蠮蠰蠲蠵. 蠴蠷. 蠴. 蠴. 蠰. 蠶. 蠰蠮蠰蠲蠵蠭蠰蠮蠰蠳. 蠰蠮蠰蠳蠭蠰蠮蠰蠳蠵. 蠰蠮蠰蠳蠵蠭蠰蠮蠰蠴. 蠰蠮蠰蠴蠭蠰蠮蠰蠴蠵. 蠰蠮蠰蠴蠵蠭蠰蠮蠰蠵. 蠲. 蠳. 蠳. 蠳. 蠰. 個數 衰蠭衶衡衬衵补 個數. 表 蠴蠮蠱蠺 衍衯衮衤衯資料下兩兩評分者相關係數的衰蠭衶衡衬衵补小於蠰蠮蠰蠵的分布表. 立. 政 治 大. ‧. ‧ 國. 學 sit. y. Nat. 圖 蠴蠮蠱蠺 衍衯衮衤衯資料下兩兩評分者相關係數的衰蠭衶衡衬衵补小於蠰蠮蠰蠵分布的直方圖. er. io. 法 預 測 時蠬我 們 先 刪 除 評 比 次 數 少 於蠱蠲蠰的 評 分 者蠬成 為 一 個蠳蠰蠵位 評 分 者 和蠱蠶蠰蠵部 電 影 的 評 分 矩 陣 。 經 過 刪 減 資 料 的 動 作 之 後蠬該 筆 資 料 中 篩 選 兩 人 之 間 共 同 評 分 數 超 過蠲的 一. al. n. 共有. . . 305 2. Ch. i n U. v. 蠽 蠴蠶蠳蠶蠰組蠬在顯著水準為蠰蠮蠰蠵之下蠬兩兩評分者間評分的相關係數顯著小於蠰的. engchi. 情形一共有蠶蠴蠲組蠬占了約蠱蠮蠳蠸蠥。畫出這蠶蠴蠲組的衰蠭衶衡衬衵补分布圖與分布表於圖蠴蠮蠲表蠴蠮蠲蠬可看 出衍衯衶衩补行补衮衳這筆資料可看出兩兩評分者相關係數的衰蠭衶衡衬衵补小於蠰蠮蠰蠵的分布大置上相當平均。 衰蠭衶衡衬衵补 個數 衰蠭衶衡衬衵补 個數. 蠰蠭蠰蠮蠰蠰蠵. 蠰蠮蠰蠰蠵蠭蠰蠮蠰蠱. 蠰蠮蠰蠱蠭蠰蠮蠰蠱蠵. 蠰蠮蠰蠱蠵蠭蠰蠮蠰蠲. 蠰蠮蠰蠲蠭蠰蠮蠰蠲蠵. 蠹蠰. 蠶蠰. 蠵蠵. 蠶蠴. 蠶蠹. 蠰蠮蠰蠲蠵蠭蠰蠮蠰蠳. 蠰蠮蠰蠳蠭蠰蠮蠰蠳蠵. 蠰蠮蠰蠳蠵蠭蠰蠮蠰蠴. 蠰蠮蠰蠴蠭蠰蠮蠰蠴蠵. 蠰蠮蠰蠴蠵蠭蠰蠮蠰蠵. 蠶蠸. 蠶蠲. 蠵蠷. 蠴蠹. 蠶蠸. 表 蠴蠮蠲蠺 衍衯衶衩补行补衮衳資料下兩兩評分者相關係數的衰蠭衶衡衬衵补小於蠰蠮蠰蠵的分布表. 蠲蠳.

(28) 政 治 大. 圖 蠴蠮蠲蠺 衍衯衶衩补行补衮衳資料下兩兩評分者相關係數的衰蠭衶衡衬衵补小於蠰蠮蠰蠵分布的直方圖. 立. 從這兩筆資料的圖表可看出來衍衯衮衤衯的資料共同評分筆數較少蠬因此很容易藉由幾筆共. ‧ 國. 學. 同的評分分數據判定若兩兩評分者間的相關係數蠬因此在若為負值則衰蠭衶衡衬衵补趨近於蠰的數目較 多蠻衍衯衶衩补行补衮衳則有較多的兩兩共同評分資料蠬因此相關係數的計算上即使算出來的相關係數是. ‧. 負值蠬衰蠭衶衡衬衵补的分布也沒有極端到都靠近蠰蠬反而分布得較平均。. y. Nat. 衈衯和衑衵衩衮衮原本的目的就是以建模的方式產生統計圖表以改進他們指出目前評分圖表的. sit. 問題蠬並讓人能夠對於項目分別被評為蠱分至C分的機率一目了然。圖蠴蠮蠳就是利用這個作法列. er. io. 出衍衯衮衤衯資料中前蠱蠲個新聞媒體的衭衯衤补衬蠭衢衡衳补衤 衳衴衡衲衰衬衯衴蠬排名則是由衍衃衍衃抽出的後驗分配. al. iv n C 評分所做出的結果蠬星星的顏色深淺程度代表在現有的評分資料下蠬各個評分類別的相對機率。 hengchi U 而β 不限制的情況下利用衉衒衔模型法做出來的結果如圖蠴蠮蠳的右半部所示。和左半部比較起 n. 中蠬以品質高低的參數θp 之中位數作為依據蠻左半部是在βr > 蠰之下蠬使用者對蠱蠲個新聞媒體的. r. 來蠬幾乎所有媒體的排名變化不大蠬最多只是交換順序蠬唯獨衇衲补衡衴 衆衡衬衬衳 衔衲衩衢衵衮补卻從第一名掉到 最後一名了蠬可知βr 是否限定大於蠰蠬對於項目的評分的排名也會造成很大的影響。. 針對這個現象進行研究時做了所有評比過衇衲补衡衴 衆衡衬衬衳 衔衲衩衢衵衮补的人並分別畫出這六個 人在項目品質和評分分數的散布圖如圖蠴蠮蠴。在這六人中蠬衲衡衴补衲蠷蠶蠸將衇衲补衡衴 衆衡衬衬衳 衔衲衩衢衵衮补評 分蠱分蠬其他蠵個則是評分蠵分。從圖蠴蠮蠴中可看出除了衲衡衴补衲蠷蠶蠸以外蠬剩下五位在θp 和實際評分的 蠲蠴.

(29) 治 政 大 圖 蠴蠮蠳蠺 衍衯衮衤衯資料前蠱蠲個新聞媒體的衭衯衤补衬蠭衢衡衳补衤 衳衴衡衲衰衬衯衴蠬左半部是β 部是不限制β 做出的結果 立. r. > 蠰做出的結果蠬右半. r. ‧ 國. 學. 散布圖當中蠬βr 不限制之下的斜率是負的蠬雖然倒數兩位評分者大部份都評蠱分蠬但是由全部的資 料還是能看出斜率為負蠬意即這些人的評分取向和其他大多數的評分者相左。在βr > 蠰的假設. ‧. 之下蠬這五位評蠵分的βr 會是一個接近蠰的正數蠬因此所對應的θp 值是個極大的數值蠬βr θp 的值也. y. Nat. ∗ 才能讓yrp 落在評蠵分的區間蠬又因為排名的依據是按照θp 之中位數蠬這種情況下才會使得排名為. sit. 第一名蠻因此在將βr > 蠰的假設去除掉之後蠬這些評分者的βr 的估計是負數蠬θp 也會是負數才會. er. io. ∗ 落在評蠵分的區間蠬這就會造成衇衲补衡衴 衆衡衬衬衳 衔衲衩衢衵衮补的排名下降。其他 使βr θp 的值為正並讓yrp. al. iv n C 人蠬因此有些評分者的β 是負數的人貢獻到衇衲补衡衴 h e n g c h衆衡衬衬衳 i U衔衲衩衢衵衮补的θ 值也可能是負值蠬使得整體 來說θ 值會變小蠬造成排名降低的情形。 n. 評分者雖然沒有對衇衲补衡衴 衆衡衬衬衳 衔衲衩衢衵衮补進行評分蠬但我們已算出有蠷蠱組兩兩評分者意見相反的 r. p. p. 4.2.2. Mondo預 預測 結 果. 本研究一開始是利用衉衒衔模型法預測衍衯衮衤衯這筆資料。上一小節提到排除評比次數少 於蠵的評分者之後這筆資料成了一個蠲蠳蠲位評分者和蠱蠲蠸蠶個新聞媒體的評分矩陣蠬從這矩陣當中 以蠹蠰蠥訓練集的資料進行建模蠬並計算出評分蠱至蠵的各個事後機率蠬從中取最大的機率值對應的 評分數當作預測的分數並對蠱蠰蠥的測試集作為預測對象。 蠲蠵.

(30) 立. 政 治 大. ‧ 國. 學. 圖 蠴蠮蠴蠺 衍衯衮衤衯資料下評衇衲补衡衴 衆衡衬衬衳 衔衲衩衢衵衮补的六個人. ‧. 由於在遮住資料蠱蠰蠥之後會遇到蠳蠮蠱節最後一段所提及的問題蠬即會遮到該筆評分項目恰好. y. Nat. sit. 只有一個人評分的情況蠬本論文的作法是分成情況衁和情況衂蠺情況衁在計算衍術衅以及預測的時候. al. er. io. 會納入這些數據加以計算蠬而這些只有一人評分項目的分數被遮掉時由於沒有資訊可以推測這. n. 筆資料的評分情形蠬這種時候只能保守給蠳分蠻情況衂則是在預測方面和計算衍術衅時排除這些無法. Ch. i n U. v. 被預測的數據蠬直接以能夠被預測的資料進行預測和計算衍術衅。. engchi. 在蠲蠮蠲節 的 文 獻 探 討 提 到γ0 蠽 −∞ < γ1 蠽 蠰 < · · · < γC 蠽 ∞則 為 一 序 列 的 切 ∗ 點蠬視yrp 所落在的範圍將分數評為蠱蠬蠲蠬蠮 蠮 蠮 蠬C分。因為這筆評分資料最高只有評蠵分蠬因此C 蠽. 蠵。而γ0 , γ1 , · · · , γ5 是以衍衃衍衃生成蠲蠰蠰蠰蠰個樣本之後才收斂蠬因此先選定起始值。 由於不同的γ0 , γ1 , · · · , γ5 起始值跑出來的結果也不同蠬因此表蠴蠮蠳先列出使用的起始值。 由於文獻中是令γ0 蠽 −∞, γ1 蠽 蠰, · · · , γ5 蠽 ∞蠬因此起始值的選法是先γ0 蠽 −蠳蠰蠰, γ5 蠽 蠳蠰蠰蠬分別設為一個很小、很大的數並按照文獻設定γ1 蠽 蠰蠬然後再將γ2 、γ3 、γ4 的起始值慢慢由 小變大。. 蠲蠶.

(31) 蠱 蠲 蠳 蠴 蠵 蠶 蠷. γ0. γ1. γ2. γ3. 蠭蠳蠰蠰 蠭蠳蠰蠰 蠭蠳蠰蠰 蠭蠳蠰蠰 蠭蠳蠰蠰 蠭蠳蠰蠰 蠭蠳蠰蠰. 蠰 蠰 蠰 蠰 蠰 蠰 蠰. 蠱 蠱蠮蠵 蠲 蠲蠮蠵 蠳 蠳蠮蠵 蠴. 蠲 蠳 蠴 蠵 蠶 蠷 蠸. γ4. γ5. 蠳 蠳蠰蠰 蠴蠮蠵 蠳蠰蠰 蠶 蠳蠰蠰 蠷蠮蠵 蠳蠰蠰 蠹 蠳蠰蠰 蠱蠰蠮蠵 蠳蠰蠰 蠱蠲 蠳蠰蠰. 表 蠴蠮蠳蠺 衉衒衔模型法所使用的γ起始值 選取好γ起始值後遂開始研究。在蠴蠮蠱蠮蠱節中已經做過在顯著水準為蠰蠮蠰蠵之下蠬一共有蠷蠱組 兩兩評分者間評分的相關係數顯著小於蠰的情形蠬因此以衉衒衔模型法做預測時一併考慮βr > 蠰和. 政 治 大. 不限制βr 兩種情況。表蠴蠮蠴為衉衒衔模型法中以上述不同的γ0 , γ1 , · · · , γ5 起始值之下所跑出來 的衍術衅值蠬所列出來的值在計算衍術衅和預測上以情況衁為主。. βr > 0. βr 不限制. βr > 0. 2.350 2.354 2.291 2.282 2.340 2.344 2.005. 2.413 2.476 2.466 2.480 1.737 1.743 1.737. 1.981 1.980 2.005 1.975 1.412 1.515 1.505. 2.364 2.437 2.412 2.354 1.650 1.704 1.733. 2.121 2.068 2.072 2.146 1.636 1.607 1.626. 2.597 2.650 2.645 2.646 2.029 2.024 2.058. βr 不限制. βr > 0. βr 不限制. βr > 0. βr 不限制. βr > 0. 2.587 2.583 2.544 2.597 1.859 1.786 1.782. 2.150 2.228 2.204 2.262 1.617 1.563 1.515. 2.301 2.262 2.248 2.330 2.335 1.752 1.786. 1.956 2.019 1.976 2.019 1.578 1.553 1.587. 2.238 2.233 2.262 2.214 2.058 1.801 1.801. io. 2.078 2.058 1.990 2.107 1.684 1.675 1.558. 8. n. al. Ch. βr > 0. βr 不限制. 2.470 2.544 2.641 2.549 2.121 1.966 1.874. 2.670 2.646 2.646 2.713 2.597 1.834 1.825. 2.121 2.204 1.981 2.092 2.005 2.058 1.699. βr 不限制. βr > 0. βr 不限制. 2.282 2.301 2.369 2.369 1.936 1.966 1.971. 2.214 2.223 2.199 2.204 1.874 1.801 1.835. 9. y. 2.189 2.272 2.180 2.209 1.684 1.665 1.718. 5 βr 不限制. 2.015 1.976 1.985 1.961 1.980 1.714 1.689. sit. 1 2 3 4 5 6 7. 7. Nat. βr > 0. 4. βr 不限制. 6. γ起始值. 3. βr > 0. ‧. 訓練測試集. 2.262 2.296 2.282 2.165 2.282 1.874 1.879. 2. βr 不限制. 學. 1 2 3 4 5 6 7. βr > 0. ‧ 國. γ起始值. 立. 1. er. 訓練測試集. i n U. v. 10. 表 蠴蠮蠴蠺 衉衒衔模型法在不同的γ起始值之下預測衍衯衮衤衯資料的結果. engchi. 表蠴蠮蠴中觀察同一組預測資料可發現前幾組的γ起始值之下的預測值幾乎都差不多蠬直 到γc 之間的間距慢慢變大後蠬發現衍術衅急速下降的情形蠬從各種試驗結果中發現γ1 , · · · , γ4 之間開 始差蠳蠨第五組起始值蠩以後大致上就呈現這樣的情況蠬只有少數情況在γc 之間的間距慢慢加大後 才發生此情形蠬如第一次試驗在β > 蠰之下蠬γc 之間的間距大到差蠳蠮蠵蠨第蠶組起始值蠩才會如此蠬這些 數值以粗體字表示。表蠴蠮蠵列出預測第一組訓練測試集的衍衯衮衤衯資料時給定各種不同的γ起始 值之下蠬收斂後的γ值的平均。 由表蠴蠮蠵看來前幾組γ初始值在經過蠲蠰蠰蠰蠰次的衍衃衍衃抽取之下蠬收斂結果幾乎都差不多蠬但 是 隨 著γc 之 間 的 距 離 愈 拉 愈 大蠬γ1 , · · · , γ4 的 收 斂 值 卻 完 全 跟 初 始 值 一 模 一 樣蠬而 回 頭 對 照 蠲蠷.

參考文獻

相關文件

Por seu turno, os derivados financeiros inverteram a saída líquida de 2,8 mil milhões em 2016, para a entrada líquida de 2,5 mil milhões em 2017, devido

國際貨幣基金組織的 《 國際收支平衡表手冊 》( 第五版)載有下列定

Esse aumento foi originado por um superavit de 49,8 mil milhões de patacas na conta corrente, pela entrada líquida de fundos de 5,1 mil milhões de patacas na conta

Além disso, a carteira de investimentos teve uma saída líquida de 10,1 mil milhões de Patacas, enquanto os derivados financeiros e os outros investimentos registaram fluxos de 0,4

Balance of Payments Sub-account Components: Capital and Financial Account

國際貨幣基金組織的 «國際收支平衡表手冊» 第五版 (BPM5) 載有下列

O investimento financeiro (incluindo investimento directo, carteira de investimentos, e outros investimentos) do sector bancário, registou uma saída líquida de 11,1 mil milhões

(十二) 裁判長資料袋整理、封條及成績彙收作業(評分結束後收取評分 表、競賽總成績表、優勝前 5 名及佳作成績表及競賽場紀錄表