網路教學課程推薦系統之建構
黃河銓 蘇銘輝
國立高雄應用科技大學 資訊管理系
hchuang@cc.kuas.edu.tw, 1093345107@cc.kuas.edu.tw
摘要
本研究主要目的是建立一個人化課程選課推 薦系統,以助於大學生選修課程之參考。本研究主 要 是 利 用 資 料 探 勘 技 術 中 的 Dynamic Itemsets Counting (DIC)演算法,分析學習者歷年來的選課記 錄,並結合學習者個人的知識能力及課程間之關連 性,作為推薦課程優先順序的依據。本研究以某校 的某一系所學生的修課記錄為資料來源,並以該系 二年級的學生作為施測對象。最後,本研究並以滿 意度問卷方式,詢問學習者對本研究的選課推薦系 統與傳統的選課系統之間的滿意程度差異,以驗證 本研究選課推薦系統的實用性。 關鍵詞:eLearning、課程推薦系統、關聯法則1. 前言
由於網際網路的快速發展之下,各大學校相繼 成立的遠距及網路教學;在相關的網路教學技術已 經愈來愈成熟下,因此在眾多課程中,如何將不同 的課程個別地推薦給學習者,以提供給學習者更適 合與相關的課程,已是一個不容忽視的問題。目前 各學校提供大學的眾多專業選修課程中,也因為選 修課程大多沒有跨修的限制,對學習者來說,往往 學習者都只是依年級去選修課程,而沒有一套自動 化的課程推薦機制,以幫助學習者在選課時的參 考,是一件很可惜的事。 因此本研究提出一智慧型課程推薦系統,以推 薦出更能符合學習者感興趣的課程,提高學習者的 學習績效,也縮短學習者自行搜尋相關知識與上網 找資料的時間,避免耗費過多時間在找尋網路課程 所花費的時間與精神。本課程推薦系統可依學習者 的個人學習習性,提供個人化的相關課程,一方面 可以提高師生的教學品質,找出適合學習者的課程 與有興趣的課程推薦給學習者,一方面可輔助學習 者在學習上更能掌握學習的目標與有興趣的課程。 本研究主要是利用資料探勘技術在學習者歷 年的選課資料中,找出隱藏的知識,以提供學習者 及行政單位在課程規劃、管理與競爭的開課參考。 其 它 的 相 關 研 究 如 , Tapestry 建 立 以 協 同 過 濾 (Collaborative Filtering, CF)為主的推薦系統,系統 主要是以真實的意見,在一個社群中,所建構出來 的方法,例如 Office workgroup [8]。然而傳統的推 薦系統(Recommender System)如用於較大的社群, 就無法依賴每個人的知識,產生合適的推薦。此 外,另有以評比(ratings-based)為基礎的自動化推薦 系統,如 GroupLens 推薦系統 [5],提供一個筆名 式的 CF 推薦新聞與電影。Ringo 與 Video 推薦是使 用信箱與網頁為基礎作為推薦的系統,並各別產生 音樂與電影的推薦。 其它的推薦技術也包含貝氏網路、分群技術與 Horting [4, 7, 8]。貝氏網路是基於訓練集而使用決 策樹建立每一個節點與邊的模式(model)呈現使用 者的資訊,其模式的建立需要一個精確性的形成鄰 近(Neighbor)的方法。而貝氏網路在當使用者偏好改 變時,必須提供實務性的知識,靠著各方面的時間 去建立模式;但並不適合在使用者偏愛是快速的更 新或經常性的更新。 本 研 究 主 要 方 法 是 利 用 資 料 探 勘 技 術 中 的 Dynamic Itemsets Counting (DIC)演算法,分析學習 者歷年來的選課記錄,並結合學習者個人的知識能 力及課程間之關連性,作為推薦課程優先順序的依 據。本研究主要特色為結合主觀的修課記錄方法與 客觀的領域專家知識與學習者的學習能力,並加總 此二種客觀的權重值方法,利用這二種方法,提供 具有優先順序的課程推薦機制,推薦相關課程給學 習者,以提高學習者的學習績效。另一方面分析學 習者選課行為,以供行政單位分析與決策,做為開 課參考之用。 2.課程推薦系統架構
本研究主要是以學習者為導向,建構一個根據 不同學習者能力,推薦不同的課程給學習者的推薦 系統,以提供學習者選課之參考。本系統架構主要 分為三個模組:能力診斷模組、課程推薦模組、課 程關連模組。圖 1 為本研究的系統架構圖。以下將 分別說明三個功能模組。 能力診斷模組 能力診斷可劃分成有修課記錄的學習者與沒 有修課記錄的學習者二種。在有修課記錄方面:首 先,當使用者登入本系統使用者介面時,能力診斷 模組便透過學習者資料庫,讀取學習者的選課記錄 並依選課記錄找出各個課程的選課成績,將各個課 程的成績,當做學習者的學習能力,並將此學習能 力結果交給課程推薦模組。在沒有修課記錄方面: 由題庫資料庫建構出一份試卷,依學習者選擇的測驗類別,進行該類別的測驗評量,依此評量成績, 當成學習者的學習能力,將此測驗後的學習能力結 果交給課程推薦模組,作為課程推薦處理之用。 課程關聯模組 此模組主要是利用規則推理之方式,產生出課 程關連表。本模組負責至學習者資料庫中,找出學 習 者 歷 年 來 的 選 課 記 錄 , 使 用 關 連 規 則 中 的 (Dynamic Itemset Ccounting, DIC)演算法[9]挖掘出 課程與課程的規則,分析學生的歷史選課記錄,以 產生課程與課程之間的課程關連表,產生出例如, 2 項目集、3 項目集、4 項目集的課程關連表,以提 供給學習者觀看課程的推薦方式。此課程關連資訊 將存放於課程資料庫中的課程關連表,以供課程推 薦模組找出學習者選課記錄相同的課程,推薦相關 的課程之用。 課程推薦模組 此模組主要區分為以下二個機制:課程推薦機 制及回饋。在課程推薦機制方面,經由能力診斷模 組,判斷沒有修課記錄的學習者,推薦相關課程給 學習者。提供由學習者選擇有興趣的專業選修類 別,進行該類別下的評量,經由題庫資料庫產生出 該類別下的試卷,得到評量成績後,依此評量成績 當做該學習者的學習能力指標,假如評量成績高於 一門鑑值(例如 60 分),系統便推薦該類別下的進階 課程給學習者;反之,則推薦該類別下的基礎課程 給學習者。另一方面經由能力診斷模組,判斷具有 修課記錄的學習者,推薦相關課程給學習者。最後 結合客觀的專家權重值與學習能力二者的加權方 法,達到具有優先順序推薦的智慧型課程推薦,推 薦給學習者。 課程推薦主要包括學習者選課的成績(能力), 會影響推薦課程的優先推薦排列順序。依學習者能 力給予加權外,再以專家在課程與課程之間的權重 值,結合二種方法,利用此二者加權的方式,提供 更客觀的課程推薦先後順序。結合上述二種加權的 方式,再利用學生的選課記錄對映到課程的『課程 關聯模組』內的課程名稱,找出規則中的課程推薦 給學生,並由此模組中相關的課程,進行上述二種 權重值的優先順序排序出推薦課程的順序,最後以 網頁的方式,將推薦的課程呈現給使用者。 在回饋機制方面,依據上述課程推薦模組,將 其推薦具有優先順序的課程,以網頁方式呈現給使 用者,當使用者點選並觀看完課程推薦模組後,便 同時填寫滿意度問卷,此問卷主要是詢問學習者對 系統推薦的課程滿意度調查,填寫滿意度問卷。本 滿意度問卷使用五分量表方式,依序詢問:非常同 意、同意、普通、不同意、極不同意,以得知每位 學習者對推薦課程的滿意程度。而領域專家便可藉 由學習者的滿意度統計分析結果,修正關聯規則的 支持度,以提高課程之間的相關性,並提供給下學 期的學習者更精確且相關的課程推薦。
3. 系統實作
本研究主要探討課程推薦的方法,前台的網頁 程式設計工具是使用 PHP、Java 程式語言,後台資 料庫使用 MySQL 資料庫;課程中有討論功能、公 告訊息、能力檢測、課程推薦、滿意度問卷、學習 生成績、選課記錄等功能。 學生選課記錄,必須先經由前置轉換處理;首 先須先依每個學習者將每個學生的專業選修課程 將一到四年級的選修課程合併、再對映到專業選修 課程中的五大分類,輸入到本系統課程資料庫,而 將學生的專業選修課程對映到課程類別的目的之 一,是當資料庫裡沒有該位學生任何的選課記錄 時,透過能力診斷模組,進行前測之用,這部份的 對映則是系統會自動判別並分類到各個類別中。在 課程資料模組裡,也必須藉由本系統輸入每位學生 的專業選修成績,輸入學生的選修成績後,才能依 每位學生的學科成績,針對每位學生不同的能力給 予不同的課程推薦權重值;故先在本系統輸入欲推 薦學生的專業選修成績,以進行課程的推薦。 整個系統分為二個部分:第一個部分為推薦課 程給未有修課記錄的學生,與已有修課記錄的學生 課程推薦。第二個部分為滿意度問卷機制:推薦給 學生課程後,經由學生填寫滿意度問卷量表,進而 改善課程的門鑑值。這部分即由後端的管理者作 業,後端系統的管理者功能具有下列:管理問卷、 管理前測、討論區管理、最新公告管理、會員資料 管理、學生資料管理、管理選修類別、管理選課檔 修與課程等級、專家課程權重值、學生選課成績等 功能,具新增/修改/刪除等功能。 推薦方法主要有二種,第一種是判斷學生不具 有選課記錄,便利用測驗方式,檢測出學生的能力 差異,進而推薦不同的課程給學生,也解決推薦系 統一開始沒有學生記錄的問題;另一個推薦方法, 則是利用學生已修過的課程名稱,再加上該科成績 與專家設定課程與課程之間的權重,並排除檔修條 件的課程,推薦適合的課程給學生。新生登入時, 圖 1 系統架構圖選擇有興趣的前測類別,進入測驗,本例選擇「基 礎課程」說明,按下右邊的按鈕「選擇喜好的類別 進入填答」,如圖 2 前測的類別所示。 按圖 2 進行前測,由系統隨機抽取出資料庫中 該類別的課程題庫,測驗學生的能力,當測驗結 束,出現如圖 3 前測結果畫面,顯示出測驗的成績, 並顯示進行的是那一類別的前測,如果前測成績大 於平均門檻值(例如 60 分),則經由此測驗成績假設 該位學生在該類別下已具有一定程度了解,便推薦 該學生在該類別下的「進階課程」。相對的,假如 該學生前測成績小於平均門檻值,系統便推薦該位 學生在該類別下的「基礎課程」。 圖 3 前測結果 圖 4 為根據學生的修課記錄與課程關連表,並 加入選課成績與專家設定課程與課程的加權值,而 形成的智慧型課程推薦所示。最後本系統再經由滿 意度問卷五分量表,分為:非常同意為 1 分、同意 為 2 分、普通為 3 分、不同意為 4 分、極不同意為 5 分。經由使用過本課程推薦系統的學生,在觀看 完系統建議的選修課程後,利用此問卷分析並驗證 該推薦系統的滿意度,管理者可根據此滿意度分析 結果,適時調整門檻值,以提高下學期課程的關聯 滿意度,回饋給學生更精確、更有興趣且相關的課 程推薦。
4. 研究方法
本研究方法共分為問卷設計、研究對象、研究 限制,分述如下: 問卷設計 本研究引用文獻中信度與效度良好的量表,加 以歸納與整理,並請相關領域專家對此量表提出意 見並修正題項,並針對問卷內容與文字加以多番討 論與修訂成稿。而此問卷主要目的是要瞭解學生在 傳統的選課系統與本研究提供的課程推薦系統,對 此二個系統的滿意度情形,本部份共有 21 題,每 題皆以『1 非常同意』、『2 同意』、『3 普通』、『4 不 同意』、『5 極不同意』等五種選項提供作答。共分 為五大構面:傳統選課系統的選課認知、選課認知 滿意度的分類、系統功能滿意度的分類、學習動機 滿意度、選課認知的滿意度之比較等五大構面。 研究對象 本系統之研究對象為某國立科技大學資訊相 關科系的學生,依據系統提供的學習環境與滿意 度,來評估此推薦課程的價值,以資訊相關科系歷 年來一到四年級的學生選課記錄為關連知識庫,而 實驗的對象給二年級的學生,二年級樣本數共有 109 位,有效樣本數為 69 位,排除重覆填寫與不完 整填答的問卷回答,其回收率為 63.3%。 研究限制 課程前測題庫目前建置有限,因此在未來亦可 以在前測方面,透過前測推薦給新生課程,可以再 加入更嚴謹的方法,建議結合新生在入選時的條 件,加以結合資料探勘分析,以增加推薦課程之學 生的資料維度,提供給新生更滿意的課程推薦。 圖 2 前測的類別 圖 4 智慧型課程推薦5. 資料分析
分析工具主要是以 SPSS 14 統計軟體;資料分 析將以問卷信效度、相關樣本 T 檢定、滿意度敘述 統計分析。 問卷信效度 本研究所回收有效問卷之 Cronbach’s Alpha。各 構面之 Cronbach’s Alpha 係數分別為選課認知滿意 度分類構面 0.931、選課認知的滿意度之比較構面 0.890、傳統選課系統的選課認知構面 0.920、學習 動 機 滿 意 度 構 面 0.857 、 系 統 功 能 滿 意 度 構 面 0.786,如表 1 所示。任何測驗或量表的信度係數如 果在.90 以上,表示測信或量表的信度甚佳[3]。而 有些學者則認為在.70 以上是可接受的最小信度值 [2, 6]。如果研究者編製之研究工具的信度過低如 在.60 以下。 表 1 各構面信度分析 構面 Alpha 係數值 選課認知滿意度分類構面 0.931 選課認知的滿意度之比較構面 0.890 傳統選課系統的選課認知構面 0.920 學習動機滿意度構面 0.857 系統功能滿意度構面 0.786 各 構 面 總 係 數 0.903 當 Kaiser-Meyer-Olkin 取樣適切性量數此值比 0.5 大時,使用這些觀測變量進行因子分析是有意 義的。以此數據來說,KMO=0.815,代表 KMO 愈 大時,表示變項間的共同因素愈多,愈適合進行因 素分析,根據學者[1]觀點,如果 KMO 的值小於 0.5 時,較不宜進行因素分析。 表 2 KMO 取樣適切性量數 Kaiser-Meyer-Olkin 取樣適切性量數 .815 Bartlett's 球形檢定 近似卡方分配 1203.392 自由度 210 顯著性 .000 表 3 配對樣本 T 檢定配對 T 檢定結果說明了 成對一中變數 1、變數 2 兩兩相減的差值平均值、 標準差、差值平均值的標準誤差分別為 0.710, 1.226,0.148,95%可信區間為 0.416,1.005。配對 檢定結果表明 T 值為 4.812,自由度為 68,顯著值 為 0.000(小於 0.05,拒絕 H1),表示其差異具高度 顯著性意義,即『傳統的選課系統』與『本課程推 薦系統』在選課時的參考的確有差異。 表 3 配對樣本 T 檢定 平均數 顯著性 (雙尾) 成 對 一 傳統的選課系統能提供給我在選 修課程時的參考-本課程推薦系統 能提供給我在選修課程時的參考 .710 .000 成 對 二 傳統的選課系統,在選修課程時是 有參考價值的-本課程推薦系統,在 選修課程時是有參考價值的 .638 .000 成 對 三 傳統的選課系統,能有效的降低選 課上的負擔-本課程推薦系統,能有 效的降低選課上的負擔 .652 .000 成 對 四 傳統的選課系統,能有效解決選課 參考的問題-本課程推薦系統,能有 效解決選課參考的問題 .725 .000 滿意度分析 本問項以李克特五尺度方式,由填答者分別從 『非常同意』給 1 分、『同意』給 2 分、『普通』給 3 分、『不同意』給 4 分、『極不同意』給 5 分的五 個選項加以勾選,讓使用者對系統各種功能進行評 估,以驗證系統的成效。 由表 4 題項得知:本課程推薦系統能根據我目 前的學習能力來推薦課程 2.739、本課程推薦系統 能提供給我在選修課程時的參考 2.492、本課程推 薦系統,在選修課程時是有參考價值的 2.536、本 課程推薦系統,能有效的降低選課上的負擔 2.666、 我對於本課程推薦系統的課程推薦先後順序很滿 意 2.666、整體來說,我對於本課程推薦系統的課 程推薦內容感到滿意 2.666、本課程推薦系統,能 有效解決選課參考的問題 2.652,由上表所述,本 課程推薦系統均達『普通』3 分以下,皆能達到滿 意的程度。 表 4 構面一:選課認知滿意度分類 構面一:選課認知滿意度分類 績效衡量指標 平均數 本課程推薦系統能根據我目前的學習能力來推 薦課程 2.739 本課程推薦系統能提供給我在選修課程時的參 考 2.492 本課程推薦系統,在選修課程時是有參考價值的 2.536 本課程推薦系統,能有效的降低選課上的負擔 2.666 我對於本課程推薦系統的課程推薦先後順序很 滿意 2.666 整體來說,我對於本課程推薦系統的課程推薦內 容感到滿意 2.623 本課程推薦系統,能有效解決選課參考的問題 2.652 由表 5 題項得知:整體來說,我對於本課程推 薦系統的軟體功能感到滿意 2.623、本課程推薦系 統比起傳統的選課系統更能提供給我在選修課程 時的參考 2.434、本課程推薦系統比起傳統的選課 系統,在選修課程時更具有參考價值 2.434、本課 程推薦系統比起傳統的選課系統,更能有效的降低選修課程上的負擔 2.536、本課程推薦系統比起傳 統 的 選 課 系統 , 更 能 有效 解 決 選 課參 考 的 問 題 2.463,由上表所述,本課程推薦系統均達『普通』 3 分以下,皆能達到滿意的程度。 由表 6 題項得知:傳統的選課系統能提供給我 在選修課程時的參考 3.202、傳統的選課系統,在 選修課程時是有參考價值的 3.173、傳統的選課系 統,能有效的降低選課上的負擔 3.318、傳統的選 課系統,能有效解決選課參考的問題 3.376,由上 表所述,本課程推薦系統均達『普通』3 分以上, 皆未能達到滿意的程度,即符合本研究假設,使用 者都不滿意在傳統的選課系統上,在選修課程上都 呈現不滿意的程度。 表 5 構面二:選課認知的滿意度之比較 表 6 構面三:傳統選課系統的選課認知 由表 7 題項得知:對我來說,本課程推薦系統 能針對我的喜好來推薦課程 2.826、對我來說,本 課 程 推 薦 系統 推 薦 的 課程 能 增 加 我的 選 課 興 趣 2.739、本課程推薦系統能推薦不同選修類別的課程 2.565,由上表所述,本課程推薦系統均達『普通』 3 分以下,皆能達到滿意的程度。 由表 8 題項得知:本課程推薦系統能按照我的 修課記錄推薦相關課程 2.463、本課程推薦系統能 自動排除課程的檔修功能是很重要的 2.463,由上 表所述,本課程推薦系統均達『普通』3 分以下, 皆能達到滿意的程度。 表 7 構面四:學習動機滿意度 構面四:學習動機滿意度 績效衡量指標 平均數 對我來說,本課程推薦系統能針對我的喜好來推 薦課程 2.826 對我來說,本課程推薦系統推薦的課程能增加我 的選課興趣 2.739 本課程推薦系統能推薦不同選修類別的課程 2.565 表 8 構面五:系統功能滿意度 構面五:系統功能滿意度 績效衡量指標 平均數 本課程推薦系統能按照我的修課記錄推薦相關課程 2.463 本課程推薦系統能自動排除課程的檔修功能是很重 要的 2.463
6. 結論與未來研究
本研究主要是結合資料探勘的關聯規則與專 家權重、學生成績能力,以提供個人化選課課程之 推薦,以期建立一個自動化課程推薦系統,且透過 推薦後的滿意度問卷,修正門鑑值,讓課程的推薦 更精確且滿意。一方面提供學生選課參考,達到符 合個人化的修課興趣,進而提高學習效果。另一方 面也可以提供系辦在開設專業選修課程時的開課 參考之一。本研究的特色簡述如下:(1) 學習者建 立一個課程推薦的機制,讓學習者不用在沒有選課 的參考之下,太主觀選擇課程,本課程推薦系統期 望能達到最適課程的選課參考;(2) 利用學習者能 力不同與專家對課程與課程之間的權重值,精確且 客觀依據課程的先後順序推薦課程給學習者; (3) 能依據學習者選課記錄與成績推薦課程外,更結合 專家作為推薦機制;(4) 結合主觀的選課記錄與客 觀的專家與能力行為,作為推薦的依據。 在未來研究方面,未來可加入不同領域的課 程,增加更多的課程教材,並加入課程教材導覽以 及依不同先後順序的課程推薦規則,如 Sequence Pattern,使本系統更加完整,以達到全面性的課程 推薦;並在選課系統加入此課程推薦系統,並在全 校選課時推薦課程給學生,提供選課時的參考。此 外,未來研究亦將改良目前相關的關連演算法,以 使本研究在推薦課程方面更加精確、處理效能更好 與增加課程推薦的滿意度。參考文獻
[1] J. Banning and L. Kaiser, “An ecological perspective and model for campus design”, The Personnel and Guidance Journal, Vol. 52, pp.
構面二:選課認知的滿意度之比較 績效衡量指標 平均數 整體來說,我對於本課程推薦系統的軟體功能感到 滿意 2.623 本課程推薦系統比起傳統的選課系統更能提供給我 在選修課程時的參考 2.434 本課程推薦系統比起傳統的選課系統,在選修課程 時更具有參考價值 2.463 本課程推薦系統比起傳統的選課系統,更能有效的 降低選修課程上的負擔 2.536 本課程推薦系統比起傳統的選課系統,更能有效解 決選課參考的問題 2.463 構面三:傳統選課系統的選課認知 績效衡量指標 平均數 傳統的選課系統能提供給我在選修課程時的參考 3.202 傳統的選課系統,在選修課程時是有參考價值的 3.173 傳統的選課系統,能有效的降低選課上的負擔 3.318 傳統的選課系統,能有效解決選課參考的問題 3.376
370-375, 1974.
[2] R. F. DeVellis, “Scale Development: Theory and Applications”, Newbury Park, CA: SAGE Publications, 1991.
[3] L. R. Gay, “Educational research: Competencies for analysis and application” (4th ed.), New York: Macmillan, 1992.
[4] Z. Kalbarczyk, R. K.Iyer, S. Bagchi, and K. Whisnant, “Chameleon: A Software Infrastructure for Adaptive Fault Tolerance,” IEEE Transactions on Parallel and Distributed Systems, vol.10, no.6, pp. 560-579, June 1999.
[5] J. Konstan, B. Miller, D. Maltz, J. Herlocker, L. Gordon, and J. Riedl, “GroupLens: Applying Collaborative Filtering to Usenet News”, Communications of the ACM Vol. 40, No. 3, pp. 77-87, 1997.
[6] J. C. Nunnally, “Psychometric theory” (2nd ed.), New York: McGraw-Hill, 1978.
[7] M. Sahami, S. Dumais, D. Heckerman, and E. Horvitz, “A bayesian approach to filtering junk E-mail”, In Proc. of AAAI Workshop on Learning for Text Categorization, Madison, Wisconsin, pp. 55-62, 1998.
[8] B. Sarwar, G. Karypis, J. Konstan, and J. Riedl, “Item-based Collaborative Filtering Recommendation Algorithms”, In Proceedings of WWW 10, 10th International World Wide Web Conference, pp. 285-295, May 2001.
[9] E.O.A. Savasere and S. Navathe, “An Efficient Algorithm for Mining Association Rules in Large Databases”, In Proceedings of International Conference on Very Large Data Bases, Zurich, Switzerland, pp.432-444, 1995.