作業二
1. 以投影片「06 監督式學習.pdf」第 8 頁高爾夫俱樂部以天氣預報預測人們打高爾夫的範 例資料,參考課本程式範例 6-1 與 6-2。 (1) 撰寫 R 程式,完成以下兩項要求: 繪製決策樹狀圖 顯示分類正確率 (2) 嘗試就分類的結果給予一些說明。 注意:以所有的資料建立決策樹,不需要如範例中分兩部份(訓練資料與測試資料)。 提示:設定 rpart.control( ) 函數的引數,改善決策樹分類結果。請自行決定引數值。 2. 使用 arules 套件中 Groceries 資料集進行關聯性規則練習。Groceries 資料集是某一個食品雜貨店一個月的交易資料。觀察第一筆資料(以指令 inspect(Groceries[1]))如下:
表示第一位消費者購買商品:柑橘 (citrus fruit)、半成品麵包 (semi-finished bread)、黃 油 (margarine) 以及即食湯 (ready soups)。撰寫 R 程式,並且回答以下問題。(問題回 答請另外以 Word 或 Text 檔案撰寫。) (1) Groceries 資料集有多少筆交易? (2) Groceries 資料集有多少個欄位項目(商品)? (3) 最受歡迎的商品(欄位項目)是什麼? (4) 使用 apriori( ) 函數檢視關聯規則時,產生超過 5 千筆規則。如果支持度 (Support) 設定為 0.005 時,希望產生的關聯規則少於 10 筆,信賴度 (Confidence) 大約應調 整為多少? (5) 提升度 (Lift) 最高的規則是什麼?提升度值是多少? (6) 有一個冷門的商品,芥末 (mustard)。如果我們想要找一個商品與芥末捆綁銷售, 那麼的話,從這些規則中,你會選擇哪樣商品?為什麼? (提示:嘗試使用 apriori( ) 函數的 appearance 參數,以找到適合的關聯規則。) 附註:問題回答或說明,請將回答內容以 Word 或 Text 檔案撰寫。將 R 程式與問題回答檔案 以附加檔案傳送給老師 (mailto: [email protected] )。