• 沒有找到結果。

I MPORTANCE 公式示例。資料來源:本論文

⎜⎜ ⎞

= ⎛

⇒ ( | )

)

| log (

)

( p B notA A B B p

A

方程式 2 Importance 公式示例。資料來源:本論文

公式中分子、分母的比例可以相差很大,故開對數取得Importance 指數。當「在 B 的條 件下發生A 的機率」高於「在無 B 的條件下發生 A 的機率」則對數後會大於零。Importance 愈大,表示規則愈顯著。

SQL SERVER 2005 中提供一項圖形化檢視的工具,稱為「相依性網路」。以本論文為例,

點選分類號177(綠色圓環)可以發現另外指向兩個藍色圓環,分別為分類號 083.6 及 855。

當點選的圓環能對外指向愈多藍色圓環,表示此項分類號愈能帶動其他分類號的借閱行為。

對照中圖書館分類法可以發現,「應用心理」(177)可以促進「現代叢書」(分類號083.6)與

「中國散文‧雜著」(分類號855)的借閱。

圖 25 Abu 探勘結果之相依性網路。資料來源:本論文

然而相依性網路並無法應用在Web 化的環境中,研究者需要知道的是在探勘模型中,輸 入使用者的變數、再得出推薦的結果。因此,在SQL Server 2005 的解決方案中,便需要使用 到資料探勘延伸語言(Data Mining Extension, MDX)。

在「Microsoft SQL Server 2005 的資料探勘解決方案」一節中提到(頁 36),Microsoft 的資料探勘模式是一種特殊型態的資料表,整個模型從建置、訓練到預測都可以使用DMX 來完成。而具有產生預測結果功能性的則稱為Prediction Query。使用 Prediction Query 的優點 為,只要以近似T-SQL 的 JOIN 語法連結欲預測資料與資料探勘模型便較容易得出預測結果,

並順利應用到於各式應用系統中。

以本系統而言,若想要作到如Amazon.com 的自動商品推薦,則需要參考已有的資料探 勘模型,並輸入個別讀者的借閱項目以取得推薦結果,需要用到的函數即為

PredictionAssociation。

PredictionAssociation 是一個「巢狀表格函數」(Nested Table Function),它會讀取「案例 資料表」(Case Table)中該讀者已借閱的圖書類別去比對所有關聯規則之推薦項目,同時去

除該讀者已借閱過的類別而產生推薦清單。若無符合的規則,PredictionAssociation 則會以訓 練組資料的總體平均值帶入。在圖 25 看到可能有多個綠色圓環指向同一藍色圓環表示有多 條規則推薦同一類別,若有此一情況,則以機率較高者為準。

例如,隨意輸入五項某讀者曾借閱過之圖書類別,分別為019.9、581.31、582.8、584.3 及584.94 欲預測其推薦結果,其 MDX 內容如表 5 所示:

表 5 PredictionAssociation 預測查詢示例。資料來源:本論文

其中,引數INCLUDE_STATISTICS 表示預測結果會在傳回的巢狀表格中加入$Support、

$Probability 以及$AdjustedProbability 三樣統計資訊。數字 5 表示過濾機率最高的預測物件數 量為5,所以最多只會傳回五筆結果。

傳回的預測查詢結果如圖 26 所示。根據輸入的引數所預測的類別依機率大小排序依序 為083.6、857.7、855、889 及 312.932C。

SELECT

[Abu User NCTU 1].[Borrowing Hist],

PredictAssociation([Abu User NCTU 1].[Borrowing Hist], INCLUDE_STATISTICS, 5) From

[Abu User NCTU 1]

NATURAL PREDICTION JOIN

(SELECT (SELECT '019.9' AS [CLASS NO]

UNION SELECT '581.31' AS [CLASS NO]

UNION SELECT '582.8' AS [CLASS NO]

UNION SELECT '584.3' AS [CLASS NO]

UNION SELECT '584.94' AS [CLASS NO]) AS [Borrowing Hist]) AS t

圖 26 PredictionAssociation 預測查詢結果。資料來源:本論文

然而,此類預測查詢若等待到讀者線上要求時才處理效率較差,在實務上Abu 以窮舉法 將所有讀者的預測結果預先批次處理完成並存入資料庫中(如圖 27),便可以在Web 上以較 快速度呈現推薦結果(如圖 28)。

圖 27 預先批次處理完所有讀者之預測查詢。資料來源:本論文

圖 28 為實際之 Abu 個人推薦畫面,呈現時以$AdjustedProbability(調整後機率)以大 至小排序。

圖 28 Abu 網站之個人推薦畫面。資料來源:本論文之 Abu 網站

AvgBookRat , where

⎪⎪