• 沒有找到結果。

基於情境感知及模糊理論的智慧型推薦系統

N/A
N/A
Protected

Academic year: 2022

Share "基於情境感知及模糊理論的智慧型推薦系統"

Copied!
13
0
0

加載中.... (立即查看全文)

全文

(1)

基於情境感知及模糊理論的智慧型推薦系統 -以交談平台的廣告推薦為例

摘要

智慧型推薦系統在許多科技應用領域都 扮演著相當重要的角色,然而,要達到有效的 推薦,必須有充分的資訊與良好的推論模型,

所以,本研究提出以情境感知及模糊理論為基 礎的智慧型推薦系統,希望藉由情境感知的技 術來收集並整理出所需的資訊,並藉由模糊理 論的推理法則,將專家的經驗融入於推理引擎 之中,如此可以達到有效的推薦。

本研究以交談平台的廣告推薦為例,實作 出一個具有個人化廣告特色的交談平台,我們 藉 由 使 用 者 的 交 談 內 容 來 獲 取 短 期 情 境 資 訊,以使用者的個人化資訊為長期情境資訊,

並以這些情境資訊為基礎,藉由模糊推論引擎 找出符合使用者需求的廣告,最後再進行推 薦,如此便能更吸引使用者點閱廣告,也能幫 助廣告主獲得更良好的廣告成效。

關鍵詞:情境感知、模糊理論、智慧型推薦系 統、廣告推薦、交談平台。

Abstract

The Smart Recommender System often acts as a key role in many application fields of technology. Hence, to obtain an effective recommendation, both sufficient information and good inference model are very important.

For this reason, we propose a smart recommender system based on context-awareness and fuzzy set theory. We collect the needed information by using the technique of context-awareness. And then, the recommendation can be effective by using the inference rules which integrate the experiences of experts.

We establish a conversation platform of advertisement recommendation to be an example of our proposed smart recommender system. We extract the conversation contents

of users to obtain short-term contextual information and use the personal information of users to be long-term contextual information. And, based on these contextual information which is more close to the interests of users, the more interested advertise of user can be recommended by the fuzzy inference rules. Finally, the best advertise is recommended to user. Thus, the advertisement can attract users to click effectively and the advertiser can acquire more effective advertising.

Keywords: Fuzzy Set Theory, Smart Recommender System, Advertisement Recommendation, Conversation Platform.

1. 前言

隨著網路的發達,人們藉由網際網路就能 夠找到許多資源,但是過多的資源反而讓使用 者感到困擾,因為使用者只想快速且直接的獲 得符合需求的資源,所以,如何發展一個具個 人化特色的推薦系統一直是一個相當熱門的 議題;但是推薦系統的發展至今普遍還是以內 容式及協同式兩種方法為主[18][19][12][11],

所根據的資訊也往往偏向使用者長期以來的 嗜好,因此容易忽略使用者當前較有興趣的短 期資訊,故本研究提出結合情境感知和模糊理 論的推薦方法。

我們同時考量使用者的短期偏好和長期 偏好,我們所指的短期偏好指的是當下的情 境,它是比較即時性的,並且會隨著使用者所 做的事情或是所處環境而有所改變,例如使用 者在瀏覽網頁的時候可能會從購物網站轉換 至音樂網站,這代表著瀏覽網頁的過程中情境 會一直不斷的改變,因此所包含的情境資訊也 會有所差異,例如正在閱讀的文章、正在討論 的話題、正在瀏覽的文章等;長期偏好則是指 使用者長期以來的習性與興趣,例如嗜好、交

陳榮昌 蕭朝維

朝陽科技大學資訊管理系 副教授

朝陽科技大學資訊管理系 研究生

e-mail:rcchen@cyut.edu.tw e-mail:s9914617@cyut.edu.tw

(2)

談過的話題、行為、流覽路徑、購買頻率以及 瀏覽時間等等,這些情境資訊將有助於推薦系 統在推薦上的分析,另外我們也將透過知識本 體的語意描述特性找出相關的情境資訊,以改 善情境資訊不足的情形,最後透過模糊推論引 擎對每個廣告打分數,並且經由分數門檻值篩 選出分數較高的廣告推薦給使用者。

圖 1 傳統交談平台上的廣告 圖片來源:豆豆聊天室[31]

在本研究裡,我們將以交談平台上的廣告 推薦為例來說明本研究的應用。目前在交談平 台上的廣告大多是以隨機推薦的方法來推薦 廣告,圖 1的交談平台為例[31],上面所放置 的網路廣告都是隨機呈現的,如此一來將會產 生 推 薦 出 來 的 廣 告 與 使 用 者 興 趣 不 符 的 情 形,這樣不僅可能導致使用者感到厭煩,也連 帶使得廣告點閱率偏低,企業主無法從中獲得 良好的廣告效益。雖然目前的網路廣告推薦系 統已經有許多學者提出個人化的推薦方法,例 如 Huang 等 學 者 (2008) 提 出 利 用 Yahoo!

Directory作為分類樹將使用者們的交談議題進 行分類並且應用到廣告的推薦上[13],但是此 研究的重點並不是在廣告的推薦上,而是在探 討分類樹節點延伸的設置以及詞性的影響程 度等,而且只能針對英文的交談議題來進行推 薦。Kazienko和Adamski兩位學者(2007)提出以 網頁行為

(Web usage)

與網頁內容探勘

(Web

mining)

來實作出ㄧ個具有個人化特性的網頁

廣告推薦系統「AdROSA」[17],這個系統能 夠隨著使用者所瀏覽的網頁的不同來推薦個 人化的廣告,此研究的貢獻主要是提出ㄧ個不 需要詢問使用者個人資料,系統就能夠自動分 析 使 用 者 的 特 性 然 後 進 行 個 人 化 推 薦 的 方 法,但是此方法只能用在瀏覽網頁上,並且只 適用於英文的網頁內容。Jang等學者(2007)提 出利用基於知識本體的關鍵字管理系統來幫 助廣告的推薦,此推薦方法主要是藉由TF-IDF 計算關鍵字的權重值,然後再透過Apriori演算

法找出關鍵字之間的關聯性[16],此方法只有 考慮到關鍵字的因素而忽略掉了其他相關因 素的影響,並且並不適於在中文廣告的推薦 上。

目前處理中文的個人化廣告推薦系統還 有許多改進的空間,因為中文字的內容在分析 上比較困難且複雜,所以我們將此方法應用到 中文廣告的推薦上,利用情境感知的技術來收 集並整理出所需的資訊,並且藉由模糊理論的 推理法則,找到使用者更有興趣的廣告,如此 可以達到有效的推薦。

2. 文獻回顧

2.1 情境感知(Contextual-Awareness)

情境感知最早可追溯於 1994 年由Schilit 和 Theimer(1994)兩位學所提出,他們在研究 裡指出使用者所處的區域以及附近的資源都 是屬於「情境」的一部分[27],此外,學者 Dey(2001)對「情境」也提出了更進ㄧ步的解 釋,他們認為情境是任何可以用來描述實體環 境特徵的資訊,所謂的實體指的是人,位置或 是資源,這些資訊都可以當作是與使用者相關 的資訊[10],Schilit(2009)將情境內容的類型分 成 三 大 類 [25] , 分 別 為 運 算 情 境 (Computing Context)、使用者情境(User Context)以及實體 情境(Physical Context),所謂的運算情境包含 了硬體資訊、網路頻寬和週遭的資源等,使用 者情境則包含了使用者的興趣、個人檔案以及 使用者的所在位置等,而實體情境指的是週遭 的環境,例如溫度、溼度、亮度等,因此所有 跟使用者本身或是周遭環境相關的資訊可稱 為情境資訊(Contextual Information)。

情境感知在不同的應用上都有各自的定 義,例如Rong等學者(2010)[23]提出了一個以 情境感知為基礎的網頁服務需求分析,如圖 2 使用者所提出的網頁服務需求(Web Service Request)必須經過情境資訊的需求分析才能了 使用者的真正需求,而系統的網頁服務(Web Service Requirement)也必須經過情境資訊的需 求分析才能了解使用者的需求,也就是使用者 所提出的網頁服務需求與系統的網頁服務必 須經由情境資訊分析的溝通,系統才能提供符 合使用者需求的網頁服務給使用者。

(3)

圖 2 基於情境資訊的網頁服務需求分析[23]

Chen等學者於 2004 年提出了一個情境代 理 人 的 架 構 (Context Broker Architecture;

Cobra)[6],並將此架構應用於智慧型的會議室 系統,簡稱EasyMeeting,該系統可以針對會議 參與者推薦相關的服務和資訊給他們,圖 3為 Cobra之架構,情境代理人主要是由下列四個部 分所組成:

(1)情境知識(Context knowledge base)

情境知識主要是來自使用者的個人資料或 是週遭環境的相關資訊,例如溫度、亮度、

位置、使用者的興趣及使用者的情緒等資 訊。

(2)情境推論引擎(Context Reasoning Engine) 在取得相關的情境知識之後,情境推論引

擎可以根據模糊規則來得到推論的結果。

(3)情境取得模組(Context Acquisition Module) 情境取得模組負責蒐集相關的情境知識,

並且經由過濾只留下較有意義且重要的情 境知識。

(4)情境管理模組(Context Management Module) 情境管理模組可以訂定特定的策略,再 依據策略來來進行規範,例如限制情境知識的 存取範圍以及使用者的隱私權等。

我們採用此架構的概念,將情境感知的技 術融入我們的推薦系統當中,我們從使用者交 談內容、閱讀的文章等取得所需的短期資訊,

並與使用者過去的相關資訊結合而為情境知 識,透過對情境知識的推理及分析來找到適當 的廣告來推薦給使用者。

圖 3 Cobra 之架構圖[6]

2.2 模糊理論(Fuzzy Set Theory)

模 糊 理 論 最 早 是 由 美 國 柏 克 萊 大 學 的 Zadeh教授所提出,他分別在 1965 年和 1973 年相繼提出了模糊集合(Fuzzy Set)與模糊邏輯 (Fuzzy Logic)[28][29],模糊理論這個概念主要 是用來幫助解決「不確定性」的問題,因為在 現實生活中,人們對於一個問題通常都是以主 觀的看法來衡量一個問題的標準,例如考試的 時候通常是以一個分數標準來判斷是否為及 格,但這樣的方式對於分數差距很小的人來說 其實是不公平的,因此模糊理論可以幫助我們 將衡量的標準以較寬鬆的範圍來進行判斷。

具 體 來 說 , 模 糊 理 論 是 一 種 數 學 模 組 (Mathematics model),它以模糊集合(Fuzzy Sets) 來判斷一個問題的答案,而傳統的普通集合 (Crisp Sets)只是以二分法來解答一個問題,其 定義如下:

x A

A x x

U x x x

A A A

     

  

   0,

, ) 1 ( , }

| ) ( ,

{ (1) 其中U 指的是一個全部集合,而a(x)指的是 x 在 A 集合或是不在 A 集合;模糊集合則有別 於傳統集合,它是利用歸屬程度(Membership Function)來判斷一個事件屬於某個答案的程度 有多少,其定義為:

U x x f x U

x x x

A{ ,A( )| }  , A( ) ( ), (2)

(4)

其中,f ( x)表示為 0~1 之間的函數,而

A( x) 表示為 x 屬於 A 集合的程度,透過模糊集合運 算,我們可以推論出一個更精準的答案。

圖 4 模糊推論引擎之架構[26]

模糊理論目前普遍用在不同的領域,例如 推薦系統、數位學習(E-learning)、控制系統 (Control System)等,而一個模糊推論系統的架 構 主 要 可 分 為 三 大 部 分 , 分 別 為 模 糊 化 (Fuzzifier)、解模糊化(Defuzzifier)及模糊推論 引擎(Fuzzy Inference Engines),圖 4為模糊推 論引擎之架構圖[26],首先,在模糊化的部分,

主要是用來將真實世界中的數值藉由歸屬程 度映射到模糊集合中,而解模糊化則與模糊化 的過程相反,它能夠將模糊集合的數值由模糊 轉換成明確,目前較為常見的解模糊化方法主 要 都 是 依 據 權 重 平 均 法 (Weighted Average Formula)而衍生而成,其定義為:

N

i i i N

i

i y

x y

1 1

) ( )

(

(3)

其中,

i( y)代表的是輸出集合的歸屬程度,

i

指的是第 i 個規則的權重,N 則是規則的總數。

在推論引擎的部分,它必須透過模糊規則 庫來進行推論,而模糊規庫是由許多條 If-Then 型式的模糊規則 所組成,因此可定義成

,目前最普遍的模糊規則型式 包 含 了 函 數 式 模 糊 規 則 (Takagi-Sugeno-Kang Fuzzy Rule; TSKFR ) 和 語 意 式 模 糊 規 則 (Mamdani Fuzzy Rule; MFR) , 本 研 究 採 用 TSKFR 的方式,其規則定義如下:

Ri

} ,..., ,

{R1 R2 Rn R

) , , ( is Then

is and and is

If :

1 1 1 ) (

n j

j

j n n j

j

x x f y

A x A

x R

(4)

2.3 個人化知識本體(Personal Ontology) 知識本體是一種概念化的明確描述,他可以 用來幫助不同領域知識的分類與分享,因此若

是加入個人化的概念後,也可以用來描述使用 者個人的知識或興趣,因此個人化知識本體漸 漸的被使用在推薦系統、搜尋引擎等應用上,

如Chaffee等學者利用領域本體和個人化知識 本體之間的比對(Mapping)來幫助使用者找出 符合需求的網頁[7],Carmichael等學者在智慧 型環境中藉由個人化知識本體的輔助來幫助 特 徵 的 擷 取 [8] , Huhns 和 Stephens 兩 位 學 者 (1999)針對個人化知識本體做了相關的研究,

他們認為使用個人化知識本體具有支援離線 功能、支援瀏覽與搜尋、支援短暫的排序以及 平衡粗糙與精細以及深度與廣度等優點[15],

本研究將應用個人化知識本體於長期情境的 分析上,用來記錄與查詢使用者的長期偏好。

2.4 案例式推理(Case-Base Reasoning, CBR) 案例式推理最早是由Schank[24]所提出的 概念,吳伯彥認為案例式推理就如人類在進行 決策時的思考方式,人類的大腦猶如一個案例 式資料庫,內部存在著之前所有已經解決的案 例和解決的方法[4]。詹國良對於過去學者的定 義統整後指出案例式推理的概念為根據以前 的經驗來推論現在所面臨的問題,所以使用的 經驗為過去相似的案例[1],圖 5為Aamodt和 Plaza[5]所提出的案例式推理之循環圖,主要步 驟包含了擷取、重新使用及改編,舉例來說,

學生在考試的時候,遇到某個問題會先思考以 前是否有寫過相同或是類似的題目,若有就將 其解決方法直接拿來使用或是經過修改再使 用,因此案例式推理的優點是可以透過歷史記 錄快速的找到解決方法並且能夠將方法改進 以供未來使用,本研究將利用案例式推理來記 錄點。本研究將案例式推理的概念應用於長期 情境的分析上,用來記錄與查詢使用者曾經點 閱過的廣告。

(5)

圖 5 案例式之循環圖[5]

2.5 推薦系統(Recommender System)

3. 研究方法 3.1 研究架構

我們的研究架構主要可分為三個部分,如 圖 6所示,首先是情境資訊蒐集模組,此模組 將蒐集短期情境與長期情境的相關資訊,所謂 的短期情境是指使用者最近所接觸的事物或 概念,例如最近的談論的話題或最近較熱門的 話題等;我們將利用專家知識本體的語意描 述,找出更多具有關聯性的情境資訊,長期情 境則是指使用者長期以來的行為偏好,例如使 用者輪廓(User Profile)以及歷史紀錄都屬於長 期情境裡面的資訊,因此,我們將利用個人化 知 識 本 體 來 記 錄 使 用 者 過 去 曾 經 接 觸 的 概 念,此外,也融入案例式推理的概念來分析過 去的相關資訊;透過短期情境與長期情境所包 含的資訊便可以了解使用者個人的短期偏好 與長期偏好;有了相關的情境資訊之後,我們就 能經由情境運算模組算出情境資訊與每一個 項目之間的相似度,所謂的項目指的是要推薦 的服務,如廣告、指商品和文章等;最後我們 將相似度模糊化,利用模糊集合找出每個項目 屬於高相似的歸屬程度,然後利用模糊推論引 擎進行推論,將每一個項目打分數,並且進一 步篩選出分數較高的項目依序推薦給使用者

推薦系統主要是用來幫助使用者直接找

到符合需求的資源,目前較常見的推薦系統可 分為以內容為基礎(Content-Based Filtering)、協 同 式 (Collaborative Filtering) 以 及 混 合 式 (Hybrid Approach),Middleton定義以內容為基 礎 的 推 薦 系 統 是 以 二 分 法 的 方 式 來 進 行 推 薦,並且著重在訓練資料(Training Data)的集 合,分析哪些項目對於使用者來說是有興趣 [22],Liao等學者(2010)利用中國圖書分類法作 為參考本體(Reference Ontology),並利用使用 者在參考本體裡面的興趣主題,重新組成一個 個人化的知識本體然後用於書籍的推薦[20]。

協同式推薦系統則是利用利用分群的概念,透 過使用者的評估回饋機制,將興趣相似的使用 者聚集在一起然後進行推薦,Hsu等學者(2006) 將個人化知識本體應用到部落格,利用使用者 自訂的文章分類做為個人化知識本體,並跟好 友的個人化知識本體來做相似度的比較,以找 出 興 趣 相 似 的 使 用 者 來 進 行 推 薦 [14] , Cao(2007)利用模糊理論實做出一個智慧型推 薦系統[9],此推薦系統克服了因為電子商務商 品過多而產生的資訊負載的問題,翁頌舜(2006) 等學者認為使用者對於項目的經驗背後隱含 了許多情境因素,除了顧客偏好與項目特性 外,還包含了時間、地點、人物、事件及目的 等,都有可能成為主導顧客需求的原因[3],因 此本研究將利用情境資訊和模糊理論於推薦 系統上,透過情境資訊的分析及語意的延伸,

並結合模糊推論引擎來找出符合使用者需求 的資源給使用者。

相關情境資訊 情境運算模組 情境資訊蒐集模組

短期情境 長期情境

項目評分 專家

知識本體

篩選與推薦 模糊推論引擎

個人化 知識本體

案例式庫

圖 6 研究架構

3.2 基於交談平台的廣告推薦系統

我們將推薦方法應用於交談平台上的廣 告推薦,並實作出一個可以根據交談話題推薦 廣告的推薦系統(以購物領域為推薦範圍),如 圖 7所示,在情境資訊蒐集模組的部分,系統

(6)

情境運算模組

交談話題 相似度

廣告分數

篩選與推 專家知識本體

廣告案例 相似度 個人偏好

相似度

個人偏好 歸屬程度 交談話題

歸屬程度

模糊推論引擎 廣告熱門

相似度

廣告熱門 歸屬程度

廣告案例 歸屬程度 廣告

情境資訊 蒐集模組

將針對短期情境與長期情境來進行蒐集,對於 短期情境我們考慮了交談話題以及廣告熱門 相似度兩個因素,而在長期情境的部份,我們 則是利用個人化知識本體來了解個人偏好,此 外,也透過案例式推理來分析過去相似的資 訊;之後,每一個廣告都將經由情境運算模組 分別算出廣告和四種情境資訊之間的相似度。

圖 7 廣告推薦流程圖

詞彙 重組

贅字 處理

同義字 轉換

TF 計算 前置處理

斷詞處理

圖 8 前置處理之流程圖

首先是交談話題相似度,系統會根據時間 或是字元數來決定擷取交談內容,我們暫時分 別設定成 30 秒和 300 個字,接下來將經由前 置處理得到交談話題的關鍵字組,如 圖 8所 示,其步驟主要包含了:

(1)斷詞處理

由於中文並不像英文有空格可以區分詞彙,因 此必須經由斷詞的處理才能得到詞彙,我們利 用了中研院所開發的CKIP(Chinese Knowledge Information Processing Group)來進行斷詞。

(2)詞彙重組

中文詞彙的組成是非常複雜的,有些名詞可以 拆解成兩個名詞,有些名詞經由合併也可以從 多個詞彙變成單一詞彙,因此可能造成斷詞的 誤判,所以我們進一步將詞彙進行重組,其重 組的方式是根據[21]的詞彙重組規則進行重 組,如表 1所示。

表 1 詞彙重組規則[21]

Left word Right word Composite Na, Nb, Nc Na, Nb, Nc Na

A, VH, Neu, Nes, VH13

Na, Nb, Nc, Nd

Na

VJ VH Na VC, VD Na Na

Nba Nba Nba Dfa VH, V_2 VH13 Nes, Neu Neu Neu

Neu, Nes, FW

Nf Nf Neu VH Nf Nep Nf, Nd Nf

(3)過濾贅字

我們參考了[2]的過濾方式,根據詞性來移除贅 字和標點符號,如表 2所示。

(4)同義字轉換

建立同義字典,利用同義字的轉換來達到用詞 的一致性。

(5)組成關鍵字組

(7)

我們利用詞彙頻率(Term Frequency)的計算以 及門檻值(暫時設為 3)的設定,只留下重要的關 鍵字,並且組成關鍵字組。

表 2 重要的詞性[2]

詞性標註 詞性描述 舉例

Na 普通名詞 老師 Nb 專有名詞 洋基隊 Nc 地方名詞 台北 Nd 時間名詞 昨天

VA 動作不及物動詞 跌倒 VC 動作單賓動詞 救援 VD 雙賓動詞 給

VHC 狀態使動動詞 熱 VH 狀態不及物動詞 瀰漫

VJ 狀態單賓動詞 得到

圖 9 購物領域之專家知識本體

當系統取得關鍵字組後,將藉由專家知識本體 的概念組成延伸概念組,在專家知識本體的部 分,我們是參考Yahoo! Dictionary[21]建置而 成,如圖 9所示,延伸概念組代表著使用者之 間的交談的話題T,同樣的,廣告也擁有自己 的延伸概念組A,系統將利用公式

| A T

|

| A T

|

 

St (5)

計算出交談話題相似度 。

除了以交談話題當作短期情境資訊,系統 也加入了廣告點閱次數的考量,因為廣告被點

閱越多次代表該廣告的吸引力越高,因此系統 將每一個廣告的點閱次數經由公式

St

min max

min

Af Af

Af Sh Afi

  (6)

得到廣告熱門相似度 ,其中 為第i個廣告 的點閱次數,Af 為所有廣告中點閱的最少次 數, 為最多廣告次數。

在長期情境的部份,主要包含了個人化知 識本體和案例式推理兩個技術,個人化知識本 體是藉由使用者所接觸的概念建置而成,其運 作流程如

Sh Afi

min

Afmax

圖 10所示,每當使用者接觸了某ㄧ 個概念之後,系統會將該概念的偏好度加 1,

(8)

並且透過下列兩個公式 把偏好度正規化而轉換成正規化後的偏好度 數值(Normalized Interested Degree Value),簡稱 偏好值,其中 為第 i 個概念的偏好度。

為 個 人 化 知 識 本 體 中 所 有 概 念 的 最 低 偏 好 度, 為最高的概念偏好度。最後再透過 公式(10)找出個人化知識本體裡偏好值最高的 概念,並以該概念的偏好值當作該廣告的個人 偏好相似度。

i s

p p

p

p N

p

(7) p pmin

p

max s

s

s

p

p   

(8) 將其延伸概念(即父概念和子概念)的偏好度 (Interested Degree) (即

p

p

p

s )更新,其中

p是是父概念的影響權重,

s則是子概念的 影響權重,我們利用此兩種權重來修正父概念 及子概念的影響程度

)) ( ),..., ( ), ( ), (

max( 1 2 3 n

p N p N p N p N p

S  (10)

除了利用個人化知識本體記錄使用者的 概念偏好,我們也將案例式推理的概念融入推 薦系統中,當使用者點閱了某一個廣告,那就 代表談論與 TA 類似的交談話題時,廣告 A 容 易被接受,系統會將該交談話題的延伸概念組 記錄到案例式庫裡,然後透過公式

| TA T

|

| TA T

|

 

Sc (11) 比對目前的交談話題 T 與曾經接受的廣告所相 對應的話題 TA 之間的相似度,如果某一個熱 門廣告所對應的交談話題不只一個話題,我們 可以找出其相似度最大的話題,即由公式

) ) TA , T ( , , ) TA , T ( , ) TA , T (

max(sim 1 sim 2 sim m

Sc

(12)

圖 10 個人化知識本體之運作流程

此外,我們也考慮到使用者的興趣可能隨著時 間的過去而有所改變,所以當最大偏好度達到 門檻值(例如 10000)後將所有偏好度減半,如此 便能反應出偏好度的轉變。此外,由於偏好度 並不能明確的表示使用者對某概念的喜好程 度,所以當要查詢使用者對某一概念的偏好程 度時,我們必須經公式

min max

min

)

i

N(

p p

p pi p

 

(9)

來得到廣告案例相似度 。

Sc

圖 11為案例式推理之舉例,假設有一個交 談題的延伸概念組T={衣服,,洋裝,平價},以 及廣告的延伸概念組A={衣服,帽子,平價,襯 衫},而且該廣告過去曾經被點閱了 3 次,其對 應的交談話題包含了TA1={衣服,女性,特價}、

TA2={衣 服,淑 女,項 鍊,高 跟 鞋,拍 賣} 以 及 TA3={襯衫,二手,衣服,日本,平價},每一個過去 的交談話題TA與T的相似度分別為 0.2、0.1 以 及 0.3;最後,再從案例式庫裡選出最大相似 度的延伸概念組TA3,因此可得廣告案例相似 度為 0.3。

(9)

T={衣服,買,洋裝,平價} 廣告

={衣服,女性,特價}

={衣服,淑女,項鍊,高跟鞋,拍賣}

A={衣服,帽子,平價,襯衫} ={襯衫,二手,衣服,日本,平價

0.3

) 3 . 0 , 1 . 0 .2, 0 max(

) ) , ( , ) , ( , ) , ( max(

) TA , T (

3 2

1

simTTA simTTA simTTA Sc

TA1

TA2

TA3

T:目前的交談議題

TA:廣告過去所對應的交談議題 A:廣告的關鍵字組

案例式庫

圖 11 案例式推理之舉例

接下來,我們針對不同情境資訊相似度的模糊 集合進行定義,將模糊集合切割成三個區間 (Partition),分別對應了低相似度、中相似度及 高相似度三個語意變數,如圖 12所示,這些 隸屬函數的參數只是一個例子,參數設定將依 實際應用而定。我們根據表 3的模糊規則來得 到每條規則的可適用度(權重值 )及取得不同 規則給予的分數( )。在

wi

fi 表 3裡面,模糊規則 R1 代表著四種情境資訊相似度的歸屬程度都 很高時的情況,即短期情境和長期資訊適合度 都很高,當滿足了所有的條件,所以取四種歸 屬程度裡最面高的數值當作R1 的可適用度,並 以此當權重値;R2 代表著交談話題歸屬程度及 廣告熱門歸屬程度都很高時的情況,即短期情 境資訊適合度較高,所以將取交談話題和廣告 熱門的歸屬程度之最大值當作可適用度,即R2 的權重値;R3 是指個人偏好和廣告案例的歸屬 程度都很高的情況,即長期情境資訊適合度較 高,因此將取兩者之一的最大值當作可適用 度,即R3 的權重値;而R4 到R7 則是代表其中

一種情境資訊相似度的歸屬程度為很高的情 況,例如R4 為只要話題相似度很高就以交談話 題歸屬程度當作R4 的可適用度,R5 是指只要 廣告熱門相似度很高就以廣告熱門歸屬程度 當作R5 的可適用度,R6 代表只要個人偏好相 似度很高就以個人偏好歸屬程度當作R6 的可 適用度,R7 是指只要案例相似度很高就以交談 話題歸屬程度當作R7 的可適用度。最後,透過 公式(13)的權重平均法,就能算出每一個廣告 的分數,然後再利用分數門檻值的設定篩選分 數較高的廣告並依序推薦給使用者。各廣告的 分數為

n

i i n

i i i

i

w f w Ad

Grade

1

) 1

( (13)

其中 代表每一個規則的可適用度, 是每個 專家所給予的分數,n 是規則的總數。

wi fi

0 0.3

0.5 1

t

St high

0.7 0.5

low middle

0 0.3

0.5 1

h

Sh high

0.7 0.5

low middle

0 0.3

0.5 1

p

Sp high

0.7 0.5

low middle

0 0.3

0.5 1

c

Sc high

0.7 0.5

low middle

圖 12 四種情境資訊相似度的模糊集合

(10)

表 3 我們所定義的模糊規則

R1 If is high and is high and is high and is high then is

St

max{

Sh

Wi

100 Sp

h,

Sc

} , , p c

t

  

R2 If is high and is high then is

St

max{

Sh

Wi

100 } , h

t

R3 If is high and is high then W is

Sp

max{

Sc i

100 } , c

P

R4 If St is high then is )

( y

Wi t 100

R5 If Sh is high then is )

(y

Wi h 100

R6 If Sp is high then is

)

p

( y

Wi

 100

R7 If Sc is high then is )

(y

Wi c 100

4. 實例說明

本章節將以實際的例子來進行說明,假設 有一個對話內容經由前置處理之後,得到關鍵 字包含了特價、背包、鞋子、外套及生活用品,

然後經由專家知識本體的概念延伸之後就能 組成延伸概念組T={特價, 背包, 鞋子, 外套, 生活用品, 線上購物, 禮品, 美容用品},假設 在 廣 告 資 料 庫 裡 有 七 個 廣 告 分 別 為 、

、 、 、 、 及 ,每

一個廣告同樣也有自己的延伸概念組以及被 點閱的次數,如

1

Ad7

Ad

Ad Ad Ad Ad Ad

S Ad S Ad S

Ad Ad

2 3 4 5 6

表 4,因此,系統將透過公式 (4)先算出廣告在交談話題上的相似度,其分別

為 ( )=0.6 、 ( )=0.2 、 ( )=0 、 ( )=0.4 、 ( )=0 、 ( )=0.2 以及 ( )=0。除了計算每個廣 告的交談話題相似度,同時也會找出每個廣告 的點閱次數,並經由公式(6)來得到每個廣告的 熱 門 相 似 度 , 其 分 別 為 ( )=0.8 、 ( )=0、 ( )=0.5、 ( )=1、

( )=0.4、 ( )=0 以及 (Ad )=0.2,

如表 4 所示。

t

Ad3

Ad6

Ad2

Ad5

1

S

S

t

Ad7

2

St

Sh

Sh

Sh

t

St

Sh

Sh t

h

Sh 4

St

Ad3

Ad6

5

Ad1

Ad4 7

表 4 廣告的熱門相似度 廣告的延伸概念組 A 點閱

次數 h S

特價, 飾品, 生活用 品, 線上購物 ,禮品,

美容用品

10 0.8 Ad1

Ad2 襯衫, 百貨公司, 外 套, 牛仔褲, 特價

0 0

Ad3 餅乾,麵包,美食 7 0.5

Ad4 生活用品, 美容用品, 禮品, 線上購物, 日系

商品

13 1

Ad5 家具, 書櫃, 電腦桌, 電燈

5 0.4

Ad6 背包, 流行, 錢包, 書 包, 手提包, 特價

0 0

Ad7 電腦, 華碩, 手機, 螢 幕

2 0.2

當系統分別取得了每一種短期情境資訊 的相似度之後,接下來也會利用長期情境的資 訊來進行分析,首先,系統會根據每一個廣告 的延伸概念組到個人化知識本體裡查詢每個 概念的偏好度,假設使用者的個人化知識本體 如圖 13所示,以廣告A1 為例,A1={特價, 飾 品, 生活用品, 線上購物, 禮品,美容用品},其 中偏好度最高的是線上購物的 7.3,因此經由 公式 9 轉換成偏好值之後,我們可以得到 ( )=1,同樣的,其他 6 個廣告也透過個人 化知識本體的查詢與正規化來得到個人偏好 相似度,分別為 ( )=0.4、 (Ad )=0、

( )=1、 p 5)=0.6、 d6)=0.4 Sp

Ad

Ad (

1

Sp

Sp Ad2 Sp 3

4 S (Ad Sp A

(11)

以及Sp(Ad7)=0.8。

5.2 6.47

7.3

4.2

3.5 1

購物

線上購物

生活用品

美容用品 禮品

特價 飾品 電腦 電腦桌 美食

4.5 5.12

6.3 3.3

背包 鞋子 外套

3.8 4.56 2.9

S

Ad S Ad S Ad

圖 13 使用者的個人化知識本體

表 6 廣告所對應的情境資訊相似度

此外,系統也將利用目前交談話題T和案

例式庫裡曾經點閱過的廣告所對應的交談話 題TA做比較,如表 5所示,經由公式(11)取得 T與TA的相似度,然後再透過公式(12)算出每 個 廣 告 的 案 例 相 似 度 , 其 結 果 分 別 為 ( )=0.4 、 ( )=0 、 ( )=0 、 ( )=0.6、 ( )=0、 ( )=0 及 ( )=0。

c

Sc

Sc 1

4 7

c

Sc 2

Ad5

c

Sc

3

Ad6

Ad Ad

表 5 廣告與過去案例的情境資訊相似度 廣告過去所對應的交談話題 TA Sc Ad1 新鮮, 水果, 拍賣, 生活用品,

禮品, 線上購物, 美容用品

0.4

Ad2 none 0

Ad3 餅乾, 點心, 糖果, 蛋糕 0 Ad4 化妝品, 生活用品, 美容用品,

禮品, 線上購物, 特價

0.6

Ad5 電腦, 電腦桌, 便宜 0

Ad6 none 0

Ad7 電腦, 華碩, 筆電, 顯示卡, 便 宜, 螢幕

0

St Sh Sp Sc Ad1 0.6 0.8 1 0.4 Ad2 0.2 0 0.4 0 Ad3 0 0.5 0 0 Ad4 0.4 1 1 0.6 Ad5 0 0.4 0.6 0 Ad6 0.2 0 0.4 0 Ad7 0 0.2 0.8 0

表 7 廣告的情境資訊在高相似的歸屬程度 )

( t

high S

high(Sh) high(SP)high(Sc)

Ad1 0.5 1 1 0

Ad2 0 0 0 0

Ad3 0 0 0 0

Ad4 0 1 1 0.5

Ad5 0 0 0.5 0

Ad6 0 0 0 0

0 0 1 0 Ad7

在 取 得 廣 告 所 有 的 情 境 資 訊 相 似 度 之 後,如表 6,我們將依據相似度對應到高相似 的模糊集合,便能將情境資訊相似度轉換成情 境資訊歸屬程度,如表 7,最後,藉由公式

(12)

(13),推論引擎就能推論出廣告的分數為:

63 . 0

0 100 100 50 100 100 100

4 . 0 0 1 100 8 . 0 100 6 . 0 50 4 . 0 100 06 . 100 4 . 0 ) 100 ( 1

Ad Garad

0 ) (Ad2 Garad

0 ) (Ad3 Garad

67 . 0

50 100 100 0 100 100 100

6 . 0 50 1 100 1 100 4 . 0 0 6 . 0 100 4 . 0 100 4 . 0 ) 100 ( 4

Ad Garad

53 . 0

0 50 0 0 50 0 50

0 0 6 . 0 50 4 . 0 0 0 0 6 . 0 50 4 . 0 0 4 . 0 ) 50 ( 5

Ad Garad

0 ) (Ad6 Garad

26 . 0

0 100 0 0 100 0 100

0 0 8 . 0 100 2 . 0 0 0 0 0 100 2 . 0 0 0 ) 100 ( 7

Ad Garad

因此,當分數門檻值為 0.6 的時候, 及 兩個廣告均符合條件,因此系統將可以根據分 數高低,依序推薦 、 給使用者。

Ad1 Ad4

Ad4 Ad1 5. 結論與未來工作

本研究提出了一個基於情境感知與模糊理 論的推薦系統,並應用於交談平台的廣告推薦 上,實做出一個具有個人化特色的廣告推薦系 統,此平台不僅考慮了使用者的短期偏好,也 考慮了使用者的長期偏好,因此當目前的交談 話題與所有的廣告相似度偏低時,我們就可能 以使用者的長期偏好為主來進行推薦,如此便 能互補兩種情境資訊不足的情形。此外,我們 的個人化廣告推薦改善了傳統廣告推薦的缺 點,可以針對交談話題來推薦,所以推薦出來 的廣告吸引力較高,使用者就樂意去點閱廣 告,因此廣告點閱率就會跟著提升,企業主便 能從中獲得更好的廣告效益。在未來,我們將 實作出來並經由實驗來了解廣告點閱率的改 善結果,此外,我們也將藉由實驗來取得更好 的參數設定,例如擷取交談內容的時機點以及 廣告分數的門檻值等。

參考文獻

[1] 詹國良,“案例式推理於企業信用評等決策 之輔助應用”,碩士論文,國立成功大學工 業管理科學系,台南,2002。

[2] 陳慶龍,“可供語意搜尋之部分知識建構”,

碩士論文,國立成功大學工程科學系,台 南,2006。

[3] 翁頌舜、陳文典,“整合情境資訊之多維度 推薦環境”,2006 電子商務與數位生活研討 會論文集,台北,光碟,2006。

[4] 吳柏諺,“以案例式推理為基礎之高速公路 上危險事件預測系統”,碩士論文,國立台 灣師範大學資訊工程系,台北,2008。

[5] Aamodt, A. and Plaza, E., “Case-based reasoning: foundational issues, Methodological Variations, and System Approaches,” AI Communications. IOS Press, Vol. 7, No. 3, pp. 39-59, 1994.

[6] Chen, H., Finin, T., Joshi A., Kagal, L., Perich F. and Chakraborty, D., “Intelligent Agents Meet the Semantic Web in Smart Spaces,”

IEEE Internet Computing, Vol. 8, No. 6, pp.

69-79, 2004.

[7] Chaffee, J. and Gauch, S., “Personal Ontologies for Web Navigation,”

Proceedings of the 9th International Conference On Information Knowledge Management (CIKM), pp. 227-234, 2000.

[8] Carmichael, D. J., Kay, J. and Kummerfeld, B., “Personal Ontologies for feature selection in Intelligent Environment visualisations,”

Proceedings of the Workshop on Artificial Intelligence in Mobile Systems, pp. 44-51, 2004.

[9] Cao, Y. and Li, Y., “An intelligent fuzzy-based recommendation system for consumer electronic products,” The Journal Expert Systems with Applications, Vol. 33, pp.

230–240, 2007.

[10] Dey, A. K., “Understanding and using context,” Personal and Ubiquitous Computing, Special issue on Situated Interaction and Ubiquitous Computing, Vol.

5, No. 1, pp. 4-7, 2001.

[11] Degemmis, M., Lops, P. and Semeraro, G.,

“A content-collaborative recommender that exploits WordNet-based user profiles for neighborhood formation,” User Modeling and User-Adapted Interaction, Vol. 17, No. 3, pp.

217-255, 2007.

[12] Gupta, G. and Lee, W. C., “Collaborative Spatial Object Recommendation in Location Based Services,” Proceedings of the 2010 39th International Conference on Parallel Processing Workshops, pp. 24-33, 2010.

[13] Huang, H. C., Lin, M. S. and Chen, H. H.,

“Analysis of Intention in Dialogues Using Category Trees and Its Application to

Advertisement Recommendation,”

Proceedings of the Third International joint conference on Natural Language Processing, pp. 625-630, 2008.

(13)

[14] Hsu, P. L., Liu, P. C., and Chen, Y. S.,

“Using Ontology to Map Categories in Blog,”

AIDM '06 Proceedings of the International Workshop on on Integrating AI and Data Mining, pp. 65-72, 2006.

[15] Huhns, M. N. and Stephens, L. M.,

“Personal ontologies,” Internet Computing, IEEE, Vol. 3, No. 5, pp. 85-87, 1999.

[16] Jang, Y., Lee, T., Kim, K. and Lee, W.,

“Keyword Management System based on Ontology for Contextual Advertising,”

Proceedings of the Sixth International Conference on Advanced Language Processing and Web Information Technology, pp. 440-445, 2007.

[17] Kazienko, P. and Adamski, M.,

“AdROSA–Adaptive Personalization of Web Advertising,” Information Sciences, Vol. 177, No.11, pp. 2269-2295, 2007.

[18] Kim, J. H., Chung, K. Y., Ryu, J. K., Rim, K.

W. and Lee, J. H., “A Recommendation Agent System Using HMM-Based Collaborative Filtering in Smart Home Environment,”

Proceedings of the Third International Conference on Convergence and Hybrid Information Technology, pp. 214-217, 2008.

[19] Kayaalp, M., Özyer, T. and Özyer, S. T., “A Collaborative and Content Based Event Recommendation System Integrated With Data Collection Scrapers and Services at a Social Networking Site,” Proceedings of the 2009 International Conference on Advances in Social Network Analysis and Mining, pp.

113-118, 2009.

[20] Liao, S. C., Kao, K. F., Liao, I. E., Chen, H.

L. and Huang, S. O., “PORE: a personal ontology recommender system for digital libraries,” Electronic Library, Vol. 27, No 3, pp. 496-508, 2009.

[21] Lee C. W., Shih, C. W., Day, M. Y., Tsai, T.

H., Jiang, T. J., Wu, C. W., Sung, C. L., Chen, Y. R., Wu, S. H., and Hsu, W. L., “ASQA:

Academia Sinica Question Answering System for NTCIR-5 CLQA,” Proceedings of the NTCIR-5 Workshop Tokyo, pp. 202-208, 2005.

[22] Middleton, S. E., Roure, D. D. and Shadbolt, N. R., “Ontology-based recommender systems,” International Handbooks on Information Systems, Vol. 6, pp 4779-796, 2009.

[23] Rong, W. and Liu, K., “A Survey of Context Aware Web Service Discovery: From User’s

Perspective,” Proceedings of the 2010 Fifth IEEE International Symposium on Service Oriented System Engineering, pp. 15-22, 2010.

[24] Schank, R. C., “Dynamic Memory: A Theory of Reminding and Learning in Computers and People,” Cambridge University Press, 1982.

[25] Schilit, S B., Adams, N. and Want, R.,

“Context-aware computing applications,”

Proceedings of the IEEE Workshop on Mobile Computing Systems and Applications, pp 85-90, 1994.

[26] Sargolzaei, J. and Khoshnoodi, M., “Fuzzy inference system to modeling of cross flow milk ultrafiltration,” Applied Soft Computing, Vo. 8, No. 1, pp 456-465, 2008.

[27] Schilit, S B. and Theimer, M.,

“Disseminating Active Map Information to Mobile Hosts,” IEEE Network, Vol. 8, No. 5, pp. 22-32, 1994.

[28] Zadeh, L. A., “Fuzzy Sets,” Information and Control, Vol. 8, No. 3, pp. 338-353, 1965.

[29] Zadeh, L. A., “Outline of a New Approach to Analysis of Complex Systems,” IEEE Trans. on Sys. Man and Cyb, Vol. 1, No.1, pp.

28-44, 1973.

[30] Yaoo! Dictionary。2011 年 10 月 15 日取 自:http://tw.dir.yahoo.com/

[31] 豆豆聊天室。2011 年 10 月 5 日取自:

http://doo.idv.tw/

參考文獻

相關文件

Proceedings of the 19th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval pp.298-306.. Automatic Classification Using Supervised

Hofmann, “Collaborative filtering via Gaussian probabilistic latent semantic analysis”, Proceedings of the 26th Annual International ACM SIGIR Conference on Research and

Mehrotra, “Content-based image retrieval with relevance feedback in MARS,” In Proceedings of IEEE International Conference on Image Processing ’97. Chakrabarti, “Query

in Proceedings of the 20th International Conference on Very Large Data

Lange, “An Object-Oriented Design Method for Hypermedia Information Systems”, Proceedings of the Twenty-seventh annual Hawaii International Conference on System Sciences, 1994,

The scenarios fuzzy inference system is developed for effectively manage all the low-level sensors information and inductive high-level context scenarios based

(英文) The Sixth International Conference on Intelligent Information Hiding and Multimedia Signal Processing (IIHMSP 2010). 發表 論文

Shih and W.-C.Wang “A 3D Model Retrieval Approach based on The Principal Plane Descriptor” , Proceedings of The 10 Second International Conference on Innovative