• 沒有找到結果。

結合知識本體與案例式推理之即時廣告推薦

N/A
N/A
Protected

Academic year: 2022

Share "結合知識本體與案例式推理之即時廣告推薦"

Copied!
8
0
0

加載中.... (立即查看全文)

全文

(1)

結合知識本體與案例式推理之即時廣告推薦 -以線上交談平台的廣告推薦為例

摘要

隨著人們對網路的使用日趨頻繁,許多 企業開始利用網路來宣傳廣告,但是目前 的廣告方式通常都只是在特定的主題平台 或是以不分主題的隨機方式來打廣告,如 此對某一廣告沒有興趣的人們就會排斥甚 至遠離,所以廣告的效益將大打折扣。本 研究希望能夠藉由使用者的資訊及使用者 間 聊 天 的 內 容 的 分 析 , 結 合 知 識 本 體 (Ontology)的技術與案例式推理(Case-Base reasoning)的概念來找出使用者比較有興趣 的議題分類,再將相關的廣告推薦給使用 者,以達到提高即時廣告效益的目的。

關鍵詞:廣告、知識本體、案例式推理、

推薦、聊天議題。

1. 前言

由於網際網路的方便性,越來越多人 開始透過網路平台從事各式各樣的活動,

例如聊天、網路購物、線上討論等,而在 從事這些活動的時候,通常都會有一個推 薦的服務機制,因為在這些網路平台上的 資源都是非常龐大的,使用者往往無法從 如此龐大的資源空間裡快速的找到自己想 要的資源,因此,資料的過濾與推薦變的 非常重要。推薦就是用來幫助使用者找到 符合自己需求的資源,利如廣告推薦、文 章推薦、產品推薦等。

而另一方面,在這些網路平台的介面 上經常可以看到許多的網路廣告,這些網 路廣告有各種廣告的方式,利如橫幅廣告 (Banner Ads)、按鈕廣告(Button Ads)、插播

式(Interstitial Ads)、文字廣告(Text Links Ads)、贊助式廣告(Sponsored Ads)等[2],

但由於這些廣告方式通常都沒有針對特定 主題來進行廣告,而且都是屬於非即時的 廣告方式,所謂的非即時的廣告方式指的 是平台管理者事先就設定好要放哪些廣告 上去。因此,這樣的方式往往沒有辦法達 到良好的廣告效益,因為每一個網路平台 使用者彼此的興趣都不一樣,所以不一定 會對這些廣告感興趣。

雖然目前有許多關於網路廣告推薦的 研究,但是其研究重點幾乎都是放在廣告 的推薦精準度上,而忽略掉即時的廣告推 薦,例如陶幼慧等學者(2005)利用網路探勘 應用於電子商務網站做效能的分析,但是 並沒有即時推薦的效果[4],表 1 為即時與 一般廣告之優缺點比較。有藉於此,本研 究提出將知識本體的技術與案例式推理的 概念結合,並應用到網路的交談平台上,

從使用者之間的交談內容分析其中的聊天 議題,找出聊天議題的相關廣告有哪些,

再將相關的廣告推薦給使用者。因為所推 薦的廣告與使用者的相關性提高,所以廣 告的效率也提昇了。

表 1 即時與一般廣告之比較 即時推薦 一般推薦

推薦範圍

客製化

廣告吸引力

2. 文獻探討

2.1 知識本體(Ontology)

陳榮昌 蕭朝維

朝陽科技大學 資訊管理系

朝陽科技大學 資訊管理系 rcchen@cyut.edu.tw s9914617@cyut.edu.tw

「知識本體」又可稱為本體論或實體

(2)

(3)可以幫助知識的重新利用。

論,最早來自於哲學的領域,若以哲學的 觀點來解釋的話,可解釋為一切存在於世 界的本質,學者(Gruber,1993)定義知識本 體是ㄧ種概念化的明確描述[13],而對於人 工智慧的領域來說,知識本體被發展為用 來提供機器可處理的資訊來源,並供不同 的代理人(Agent)之間溝通[3]。具體來講,

知識本體是一種利用概念和階層關係來描 述知識的方法,透過知識本體加上推論引 擎可以促進不同領域之間的知識分享和重 覆使用。許多知識本體被發展來幫助知識 的分享和再利用(Gruber,1995)[14]。因此,

知識本體普遍被應用在知識工程、網頁探 勘等以人工智慧為分支的領域。知識本體 的架構,主要可分為實體(Entities)、概念 (Concept) 、屬性(Attributes)、關聯(Relations) 和公理(Axiom),所謂的實體指的是一種具 體的物件且為單一個體,例如一張桌子、

一本書等,概念則是由多個相同的實體所 組成,屬性指的是ㄧ個概念所包含的特 徵,例如魚類這個概念包含了鱗片、鰓等 特徵,關聯則是代表兩個概念或是兩個實 體之間所存在的關係,例如is a relation、a part of 等關聯(如圖 1),而公理指的是知識 本體的推論規則或限制。

(4)可以擴充不同領域的知識達到知識 的共享。這些特性可以用來幫助我們從聊 天的重要關鍵字去正確地推論出聊天的議 題。

2.2 網路廣告(Display Advertisement) 根據資策會 FIND 對於國內的網路人 口調查,2010 的網路人口數達到近 1100 萬人。自從網際網路出現後,無所不在的 優勢,使得網路變成廣告主的最愛。另一 方面,網路廣告也可以讓廣告主知道自己 的廣告的點閱次數,有效的衡量廣告效 益。網路廣告市場因此得以快速擴張,是 整個廣告產業中成長最快的一環(天下雜 誌,357 期,2006),而根據台北市網際網 路廣告暨媒體經營協會(IAMA)的統計,在 2010 年台灣整體網路廣告營收市場高達新 台 78.81 億元,如圖 2。但是,由於網路廣 告幾乎都是以隨機的方式來呈現,所以造 成點閱率普遍不高的情況,另外,根據網 路調查公司 Webtrends(2009)的調查報告,

Facebook 的廣告點閱率有漸漸下滑的趨 勢,2009 年的點閱率為 0.06%,到了 2010 年的時候則下降成 0.05%,這樣的點閱率 遠低於業界中的平均值 0.10%。

哺乳類 動物

鳥類

大象 袋鼠

大耳長鼻

is a

a part of a part of

is a

is a is a

哺乳類 動物

鳥類

大象 袋鼠

大耳長鼻

is a

a part of a part of

is a

is a is a

圖 1 本體論的架構-以動物的分類為例

圖 2 2007-2010 台灣網路廣告成長趨勢

綜合知識本體的特性其優點主要如下

所述: (圖片來源:IAMA,2010.1)

(1)具有語意的描述能力,可以推論出

相關的類別。 而由於網路廣告的盛行,許多學者開始

進 行 關 於 網 路 廣 告 的 研 究 , Fain等學者 (2006)對於贊助式廣告做了調查的相關研 究,指出將廣告的內容與使用者意圖做比 (2)知識本體的屬性可以當作特定資料

的特徵,以進行分群與分類。

(3)

較是很重要的[8],所謂的贊助搜尋意指不 按照網路排名而是依據廣告提供者所出的 價錢來進行廣告的宣傳,Hung-Chi Huang 等學者(2008) 提出以分類樹應用到交談內 容的分析並用在廣告的推薦上[9],但是此 研究所的方法只能針對英文的交談內容做 分析,所以無法處理中文的交談內容。本 研究試圖利用Yahoo! directory,自行建立中 文的分類樹,並以其為基礎來輔助廣告的 推薦。

2.3 案例式推理(Case-Base Reasoning,CBR)

圖 3 案例式推理之循環圖[7]

3. 研究方法 案例式推理是源自人類決策時的一種

思考模式,人類的大腦可以視為一個案例 式資料庫,內部存在著之前所有已經解決 的案例和解決的方法[1]。舉例來說,學生 在考試的時候,遇到某個問題會先思考以 前是否有寫過相同或是類似的題目,若有 就將其解決方法直接拿來使用或是經過修 改再使用。而案例式推理的優點是能夠透 過歷史記錄快速的找到解決方法並且能夠 將方法改進以供未來使用。圖 3 為案例式 推理的循環過程[7],當我們遇到一個問題 的時候,會先到存放案例的資料庫查詢類 似的案例,然後進行比對的動作,確定是 與目前問題相關之後,就重新利用此案例 去找出解決方法,並修改原來的解決方法 以解決目前的問題,最後再放入資料庫裡 擴充資料庫裡面的案例。

3.1 研究目的與系統架構

本研究的目的是將案例式推理的概念 與知識本體結合,然後應用到廣告的即時 推薦上,而研究範圍是以購物的領域為範 疇,並且以線上交談平台做為應用例子,

透過知識本體的 is a relation、a part of 等特 性來輔助推論出相關的廣告。我們也將 CBR 的概念融入到廣告推薦上,用來分析 哪些廣告比較吸引使用者,並將比較符合 使用者需求的廣告呈現給使用者。

在圖 4 的系統架構中,我們每隔一段 時間擷取使用者的交談內容,並做斷詞處 理、過濾處理、詞彙分析,然後透過知識 本體的分類架構找出聊天議題的延伸概念 組,最後結合過去的點閱紀錄,以案例式 推理及相似度分析來找出與聊天議題較接 近的廣告,並將其推薦給使用者。

(4)

廣告資料庫 查詢延伸概念

案例式推理 紀錄

推薦

交談內容 斷詞處理 過濾處理 聊天議題

分析聊天議題

廣告之推論 使用者

分析詞彙頻率

相關廣告比對

相似度綜合分析

圖 4 系統架構流程圖

3.2 知識本體之建置

知識本體的建置方式主要可分為手動 建置和半自動建置,其中手動建置因為是 自行建置,所以會產生過於主觀的缺點,

而半自動建構的方式有很多種方法,如以 字典為基礎的方式、以文字分群為基礎 等,但都還是有其優缺點。本研究選擇專 家知識本體來做為推論的依據,因為專家 知識本體已被多位專家或使用者驗證過,

因此,專家定義的知識本體是一個較完整 且可靠的知識本體,所以可信度較為其他 方式所建立的知識本體高[6] 。目前已有許 多現成的專家知識本體,例如Yahoo!

directory、維基百科分類索引、ODP(Open Directory Project)等,學者Garofalakis和 Giannakoudi (2009)利用ODP做為專家知識 本體並且用來達到個人化網頁排序的目的 [10],Stuart E. Middleton等學者(2009)在研 究中所實驗的推薦系統,Quickstep和 Foxtrot分別是基於ODP和CORA兩個專家 知識本體所建置而成[12],本研究則是採用 Yahoo! Directory做為我們的專家知識本 體,圖 5 為截取自Yahoo! Directory[15]的一 部分。我們考量到範圍訂的太大將使得聊 天議題的種類落差太大,造成推薦上的困 難,因此選擇以「購物」分類的三個階層 做為知識本體的領域範圍,並以每個分類 底下的網站做為要推薦的廣告,圖 6 為

Yahoo! Directory-分類底下所包含的網站 [15]。我們使用由史丹佛大學所開發的 Protégé為建置工具,因為其優點包含了簡 單易用、支援多種之識本體語言、支援多 種儲存格式等[5]。圖 7 是本研究所建置的 專家知識本體。

圖 5 Yahoo! Directory[15]

圖 6 Yahoo! Directory-分類底下所包含的網站[15]

(5)

圖 7 專家知識本體之階層圖

3.3 分析聊天議題

本研究在線上交談平台方面是以聊天 室做為分析的平台,在研究假設方面是限 制使用者在一對一的情況之下,因為若同 時有太多的使用者將造成聊天議題過多,

使得系統必須推薦太多的廣告,這將造成 廣告的推薦失去焦點,而且變的更為複 雜,另外也將知識本體的領域定在購物的 範圍。在聊天議題分析的部份,主要可以 分成以下四個步驟:

步驟一、交談內容擷取

對於交談內容的擷取,我們考量到每 一個使用者的打字速度並不相同,而且打 字速度的快慢將影響交談內容的數量,所 以將以交談時間與交談內容的文字數量做 為判斷是否擷取的依據,而關於實驗參數 的設定則必須經過更多次的測試才能得 知,因此,在交談時間方面,我們暫時設 為 1 分鐘,而交談數量將設為 100 個字。

步驟二、斷詞處理

由於中文字詞的數量非常的龐大,而 且並不像英文詞彙都有空白來區分字詞,

因此,必須先分析出其交談內容包是由哪 些詞彙所組成,才能做更進一步的處理。

對於斷詞,我們採用由中央研究院所開發 的中文斷詞系統 CKIP(Chinese Knowledge Information Processing Group)。CKIP 必須

自行撰寫 Socket 程式然後將欲處理的內容 傳送到伺服器端進行斷詞處理,處理完之 後客戶端所接收的資料不僅是斷詞之後的 結果也包含了每一個詞彙的詞性。

步驟三、過濾處理

經過斷詞的處理之後,我們可以得到 交談內容所包含的每一個詞彙,並且能從 斷詞的結果了解每一個詞彙的詞性為何,

接下來就開始依據詞性和贅字對照表過濾 出可能的聊天議題,所謂的贅字指的是沒 有意義的文字,其依詞性可主要可分為語 助詞、代名詞等,如表 2。

表 2 贅字對照表之舉例

語助詞 例如「嗎」、「呀」、「哈」、「呵」等。

代名詞 例如「你」、「我」、「他」等。

問候詞 例如「嗨」「哈囉」「早安」「午安」

「晚安」等。

介系詞 例如「的」、「個、「之」等。

量詞 例如「條、「尾」、「片」、「件」等。

步驟四、詞彙頻率之分析

在經過贅字的過濾之後,所留下的字 通常都是比較有意義的字詞,因此,我們 將這些字詞當作是聊天議題的關鍵字,而 接下來,則會開始先分析每一個聊天議題 的關鍵字是否有包含在專家知識本體裡 面,因為不包含在知識本體裡面主要有兩 種可能性,第一種可能性為比較新穎的字

(6)

詞,第二種可能性為超過本研究領域範圍 的字詞。

當可能聊天議題的關鍵字不包含在知 識本體裡面的時候,我們會將此議題移除 掉,只留下有包含在知識本體裡面的關鍵 字,而接下來,我們則會開始透過 TF(Term Frequency)計算這些關鍵字的出現頻率,並 且將頻率最高的前 3 個關鍵字當作交談內 容的聊天議題,然後以此聊天議題到知識 本體裡面進行推論與查詢。

3.4 廣告之推論

在知識本體的推論部分,本研究參考 蔡旺典在碩士論文中對於知識本體的推論 方式[6],該論文將關鍵字組加上其在知識 本體中的父概念、鄰概念和子概念彙整成 延伸概念向量(Extended Concept Vector)。

延伸概念向量因為涵蓋的觀念更細,比原 來的關鍵字組更能夠表達某段文章的涵 義。在本研究中,因為鄰概念對議題的影 響較小,所以我們只取關鍵字本身及其父 概念及子概念而形成延伸概念組。當系統 得到聊天內容的關鍵字組後,我們會根據 這些關鍵字組從知識本體的階層架構找出 直屬的父概念與子概念然後加上原來的關 鍵字組,共同組成聊天議題的延伸概念組

。 } t ..., , t , t {

T 1 2 n

另外,所有由廣告商提供的廣告也可 以找到其相對應的關鍵字組,我們也依同 樣的方法透過知識本體找出直屬的父概念 與子概念然後加上原來的關鍵字組,共同 組 成 廣 告 的 延 伸 概 念 組

。有了聊天議題與廣告的 延伸概念組(T 和 A),我們就可以使用相似 度運算來找出其相似的程度,我們定義 T 和 A 的相似度為

} a ..., , a , a {

A 1 2 n

| A T

|

| A T ) | A , T

(

sim (1) 因此,我們就可以將與聊天議題相似度最 高的廣告推薦給使用者。

另外,我們也將案例式推理的概念融入廣 告的推薦上。如果某一個聊天議題(TA)被

談論時,我們推薦的廣告 A 被接受,那就 代表談論與 TA 類似的聊天議題時,廣告 A 容易被接受。所以,我們就比對目前的聊 天議題 A 與曾經接受的廣告所相對應的議 題 TA,如果他相似度很高,也列入推薦的 依據。

我們定義其相似度為

| TA T

|

| TA T ) | TA , T

(

sim (2) 如果某一個廣告非常熱門,則他所相對應 的聊天議題可能會不只一個議題(假設其 分別為 ),那麼,我們可以定義由案例式 推理所得到的推薦分數為其最大相似度的 值,即

) ) TA , T ( , , ) TA , T ( , ) TA , T ( max(

) TA , T (

m 2

1 sim sim

sim sim

(3)

如果某一個廣告是新廣告或沒有被推薦過 的廣告,我們可以定義sim(T,TA)0

如此,我們就可以同時考慮聊天議題相似 度與案例式推理所得到的相似度來做為推 薦的依據。我們以滿足這兩者之ㄧ的最大 值的廣告來當作我們推薦的對象,即廣告 A 的推薦分數

)) , ( ), A , T ( max(

) ,

(T A sim simT TA

Grade (4)

其中,T 為聊天議題,TA 為廣告 A 曾被推 薦成功時的聊天議題。

因此,我們只要將目前得到的聊天議題 T 對每個廣告打分數,得到 Grade(T,A),就 能夠找到分數較高的幾個廣告,以這些廣 告來推薦給使用者。

3.5 廣告推薦流程說明例

此節是在說明廣告的推薦流程,當使 用者聊天的時間達到 1 分鐘或是聊天內容 達到 100 個字之後,系統會將最近的對話 內容擷取起來並連線至 CKIP 做斷詞處 理,緊接著會將斷詞結果進行過濾處理,

根據贅字對照表將標點符號、贅字等去除 掉,然後只留下比較有意義的字詞,再依 據頻率最高的關鍵字推論出延伸概念,最

(7)

後再經由詞彙頻率的分析找出對話內容的 聊天議題。假設判斷出聊天議題包含「生 活用品」和「精品百貨」,然後經由知識本 體的推論之後,就能得到延伸概念組,

T={生活用品,購物,線上購物,美容用品,禮 品,精品百貨}。

接下來,我們會與每一個廣告做相似 度的比較,假設有 A1、A2、A3 和 A4 四 個廣告,A1={精品百貨,線上購物,購物}、

A2={百貨公司,購物}、A3={二手交易,買賣 專區,線上購物,購物}、A4={網路藥局,線上 購物,購物},經過公式(1)的比對之後就能 得知延伸概念組 T 和每一個廣告的相似 度。分別為 0.5、0.14、0.25 和 0.14。

此外,我們也會比對之前的推薦紀 錄,假設有廣告 A1、A2 及 A3 曾經被推薦 過,其相對應的聊天議題為 TA1={禮品,生 活用品,線上購物,購物}、TA2={美容用品, 線 上 購 物 , 購 物 } 及 TA3={ 電 視 購 物 , 購 物},經過公式(2)的比對之後就能知道延伸 概念組 T 和 TA1、TA2 及 TA3 的相似度分 別為 0.66、0.5、0.14,那麼,透過公式(4) 的 計 算 , 四 個 廣 告 的 推 荐 值 分 別 為 Grade(T,TA1) = max(0.5, 0.66) = 0.66, Grade(T,TA2) = max(0.14, 0.5) = 0.5, Grade(T,TA3) = max(0.25, 0.14) = 0.14, Grade(T,TA41) = max(0.14, 0) = 0.14。因 此,如果推薦值的門檻值為 0.5 的話,我們 就可以推薦廣告 A1 和 A2。

4.結論與未來工作

本研究提出以知識本體結合案例式 推理的概念的推薦方式,並將其應用到線 上交談平台上,我們分析使用者的交談內 容,了解使用者之間的聊天議題,推論出 與聊天議題相關的延伸概念組,並依此延 伸概念組結合網路廣告的點閱情形,推論 出比較符合使用者需求的廣告給使用者。

本研究的即時推薦有別於一般廣告的 推薦方式,它可以隨著聊天議題的變化來 更換廣告,因此更能達到即時廣告推薦的 效果。

在未來的研究中,我們將透過實驗的 測試來分析擷取交談內容的最佳時機點,

並比較相關的研究方法,進行效能的分析 與評估。

參考文獻

[1] 吳柏諺,以案例式推理為基礎之高速公 路上危險事件預測系統,國立台灣師範 大學資訊工程研究所碩士論文,民國 97 年 6 月。

[2] 周郁菁,在時間限制下,網路廣告促銷 方式對網路衝動性購買行為影響之研 究,朝陽科技大學企業管理系碩士論 文,民國 97 年 5 月。

[3] 林建宏,正規化概念分析建構電腦病毒 特徵之知識本體,國立雲林科技大學資 訊管理系碩士論文,民國 95 年 5 月。

[4] 陶幼慧、莊明達、劉書助,網路探勘應 用於電子商務網站之績效實驗,第十一 屆資訊管理實務研討會,實踐大學,

DEC.2-3,2005。

[5] 潘紫菁,應用本體論強化軟體技術之知 識管理,國立成功大學工程科學研究所 碩士論文,民國 95 年 7 月。

[6] 蔡旺典,建立個人化知識本體來輔助網 頁 行 為 探 勘 – 以 個 人 化 網 頁 排 序 為 例,朝陽科技大學資訊管理系碩士論 文,民國 96 年 1 月。

[7] A. Aamodt, E. Plaza, “Case-Based

Reasoning: Foundational Issues,Methodological Variations, and

System Approaches,” AI Communications.

IOS Press, Vol. 7, No. 3, 1994, pp. 39-59.

[8] D. C. Fain and J. O. Pedersen, “Sponsored Search: A Brief History,” Bulletin of the American Society for Information Science and Technology, Vol. 32, No. 2, 2006, pp.12-13.

[9] H. C. Huang, M. S. Lin and H. H. Chen,

“Analysis of Intention in Dialogues Using Category Trees and Its Application to Advertisement Recommendation,” The Third International joint conference on Natural Language Processing, India, 2008, pp. 625-630.

[10] J. Garofalakis and T. Giannakoudi,

“Exploiting Ontologies for Web Search Personalization” Web Personalization in Intelligent Environments, Vol. 229, 2009, pp. 49-54.

[11] P. L. Hsu, P. C. Liu, and Y. S. Chen,

“Using Ontology to Map Categories in Blog,” Integrating AI and Data Mining, Hobart, 2006, pp. 65-72.

(8)

[12] S. E. Middleton, D. D. Roure, and N. R.

Shadbolt. “Ontology-based recommender systems,” In S. Staab, & R. Studer,

Handbook on Ontologies, Springer-Verlag, Series on Handbooks in Information

Systems, 2009, pp 477-498.

[13] T. R. Gruber, “A Translation Approach to Portable Ontology Specifications,”

IEEE Trans. on Rob., Vol. 14, No. 3, 1993, pp. 199-220.

[14] T. R. Gruber, “Toward Principles for the Design of Ontologies Used for Knowledge Sharing,” IEEE Trans. on Rob., Vol. 43, No. 5-6, 1995, pp. 907-928.

[15] Yahoo! directory, http://tw.dir.yahoo.com/.

參考文獻

相關文件

推薦 查核 註 3 國家 地址 註 1. 應列明與本計

本校為推廣國際教育交流與文化體驗學習,2014 年與加拿大英屬哥倫比亞大學 The University of British Columbia 合作,舉辦「明道中學國中部加拿大溫哥華英屬哥倫比

※扶手設計與另一邊櫃子結合需 要時只需輕輕一拉即可,不用時 輕輕一推即可。.

1.推(自)薦表紙本1份及推(自)薦資料電子檔,電子檔格式包括 word 檔(或 odt 檔)及 pdf

Full credit if they got (a) wrong but found correct q and integrated correctly using their answer.. Algebra mistakes -1% each, integral mistakes

若因連署人重複連署被註銷連署資格,致連署人數不足,不符推薦規定時,本會應以書面通 知被推薦人及推薦代表人,推薦代表人應於書面通知到達 3

Keywords: Personal Advertisement Recommendation, Click through Rates, Context-awareness, Contextual Information, Fuzzy Inference

For both the situation of online talking and web browsing, we could obtain the context-aware knowledge by analyzing the content of conversations and web browsing to find