淺層學習模型 (Shallow Learning Layer)

第二章文獻探討

2.2 廣告預測學習模型

2.2.1 淺層學習模型 (Shallow Learning Layer)

多數廣告點擊率預測方法直接採用機器學習的方法，快速學習到資料特徵與點選的規則性[1][11]。淺層學習模型多採用迴歸模型(Regression Model) 以及因子分解機(Factorization Machine)，其中以線性迴歸模型較直覺、具可擴充性(Extendibility)、容易處理，且可較快速訓練大量資料，因此最為常見。

而因子分解機則可處理資料稀疏的問題，是近來預測點擊率較常採用的模型。

以下將依序介紹各種淺層學習模型預測點擊率的模型方法：包括迴歸模型、因子分解機模型及遷移學習模型。

<1> 迴歸模型 (Regression Model)

許多預測點擊率的研究上都會使用迴歸模型[5][6]，將選好的特徵丟

入迴歸模型，預測出一個介於0 到 1 之間的值。使用迴歸模型能快速簡單的得到一個預測機率值，再設定一個門檻值決定結果為0 或 1。

論文[5]中提到，搜尋式廣告認為使用者在進行搜尋行為時，隱藏著對某些事情的動機，因此可透過使用者的輸入關鍵字推薦適合廣告。利用線性迴歸函數中的高斯常態分佈累積函數(Gaussian Probit Regression model)生成模型，可自動學習特徵權重排序優先度，對搜尋式廣告進行二元分類的點擊預測。論文[6]相較於論文[5]的不同點是該篇論文主要考慮Facebook 上的廣告，並未考慮使用者輸入的查詢文字。當使用者造訪 Facebook 時，有大量的廣告回饋，可產生大量的點擊與否之行為特徵。

利用這樣的特性，該論文使用串聯分類器(Cascade Classifier)，結合決策樹(Decision Tree)與邏輯迴歸函數(Logistic Regression)的模組進行預測，

其預測效果比單用迴歸函數來的好。

因此，本論文希望藉由上述論文所觀察到，對特徵學習權重[5]，利用迴歸函數模型與其餘機器學習到的模型進行結合[6]，以期增進點擊預測效果。

<2> 因子分解機 (Factorization Machine)

由於使用者對已曝光的廣告行為形成龐大的數據資料，其資料內容中有點擊的資料非常稀疏，因子分解機之特徵擷取及矩陣分解可有效解決資料稀疏問題。

論文[12]的點擊率預測方法根據使用者的行為定向做預測，但是使用者的資訊會隨時間持續更新，若要快速達到點擊預測，目前多數的研

究都選擇使用迴歸模型預測點擊率。論文[12]則建立一個以因子分解機為基礎的階層式因子分解機(Hierarchical Importance-Aware Factorization Machine, HIFM)模型，利用特徵權重的重要性與階層式學習，解決有時間屬性的資料，以及使用者尚未有足夠初始資料的冷啟動問題，進而提升點擊率的預測準確度。

本論文認為若能有效的將迴歸模型與因子分解機做結合，不僅能達到快速預測點擊率，並能解決無初始資料帶來的冷啟動問題。

<3> 遷移學習 (Transfer Learning)

遷移學習的主要概念是希望透過已用大量資料學習好的模型參數，

套用到新的資料上做局部參數調整，這樣的好處是不須重新訓練新模型中每個部分的參數，以下兩篇論文皆使用遷移學習來預測點擊率。

論文[3]認為展示型廣告在網路上可蒐集到使用者跟發佈商大量的廣告資訊。要針對使用者給予廣告推薦，可透過常見的機器學習方法即可達到目標。但是針對大量資料建立分類模型會造成計算成本的消耗，

因此該論文建立一種簡單而有效的遷移學習方法，利用較有價值的廣告，

意指廣告商願意投注在某則廣告上較多的資金，使用隨機梯度下降 (Stochastic Gradient Descent，SGD)與貝氏邏輯迴歸方法，將訓練出的模型參數套用在初始價值較低的廣告預測模型上。該方法使用初始價值較低的廣告資料，利用原模型的參數做調整，並使用正規化方法解決資料稀疏造成權重參數訓練不均衡的現象。由該論文的實驗顯示，遷移學習方法提升了初始價值較低的廣告點擊率，讓整體廣告價值提升，使廣告商願意投注在廣告上較多的資金。

論文[18]則使用遷移學習方法，將數量較大的產品(稱為來源)所訓練出的參數，用在數量較少的產品(稱為目標)

。

該篇論文所遇到的挑戰為，

來源資料的特徵屬性分佈與目標資料的特徵屬性分佈懸殊，因此藉由遷移學習方法，解決目標資料特徵屬性分佈不均，而造成模型訓練不夠完善的問題。為了有效處理大量的廣告資料，該論文採用梯度下降(Gradient Information)跟 MapReduce 的機器學習方法來降低維度，以有效提升對於目標產品點擊率的預測準確度。

由上述論文顯示，遷移學習的方法可解決資料稀疏問題。本論文認為由於廣告的點擊率低，所以使用者點擊行為資料過於稀疏。若能利用遷移學習的方法，將根據大數據學習好的模型參數，以引用到較少量的分群資料調整其本身無法有效訓練的結果，進而可建構出適合分群資料的模型，提升預測準確率。

在文檔中透過使用者行為與廣告特性預測點擊率 (頁 14-17)

淺層學習模型 (Shallow Learning Layer)

第二章 文獻探討

2.2 廣告預測學習模型

2.2.1 淺層學習模型 (Shallow Learning Layer)

。

第二章文獻探討