Group lasso 方法

第二章研究方法

第二節模型估計

二、 Group lasso 方法

lasso) (Tibshirani, 1996, 1997)是一種同時估計參數與挑選變數的方法。其估計原理為，在最適化目標函數ℓ(𝛄𝛄)的時候，藉由引入𝛄𝛄的𝐿𝐿₁範數來達到係數壓縮的效果。具體而言，

𝛄𝛄�_𝑠𝑠 = argmax

𝛄𝛄 {ℓ(𝛄𝛄)} subject to ‖𝛄𝛄‖₁ ≤ 𝑠𝑠 (3.25) 此處，‖∙‖₁為𝐿𝐿₁範數，而𝑠𝑠為一個調諧參數(tuning parameter)。式(3.25)也可以藉拉格朗日式(Lagrangian form)來表達，

𝛄𝛄�_𝜆𝜆 = argmax 有助於模型的解釋，此為精簡原則(principle of parsimony)；第三，在某些情況中，研究者可能面臨過多的變數，變數的數目甚至多於樣本數，此時傳統的分析方法便會失效，而lasso 方法則不受變數個數的限制。因此，lasso 被廣泛應用於高維資料的分析當中。

二、Group lasso 方法

在某些情況中，研究者可能欲同時納入或排除一組變數，而非單一變數，例如：以多個虛擬變數(dummy variable)編碼而成的因子，或是如本文模型中以一

‧

於模型的解釋。為了解決這個問題，

Yuan & Lin (2006)

提出了group lasso，這個方法同時懲罰了一組變數，而非單一變數。具體而言，令𝛄𝛄_𝑖𝑖為對應係數向量𝛄𝛄中則為

Verweij & van Houwelingen (1993)

根據 Cox 模型所提出的交叉驗證法 (cross-validation)。

交叉驗證的想法是，在給定某個𝜆𝜆之下，將樣本隨機分為𝐾𝐾組後（1 < 𝐾𝐾 ≤ 𝑛𝑛），使用其中𝐾𝐾 − 1組作為訓練樣本(training set)，也就是利用此組樣本來估計係數。

當模型確立後，再以此模型來預測未用來建模的那組樣本，稱為測試樣本(test

‧

𝑛𝑛時，此方法又稱為留一驗證(leave-one-out cross-validation)，也就是

Verweij & van Houwelingen (1993)

所提出的方法。為避免留一驗證過於龐大的計算量，本文採用𝐾𝐾折交叉驗證法（𝐾𝐾 < 𝑛𝑛），並 (Bayesian information criterion, BIC)來作為選取節點個數與階數的方法。這些準則評估了模型的複雜度並衡量模型擬合資料的優良性。當模型不具懲罰項時，兩

‧

Moody, Hanson, & Lippmann (1992)

為具懲罰項的模型提出修正的自由度，

AIC𝜆𝜆 = −2ℓ(𝛄𝛄�𝜆𝜆) + 2 trace�𝓵𝓵̈(𝛄𝛄�𝜆𝜆)𝓵𝓵̈pen−1 (𝛄𝛄�𝜆𝜆)� (3.33)

‧

值之外，節點將放置於25%、50%、75%的分位數上。

Sleeper & Harrington (1990)

的模擬發現，將節點放置於分位數上，與等距節點相比，在求算逆矩陣上會減少

對數偏概似函數是一個凹函數(concave function)，連續且在每一點皆二次可微分，

其一階與二階導函數分別為

‧

一個常用於解決最適問題的方法為牛頓法(Newton’s method)，其原理為將目標函數的一階導數以泰勒展開式(Taylor series)作近似，並於起始值𝛄𝛄�⁽⁰⁾展開，的方法——有限內存擬牛頓法(Limited-memory Broyden–Fletcher–Goldfarb–

Shanno, L-BFGS)，來解決最適問題。

L-BFGS 是擬牛頓法(quasi-Newton method)的衍生。擬牛頓法並不直接計算海森矩陣，而是利用每個步驟中的估計值與其對應的一階導函數來近似海森矩陣

（或是其逆矩陣）。若以𝛄𝛄�^(𝑠𝑠)表示疊代第𝑠𝑠次所得之估計值，並定義𝛅𝛅^(𝑠𝑠)與𝛑𝛑^(𝑠𝑠)如下，

𝛅𝛅^(𝑠𝑠) = 𝛄𝛄�^(𝑠𝑠+1)− 𝛄𝛄�^(𝑠𝑠) (3.42) 𝛑𝛑^(𝑠𝑠) = 𝓵𝓵̇pen�𝛄𝛄�^(𝑠𝑠+1)� − 𝓵𝓵̇pen�𝛄𝛄�^(𝑠𝑠)� (3.43) 那麼，在步驟𝑠𝑠 + 1的海森矩陣的估計便為下列線性方程組的解，

‧

底係數，因此在檢定連續共變量的顯著性時，須作聯合檢定(joint hypothesis testing)，也就是檢定一組基底係數是否為零；至於僅對應至一個係數的類別共變量則為個別檢定(individual hypothesis testing)。在比例危險模型當中，普遍使用的檢定統計量有三種型式：Wald 檢定量(Wald statistic)、概似比檢定量 (likelihood ratio statistic)，以及分數檢定量(score statistic)。Wald 檢定量是建立在最大偏概似估計值近似常態分配的性質之下，概似比檢定量是基於兩巢狀模型

在文檔中 LASSO迴歸在B-spline基底組成之危險函數上的應用 - 政大學術集成 (頁 16-22)

第二章 研究方法

第二節 模型估計

二、 Group lasso 方法

二、Group lasso 方法

‧

Yuan & Lin (2006)

Verweij & van Houwelingen (1993)

‧

Verweij & van Houwelingen (1993)

‧

Moody, Hanson, & Lippmann (1992)

‧

Sleeper & Harrington (1990)

‧

‧

第二章研究方法

第二節模型估計