因素分析法之模型及其求解過程

第二章研究方法

2.1 因素分析法之模型及其求解過程

考慮研究範圍內的股票市場有 n 支股票，每支股票有 p 個觀察變量，並將此 資料以 n 列 p 行之矩陣 X 表示：

X=

�𝓍11 ⋯ 𝓍𝑝1

⋮ ⋱ ⋮ 𝓍₁^𝑛 ⋯ 𝓍_𝑝^𝑛� = �

(𝐗¹)^𝐓 (𝐗²)^𝐓 (𝐗ⁿ⋮)^𝐓

�

其中 𝓍_𝑗^𝑖 代表第 i 支股票之第 j 個觀察變量值，i = 1,2,…n，j = 1,2,…p。

若對每個觀察變量求取這 n 支股票的平均值，則此 p 維之平均向量可表示為 一 p × 1 維的樣本均值向量：

𝐗� = � 𝓍1

𝓍��₂

��⋮ 𝓍_p

��

�

其中 𝑥� =𝚥 ¹_𝑛∑^𝑛_𝑖=1𝑥_𝑗^𝑖。而這 n 筆 p 維股票觀察變量的相關性結構，可以由其樣本共

其中 L 稱為負載矩陣（loading matrix）；F 稱為共同因子（common factor），它代 表 p 個股票觀察變量背後的 m 個潛在因子。此模型的實質意義為若第 j 個變數 xj

與此變數平均值𝓍� 的差異為𝑥ȷ 𝑗− 𝓍�，那麼此差異可被 Fȷ ¹, F₂, …, F_m潛在因子所解釋，

而每個潛在因子 Fi的解釋力以 lij表示。此外，𝓔為此線性模型的誤差向量。

因素分析法的關鍵有二：其一為估計潛在因子的個數，也就是 m 的數值；其

二為估計這些潛在因子如何影響𝑥_𝑗 − 𝓍�，也就是 l_ȷ ^ij的大小，並使得誤差向量的值越 小越好。在說明如何估計 L 之前，正交因子模型有如下假設：

Ε(𝐅)＝𝟎(m×1), Cov(𝐅) = 𝐈(m×m),

Ε(𝓔)＝𝟎_(p×1), Cov(𝓔) = 𝚿_(p×p) =

⎣⎢

⎢⎢

⎡ψ₁ 0

0 ψ₂ ⋯ 0

⋯ 0 0 0⋮ ⋮

⋱ ⋮

⋯ ψ_p⎦⎥⎥⎥⎤

亦即Ｆ的數值為隨機變數，它會隨著某特定股票 X^j而變動；L 則是定值，它是待 估計的系統參數。為了更方便地估計 L，考慮如下運算：

(𝐗 − 𝐗�)(𝐗 − 𝐗�)^Ｔ= �𝐋 𝐅 ＋𝓔��𝐋 𝐅 ＋𝓔�^Ｔ

= �𝐋 𝐅 ＋𝓔� �(𝐋 𝐅)^Ｔ+ 𝓔^Ｔ� = (𝐋 𝐅)(𝐋 𝐅)^Ｔ+ 𝓔(𝐋 𝐅)^Ｔ+ 𝐋 𝐅𝓔^Ｔ+ 𝓔𝓔^Ｔ

若對等號左側取期望值，則可發現Ε(𝐗 − 𝐗�)(𝐗 − 𝐗�)^Ｔ即為這 n 支 p 維觀察變量之股 票的母體共變異矩陣，且它能以樣本共變異矩陣 S 來估計，亦即

𝐒 = Cov(𝐗) = Ε(𝐗 − 𝐗�)(𝐗 − 𝐗�)^Ｔ

= 𝐋Ε �𝐅𝐅^Ｔ� 𝐋^Ｔ+ Ε �𝓔𝐅^Ｔ� 𝐋^Ｔ+ 𝐋Ε �𝐅𝓔^Ｔ� + Ε �𝓔𝓔^Ｔ�

若代入正交因子模型之假設，可推得

𝐒 = 𝐋𝐈𝐋^Ｔ+ 𝟎𝐋^Ｔ+ 𝐋𝟎 + 𝚿

= 𝐋𝐋^Ｔ+ 𝚿 (2)

因此，若要估計 L 的數值，可將原始資料之樣本共變異矩陣分解為一 p × m 之矩陣與其轉置矩陣相乘，再加上一對角矩陣𝚿。目前已發表之文獻裡，最常使用 的 L 估計方法有主成分因素分析法（principal component factor analysis）以及最大 概似估計法（maximum likelihood estimation），兩種方法常可得到一致之 L 估計。

本研究使用主成分因素分析法來得到 L 的估計值。

若再進一步觀察可知 S 必為一對稱矩陣，因此，S 可以被頻譜分解（spectral decomposition），進而得到特徵值－單位特徵向量對�𝜆_𝑖，𝐞_i�，i = 1, 2,..., p。其中 𝜆₁ ≥ 𝜆₂ ≥ ⋯ ≥ 𝜆_𝑝，|𝐞_i| = 1，則

𝐒 = 𝜆1𝐞1𝐞1T+ 𝜆2𝐞2𝐞2T+ ⋯ + 𝜆𝑝𝐞p𝐞pT

= ��𝜆1𝐞1 �𝜆₂𝐞₂ ⋯ �𝜆𝑝𝐞_p�

⎣⎢

⎢⎢

⎢⎡�𝜆¹𝐞₁^T

�𝜆2𝐞2T

⋮

�λp𝐞pT

⎦⎥

⎥⎥

⎥⎤

亦即 S 可被拆解為一矩陣 L 乘上它的轉置矩陣，恰好能滿足(2)的條件。只是此時

L 的維度為 p × p，亦即潛在因子的數目與股票觀察變量的個數相同；這麼多的潛

在因子使得因素分析法缺乏解釋意義與實用價值。

既然將 S 做頻譜分解時已將 S 的特徵值由大到小排列，通常這 p 個特徵值間 大小相差極為劇烈，若將較小的 p – m 個特徵值捨去，根據主成分分析（principal component analysis）的性質，S 能夠被精確地近似為：

𝐒 ≃ 𝐋𝐋^Ｔ+ 𝚿 correlation matrix）來表示，亦即：

𝐑 =

𝜆₁+ 𝜆₂+ ⋯ + 𝜆_𝑚 𝑝

𝐋̂的列向量之負載值𝑙̂₁₁, 𝑙̂₂₁,…, 𝑙̂_𝑝1指出第 i 個潛在因子如何影響這 p 個股票觀察變量。這些負載的相對大小及性質符號也透露了表面變數的群性；若負載之絕對值越大，代表這個潛在因子越能解釋這些對應的股票觀察變量，而這些股票觀察變量的相關性也越有可能是由這個本質上的潛在因子所引起。然而，因素分析法希望更進一步強化潛在因子解釋性的效力，亦即它希望透過特殊作法，使得同個潛在因子的負載值一部分趨向極端大，另一部分則趨向極端小，進而提升股票觀察變量的群性解析度。這個特殊作法稱為「因子旋轉」（factor rotation）。

之所以稱為因子「旋轉」，這是因為在(2)的模型裡，若將 L 乘上一正交矩陣 Q，

即𝐋̂^∗ = 𝐋̂𝐐，則(2)之等式依然成立：

𝐒 = 𝐋̂𝐋̂^Ｔ+ 𝚿

= 𝐋̂(𝐐𝐐^𝐓)𝐋̂^Ｔ+ 𝚿 = �𝐋̂𝐐��𝐋̂𝐐�^𝐓+ 𝚿

= 𝐋̂^∗𝐋̂^∗T+ 𝚿

而 Q 的幾何意義即為對原矩陣𝐋̂作旋選或映射。因此，若能妥善地選取 Q，並將它 作用於主成分因素分析法求解出來的𝐋̂上，那麼𝐋̂就能被旋轉至群性解析度更高的方向。常見的因子旋轉方法有變異最大旋轉法（varimax rotation）、四方最大旋轉

（quartimax rotation )、相等最大值法（equimax rotation）等方式；本研究使用變異最大旋轉法。此方法透過數值方法找出 V 的最大值：

V = 1

𝑝 � ��𝑑^𝑖𝑗² − 𝑑̅_𝑗�²

p i=1

�

m j=1

𝑑𝑖𝑗 = 𝑙̂𝑖𝑗

�𝑙̂_i1² + 𝑙̂_i2² + ⋯ + 𝑙̂_im²

, 𝑑̅𝑗 = � 𝑑_𝑖𝑗²

p j=1

而使 V 最大時所對應的 d_ij即為對應的新負載值，亦即𝑙_𝑖𝑗^∗。當 V 最大時，這些新負載值將遠離它們的平均值𝑑̅_𝑗，因此𝑙_𝑖𝑗^∗將一部分趨近於 1，而另一部分趨近於 0；換言之，同一個潛在因子能解釋的表面變數將會更專精，模型的解釋力也將更強化。

至此，p 個股票觀察變量的相關結構已能用統計模型求出背後的 m 個潛在因 子；這些潛在因子由本質著手，各自解釋某特定群股票觀察變量的變化。然而，

實務上最關鍵的問題並非以何種方法來估計負載矩陣，或是以何種操作來進行因 子旋轉，而是如何選取 m 的數字大小，以及如何確認這 m 個潛在因子確實能各司 其職地解釋對應的表面變數。傳統上，若以主成分因素分析法求得的因子模型，

最常被用來估計 m 的數字大小的方式有兩種。第一種是定性觀察陡坡圖（scree plot）

的變化程度。陡坡圖為特徵值大小𝜆_𝑖對 i 的作圖；此方法指出陡坡圖最劇烈的轉折 處所對應的 i 即為潛在因子的數目 m。第二種是 Kaiser 準則。若(2)中被分析的股 票變量相關結構為相關矩陣 R，那麼 Kaiser 準則指出潛在因子的個數即為特徵值 大於 1（𝜆𝑖 > 1）的特徵值數目。

然而，若以這兩種傳統方式估計 m 的大小，雖能確認潛在因子的數目多寡，

但卻無法證實這 m 個潛在因子確實能解釋模型中各自對應之股票觀察變量；換言 之，傳統方式無法同時告訴研究者因子旋轉的正確性及潛在因子的最佳估計數目。

因此，本研究使用聚類分析（cluster Analysis）來驗證因素分析法之求解結果，更 嚴謹地確認這 m 個潛在因子確實能解釋 p 個股票觀察變量的相關性結構。

2.2 因素分析法之佐證－聚類分析

聚類分析的目的為將 n 列 p 行之資料矩陣 X 依其距離遠近或相關程度分成 m 組，組內成員盡可能地相似，組間群簇則盡可能地遠離。聚類分析的特點為此方

法可以對 n 支股票來操作，將表現相近的數支股票分為同一群組，也可對 p 個股 票觀察變量來分群，將相關程度較高地股票變量視為相同組別。本研究採用後者，

利用聚類分析的演算法將 p 個股票觀察變量分為 m 組，這 m 組之內的變數彼此高 度相關，並推測他們受制於同一個潛在因子，作為因素分析法之佐證。以下為本論文所使用的聚類分析演算法之說明。

使用聚類分析的先決條件為必須先定義物件的「距離」或「相似程度」，演算 法才能根據這些指標將物件分類。當 p 個股票觀察變量作為分類的物件時，最常 使用的「相似程度」指標即這些變數間的相關係數；當兩變量的相關係數趨近於 1，

代表它們很可能屬於同一群組，而當相關係數趨近於 0，則代表這兩個變量很可能並非源於同一潛在因子所影響。在接下來的演算法裡，本研究使用相關係數作為相似度的度量單位。

聚類分析的演算法可分為分層法（hierarchical clustering method）以及非分層法（non-hierarchical clustering method）兩種。其中非分層法最常使用的方式為 K 組平均法（K-means method），但 K 組平均法的演算流程不適合對 p 個變數來分組；

它較適合將 n 支股票分為 g 個群組，而這並非本研究之目的。因此，本研究使用 分層法中的凝聚分層法（agglomerative hierarchical clustering method）作為分組之演算法。

凝聚分層法在演算法開始時將 p 個股票觀察變量視為獨立的 p 個群組。接著 演算法找出這 p 組變數間相關係數最大的兩個變數，並將它合併為新的群組 Ci；一旦新的群組出現，相關矩陣將進行更新，其他變數（或稱為群組）C_j到這個新群組間的距離，可利用完全連結法（complete linkage method）定義為

r = min�C_i, C_j�

換言之，更新後的群組相關係數被定義為兩群組間所有變數的相關係數裡最差的

那一個。此過程反覆執行，不斷地將相關係數最大的兩群組合併，直到所有變數都被合併為同一群，演算法才會停止。最終演算法將匯出一樹狀圖（dendrogram）

作為研究者判斷組數的依據。當研究者確定了能容許的最差相關係數之後，只需從樹狀圖擷取此最差相關係數之剖面，就能輕易判斷這些股票觀察變量被分組的組數以及各組成員。

特別說明的是，本研究之所以使用完全連結法來定義群組間的相似程度，是因為完全連結法傾向導致較多的組數，而這些群組內部高度相關，高度集中。這正好和因素分析法的目的相同；因素分析法找到一群表面彼此相關、共同反應、

甚至彼此交絡的股票觀察變量，而正因為這些表面變數高度集中且高度相關，研究者才有信心論證這些變數確實被同一個潛在因子所主導。反之，若使用單一連結法（single linkage method）作為群組間距的定義，那麼群組間的相似度定義將採用最佳的相關係數，亦即

r = max�C_i, C_j�

此時演算法只考慮最佳情形就將群組合併，最終將產生較少的組數，可是組內成員的變異較大、成員數較多，然而因素分析法的目的是找出股票變量背後的潛在因子，並使這些潛在因子能解釋一群高度相關的股票變量，如此一來，才有充分的證據來推論這個潛在因子為這些股票變量的可能成因。因此，使用單一連結法來做為因素分析法的佐證並不恰當。至於其他的群組間距定義法如平均連結法

（average linkage method）、沃德法（Ward's method）經實際驗證後，本研究發現他們的表現亦不如完全連結法，而這些方法的背後動機亦不如完全連結法般地與因素分析之目的契合。因此，本研究使用完全連結法來定義組間之相似程度。

最後，若聚類分析找到的組數與因素分析法所確認之潛在因子數相同，且被

分為同一聚類的股票變量也與因素分析法之潛在因子所能解釋的股票觀察變量如出一轍，那麼本研究將更有信心這些潛在因子確實是特定股票觀察變量的成因。

也只有當掌握了這些潛在因子，並詳加分析、比較、推論它們在放空限制前後各自的效果差異，那麼研究者才能更本質地論述放空限制之必要性，而不會只是從

在文檔中以因素分析法探討放空限制對股市之影響 (頁 26-0)

第二章 研究方法

2.1 因素分析法之模型及其求解過程

X=

L 的維度為 p × p，亦即潛在因子的數目與股票觀察變量的個數相同；這麼多的潛

第二章研究方法