• 沒有找到結果。

第二章 文獻探討

第二節 類別學習的分析工具

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

6

激所屬類別,但 Nosofsky 、Palmeri 與 McKinley(1994)的 RULEX 模型則認為人分 類是以規則為標準,並將不符合規則的刺激記下以方便分類。結果發現,RULEX 實驗似乎更貼切於後者,即便如此,Nosofsky 等人的 RULEX 模型依然無法解釋 使用相似性判斷規則的類別,但我們卻可以依此推論出,在此一多向度的二元類 別結構下,有兩種主要的分類類別,即使用規則加例外進行分類的組別與使用相 似性判斷進行分類的組別,此為本研究的重要發現之一。

第二節 類別學習的分析工具

根據上述,在過去研究的早期,雖然已經開始瞭解個別差異的影響與重要性,

並有各種理論的表徵型態,但這些研究多半仍停留在現象說明的層次上,大多都 是針對類別表徵的各種型態進行討論,對於分類策略的討論,則幾乎沒有深入的 探討。如RULEX實驗,Nosofsky等人只能說明在真實情境當中,受試者使用規則 加例外此一分類規則進行分類的人在人數比例上相較於使用相似性判斷當作分 類規則進行分類的人要來的多,卻無法說明主要有哪些規則。可以想像之所以會 如此,主要原因有二:一為缺少合適的統計分析工具,在分類學習的作業當中,

缺少有效的分類工具,可以對於龐雜的資料進行分類,更不用說適用在後續更深 層次的分析當中;二為缺少適切的實驗設計,以過去研究為例,分類學習一直到 Yang和Lewandowsky(2003, 2004)運用知識分化現象進行分類研究後,才較有機會 以實驗手法找出不同分類策略的族群,但這似乎也僅止於針對知識分化現象的存 有與否的探討上。是否他們研究所展現出來的分類策略的個別差異,僅在於知識 分化之有無?其實不然,只是過去研究未更深入探討或受限於分析工具的制約。

在類別學習的分析方法當中,尤其是對於分類學習所使用策略的分類而言,

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

7

可以有三種方法是可以滿足我們對於分類的需求,分別為階層式聚類法

(hierarchical clustering techniques)、K-Means聚類法與潛在剖面分析(latent profile analysis)。在過去研究當中,最常使用的方法為階層式聚類法與K-Means聚類法。

然而,這兩種方法皆存在著許多的不穩定與問題。所以本研究試圖使用潛在剖面 分析來進行分類的分析,並與其他兩種方法相比較,特別是在心理學領域上的應 用,潛在剖面分析的價值與運用也將會越來越重要。以下則簡單的分別介紹三種 在分類作業當中主要的統計分析方法。

階層式聚類法(hierarchical clustering techniques)

階層性聚合技術可以細分為聚合法(Agglomerative Algorithm)與分裂法

(Divisive Algorithm)二種。聚合法是先將每一筆資料視為一個群聚,然後每次將特 性最相近的二個群聚合而為一,直到群聚數目達到事先所設定的數目為止。而分 裂法是先把整個資料集合看成一個群聚,然後逐次分裂,每次都會在其中一個群 聚裡,切割相似度最低的連結,成為二個較小的群聚,直到群聚數目達到事先所 設定的數目為止。以此類方法所產生的分群結果可以是一個樹狀圖的形態,其較 鄰近的節點就是較相似的資料,且群聚合併與分裂的過程也能表現出來。

一般應用階層式分群演算法時,較常使用聚合法,而其群聚距離的評估方式 有四種,第一種是重心連結聚合演算法(Centroid-linkage Agglomerative Algorithm), 如公式(1)所示,計算式中的C代表群聚,mi 代表群聚Ci的重心,其評估方式為二 個群聚重心的間距。第二種是平均連結聚合演算法(Average-linkage Agglomerative Algorithm),如公式(2)所示,計算式中的x與x'分別代表二個群聚內的資料點,

其評估方式為二個群聚間,資料點與資料點的距離總和之平均。第三種是完整連 結聚合演算法(Complete-linkage Agglomerative Algorithm),如公式(3)所示,其評

法( Single-linkage Agglomerative Algorithm),如公式(4)所示,其評估方式為不 同群聚中,最接近的兩個資料點之距離。

法以群聚的重心作為群聚的代表點(Representative Objects),所以群聚結果很容 易被雜訊(Noises)或是離群值(Outliers)所影響,而且無法辨識出非凸邊形的

潛在剖面分析技術(Latent Profile Analysis)

首先,潛在剖面分析技術是一個有限的混合模型(Finite Mixture Model),一 般認為是由Lazarsfeld與Henry(1968)所提出,潛在剖面分析不同於傳統類別分 析的地方在於,它並不像K-Means聚類法與階層式聚類法一開始就要決定組別數 目,而是取決於不同的組數數目時誰有最佳的適合度統計量,且每一組的特徵值 也是在分析過後才知道的。潛在剖面分析適用於當觀察變項為連續變項時,且潛

種方法皆依靠距離矩陣(distance matrix)去發現群聚結果,階層式聚類法是在每 一個步驟都在矩陣中找新的距離,而K-Means聚類法則是不斷去的嘗試起始點,

潛在剖面分析則是使用分配假設去找到組別,潛在剖面分析的分配假設提供了測 量的距離。潛在剖面分析的分配假設為多變量常態分配(Multivariate normal distribution),它是由許多單變量的常態分配所組成,其函式如下所示,其中μ是 平均向量,Σ是共變數矩陣,充分的(Well-known)常態分配在多變量上稱之為

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

11

最後,在組別的解釋部分,分析完後研究者需要去檢驗每一個項目的機率以 得到每一組的特徵值,以去命名與解釋;而一個簡單的方法則是去看每一個變項 的條形圖。本研究則是使用M-Plus進行潛在剖面分析。