數量分類學

第一章總論

Chapter 1. General introduction

1.4 數量分類學

由於傳統形態分類常受形態特徵的主觀認定及認定的先後順序，或僅以單一性狀進行鑑定，而影響到分類結果。十八世紀末，數量分類學（numerical taxonomy）

的基本概念和方法開始發展，從「定性」轉為「定量」的觀點，將生物性狀以數量化的方式描述，利用數據計算物種間相似度，以此為基礎進行分類，表明物種間親緣關係，但運算過程十分繁雜，在1950 年代因電腦發明才加速發展，使數量分類更為簡便而廣泛地使用（Jones and Luchsinger, 1987）。數量分類學並常配合形態、生化或分子標誌等特徵進行分析，參與分析的特徵愈多，分析結果愈客觀，

已廣泛應用於種原資源特性及物種歧異度的探討（徐, 1996）。

生物的性狀特徵包括數量性狀（quantitative traits）及質量性狀（qualitative traits），依性質不同具有不同的量化模式，分別是數值資料（quantitative data）、

分級資料（multistate data）及二元資料（binary data）（Dunn and Everitt, 1982）。

連續性變化的性狀，如葉片長、寬、厚度等為數值資料；不連續性變化性狀，如顏色、形狀等可以加以分級，經量化為分級資料，又如有無刺或有無茸毛，或是如RFLP、RAPD 分子標記條帶的有無等，以二元資料，加以記錄（徐, 1996; 翁, 2001）。

數量分類主要有兩類分類方法，分別是分群法（Clustering method）及排列法

（Ordination method）。分群法中的群集分析，主要是依分類單位（operational taxonomic units, OTUs）間相似或相異程度加以聚集而成樹狀圖，而排列法以主成份分析法（principal component analysis, PCA）較常用，係同時將多個性狀所得之數據資料，加以運算重組為主成份（Principal component），再藉由主成份分析結果，以少數主成份簡潔說明多種變量代表的意義，可知主成份與性狀特徵間的相關性，並可得知OTUs 在空間排列上的關係（翁, 2001）。

1.4.1 群集分析法

群集分析利用OTUs 間的相似程度進行分類，每個 OTU 所量測的性狀共有

n 個，假設每個性狀（變量, variable）為一維（dimension），則每個 OTU 可視為n 維空間中的某點。在 n 維座標中，以相異性（dissimilarity）或相似性

（similarity）判定 OTUs 間的遠近程度，相異性係以計算 n 維空間中兩個 OTUs 的距離，並視為相異係數，在此係數趨近於0 時表示此二 OTUs 相似程度愈高，

數值越大之則愈低；相似性則是計算兩個OTUs 的相關係數（correlation coefficient）或角餘弦係數（coefficient of cosine of included angle），若此係數趨近於1 時，表示此二 OTUs 相似程度愈高，反之則愈低。將所有 OTUs 兩兩之間依相異性或相似性係數組成一相關矩陣（correlation matrix），再以最短距離法（single linkage method）、最長距離法（compleate linkage method）、重心分群法（centroid method）、群平均分群法（group average method, 或稱 unweighted pair-group method with arithmetic mean, UPGMA）等分群方法，將相異性最小或相似性最大的OTUs 先合併為一新類群，再重新計算新的類群與其他 OTUs 之間新的相異係數或相似係數，如此反覆組合，形成一階級分群樹狀圖，亦稱為聚類樹狀圖（易, 1990; 徐, 1996; 翁, 2001），即可清楚瞭解物種間之相似性遠近及親緣關係。

1.4.2 主成份分析法

主成份分析為一多變量分析法（multivariate analysis）。理論上，變數間彼此存在相關性，且具有某種程度之重複訊息，故透過線性轉換等步驟將數據簡化，計算出主成份值。而主成份間相互獨立，可不致重複表達原始資料之特性，

並保留原有變數分佈特性下達到降低變數的維度，可以此少數主成份來分析結果，解釋變數間的關係（易, 1990; 徐, 1996）。

主成份分析時，亦將OTUs 所量測的 n 個性狀（變量）假設為一維，則每個OTU 可視為 n 維空間中的某點，將 n 維空間的各點投射至一條新軸線上，使每點至線的距離總和最小，使n 維空間中各點關係可藉由投射至一新軸線上，

便於瞭解OTUs 之間的關係，此一新軸線即為主成份。主成份即為原始變量之

線性組合，根據此數學理論，原始變量經運算重組得到主成份，所形成的主成份個數與原始變量的個數相等，在各主成分之中，第一主成份（first principal component, PC1）擁有最大變異值（variance）、最大的特徵值（eigenvalue）及最大的變異解釋能力（可解釋的變異量=特徵值/總變量數），第二主成份（PC2）

次之，依此類推（呂, 2005; 翁, 2001）。依據數學定義，各主成份間互相獨立

（covariance = 0），故彼此解釋變異量互不重疊，在空間上相互垂直（Dunn and Everitt, 1982）。而理想的主成份參考個數設立，可以參照特徵值對主成份數目作的陡坡圖（scree plot）中，所出現的肘點（由陡坡變為平坦時的轉折點）（Cattell, 1966），或以總變異解釋能力 60-80%以上為判斷依據（易, 1990）。

群集分析可將OTUs 明顯分群，主成份分析則可得知 OTUs 間的空間排列，兩者常相輔相成。群集分析法曾用於桑（白等人, 1997; Banerjee et al., 2007）。白等人（1997）利用此方法調查 34 個雌株或兩性株品種（系）的雌花、葉片及果實的形態性狀，並分出四群，第一群為白桑、第二群是魯桑、第三群則包含蒙桑及鬼桑，第四群為浙江農桑、櫻桃桑及火桑等，白等人認為雌花為重要的分類性狀，

葉片及果實則可輔助分類。Banerjee 等人(2007) 群集分析調查白桑（Morus alba）、

魯桑（Morus latifolia）及長果桑（Morus laevigata）的營養性狀，將其中 25 個品 種（系）分為十個不同的群集，並針對性狀間的相關性進行分析，挑選出葉片長及葉片面積等數個性狀，作為葉桑育種的選拔依據。此外，透過主成份分析可瞭解主成份與性狀間的關係，利於選拔有效代表性狀，利用，如在甘藍菜地理小種

（Dias et al., 1993）與香蕉（Osuji et al., 1997）等園藝作物之應用。

桑樹的數量分類研究分析過白桑、魯桑、長果桑，或其他地區之特有品種

（系），調查性狀則針對雌株或兩性株之雌花性狀，如花柱長、花穗長度等，或是葉用桑重要的經濟性狀，如葉重、葉長寬、枝條長、單枝條長等為主，較不著重於雄株、雌株及兩性株之間共有的植物學性狀。目前臺灣種原，特別是島桑、

臺灣桑及未鑑定桑等尚未研究，另外為克服雌雄異株之問題，將選擇有鑑別度且

適用不同株性的營養性狀，如葉尖、葉緣、葉片長寬、葉色、枝條顏色等植物學性狀，希望建立良好的分類系統。

在文檔中臺灣桑樹種原分析 (頁 18-21)

第一章 總論

Chapter 1. General introduction

1.4 數量分類學

第一章總論