• 沒有找到結果。

數量分類學

在文檔中 臺灣桑樹種原分析 (頁 18-21)

第一章 總論

Chapter 1. General introduction

1.4 數量分類學

由於傳統形態分類常受形態特徵的主觀認定及認定的先後順序,或僅以單一 性狀進行鑑定,而影響到分類結果。十八世紀末,數量分類學(numerical taxonomy)

的基本概念和方法開始發展,從「定性」轉為「定量」的觀點,將生物性狀以數 量化的方式描述,利用數據計算物種間相似度,以此為基礎進行分類,表明物種 間親緣關係,但運算過程十分繁雜,在1950 年代因電腦發明才加速發展,使數量 分類更為簡便而廣泛地使用(Jones and Luchsinger, 1987)。數量分類學並常配合 形態、生化或分子標誌等特徵進行分析,參與分析的特徵愈多,分析結果愈客觀,

已廣泛應用於種原資源特性及物種歧異度的探討(徐, 1996)。

生物的性狀特徵包括數量性狀(quantitative traits)及質量性狀(qualitative traits),依性質不同具有不同的量化模式,分別是數值資料(quantitative data)、

分級資料(multistate data)及二元資料(binary data)(Dunn and Everitt, 1982)。

連續性變化的性狀,如葉片長、寬、厚度等為數值資料;不連續性變化性狀,如 顏色、形狀等可以加以分級,經量化為分級資料,又如有無刺或有無茸毛,或是 如RFLP、RAPD 分子標記條帶的有無等,以二元資料,加以記錄(徐, 1996; 翁, 2001)。

數量分類主要有兩類分類方法,分別是分群法(Clustering method)及排列法

(Ordination method)。分群法中的群集分析,主要是依分類單位(operational taxonomic units, OTUs)間相似或相異程度加以聚集而成樹狀圖,而排列法以主成 份分析法(principal component analysis, PCA)較常用,係同時將多個性狀所得之 數據資料,加以運算重組為主成份(Principal component),再藉由主成份分析結 果,以少數主成份簡潔說明多種變量代表的意義,可知主成份與性狀特徵間的相 關性,並可得知OTUs 在空間排列上的關係(翁, 2001)。

1.4.1 群集分析法

群集分析利用OTUs 間的相似程度進行分類,每個 OTU 所量測的性狀共有

n 個,假設每個性狀(變量, variable)為一維(dimension),則每個 OTU 可視 為n 維空間中的某點。在 n 維座標中,以相異性(dissimilarity)或相似性

(similarity)判定 OTUs 間的遠近程度,相異性係以計算 n 維空間中兩個 OTUs 的距離,並視為相異係數,在此係數趨近於0 時表示此二 OTUs 相似程度愈高,

數值越大之則愈低;相似性則是計算兩個OTUs 的相關係數(correlation coefficient)或角餘弦係數(coefficient of cosine of included angle),若此係數 趨近於1 時,表示此二 OTUs 相似程度愈高,反之則愈低。將所有 OTUs 兩兩 之間依相異性或相似性係數組成一相關矩陣(correlation matrix),再以最短距 離法(single linkage method)、最長距離法(compleate linkage method)、重心 分群法(centroid method)、群平均分群法(group average method, 或稱 unweighted pair-group method with arithmetic mean, UPGMA)等分群方法,將相異性最小或 相似性最大的OTUs 先合併為一新類群,再重新計算新的類群與其他 OTUs 之 間新的相異係數或相似係數,如此反覆組合,形成一階級分群樹狀圖,亦稱為 聚類樹狀圖(易, 1990; 徐, 1996; 翁, 2001),即可清楚瞭解物種間之相似性遠 近及親緣關係。

1.4.2 主成份分析法

主成份分析為一多變量分析法(multivariate analysis)。理論上,變數間彼 此存在相關性,且具有某種程度之重複訊息,故透過線性轉換等步驟將數據簡 化,計算出主成份值。而主成份間相互獨立,可不致重複表達原始資料之特性,

並保留原有變數分佈特性下達到降低變數的維度,可以此少數主成份來分析結 果,解釋變數間的關係(易, 1990; 徐, 1996)。

主成份分析時,亦將OTUs 所量測的 n 個性狀(變量)假設為一維,則每 個OTU 可視為 n 維空間中的某點,將 n 維空間的各點投射至一條新軸線上,使 每點至線的距離總和最小,使n 維空間中各點關係可藉由投射至一新軸線上,

便於瞭解OTUs 之間的關係,此一新軸線即為主成份。主成份即為原始變量之

線性組合,根據此數學理論,原始變量經運算重組得到主成份,所形成的主成 份個數與原始變量的個數相等,在各主成分之中,第一主成份(first principal component, PC1)擁有最大變異值(variance)、最大的特徵值(eigenvalue)及 最大的變異解釋能力(可解釋的變異量=特徵值/總變量數),第二主成份(PC2)

次之,依此類推(呂, 2005; 翁, 2001)。依據數學定義,各主成份間互相獨立

(covariance = 0),故彼此解釋變異量互不重疊,在空間上相互垂直(Dunn and Everitt, 1982)。而理想的主成份參考個數設立,可以參照特徵值對主成份數目 作的陡坡圖(scree plot)中,所出現的肘點(由陡坡變為平坦時的轉折點)(Cattell, 1966),或以總變異解釋能力 60-80%以上為判斷依據(易, 1990)。

群集分析可將OTUs 明顯分群,主成份分析則可得知 OTUs 間的空間排列,兩 者常相輔相成。群集分析法曾用於桑(白等人, 1997; Banerjee et al., 2007)。白等 人(1997)利用此方法調查 34 個雌株或兩性株品種(系)的雌花、葉片及果實的 形態性狀,並分出四群,第一群為白桑、第二群是魯桑、第三群則包含蒙桑及鬼 桑,第四群為浙江農桑、櫻桃桑及火桑等,白等人認為雌花為重要的分類性狀,

葉片及果實則可輔助分類。Banerjee 等人(2007) 群集分析調查白桑(Morus alba)、

魯桑(Morus latifolia)及長果桑(Morus laevigata)的營養性狀,將其中 25 個品 種(系)分為十個不同的群集,並針對性狀間的相關性進行分析,挑選出葉片長 及葉片面積等數個性狀,作為葉桑育種的選拔依據。此外,透過主成份分析可瞭 解主成份與性狀間的關係,利於選拔有效代表性狀,利用,如在甘藍菜地理小種

(Dias et al., 1993)與香蕉(Osuji et al., 1997)等園藝作物之應用。

桑樹的數量分類研究分析過白桑、魯桑、長果桑,或其他地區之特有品種

(系),調查性狀則針對雌株或兩性株之雌花性狀,如花柱長、花穗長度等,或 是葉用桑重要的經濟性狀,如葉重、葉長寬、枝條長、單枝條長等為主,較不著 重於雄株、雌株及兩性株之間共有的植物學性狀。目前臺灣種原,特別是島桑、

臺灣桑及未鑑定桑等尚未研究,另外為克服雌雄異株之問題,將選擇有鑑別度且

適用不同株性的營養性狀,如葉尖、葉緣、葉片長寬、葉色、枝條顏色等植物學 性狀,希望建立良好的分類系統。

在文檔中 臺灣桑樹種原分析 (頁 18-21)

相關文件