PAST統計軟體於DNA分子標誌多樣性分析之應用
5
0
0
全文
(2) 二、PAST之功能簡介. PAST為PAlaeontological Statistics (古生物統計學)的縮寫,為挪威Oslo 大學自然歷史博物館之國家型專案計畫 所開發之資料分析軟體,最初應用於 古生物學研究,現今則廣泛應用於各領 域,內含常用統計、繪圖及模式化功 能,除此也涵蓋了一般統計套裝軟體所 沒有的生態學、形態學、生物多樣性 學、遺傳分類學、地理空間學、生物地 層學等特殊領域之統計方法。官方網站 (http://folk.uio.no/ohammer/past/)免費 提供下載程式、完整操作手冊、實例研 究、教學文件等。至2012年底PAST最新 版本為2.16版,可於windows XP、Vista 及Windows 7等作業系統下執行,該程式 檔案容量甚小僅4.1MB,可免安裝,只 要直接點選程式檔案,即可執行。. 三、利用PAST進行分子標誌資 料之樣本歸群的分析步驟說明 DNA分子標誌資料的處理流程,包 含:電泳圖譜條帶出現紀錄以0和1來編 碼登記;利用二元編碼資料,估算兩兩 樣本間的相似性係數;由相似性係數進 行集群分析與主軸分析,最後同時依據 集群分析所得樹狀圖及主軸分析所得序 列分佈圖,來判斷各樣本的群別歸屬。 茲以一套6個樣本8個條帶位置之已編碼 的分子標誌資料為例,說明使用PAST進 行統計分析的步驟如下: (一)電泳圖譜條帶出現紀錄的編碼輸入 PA S T 輸 入 資 料 的 工 作 表 類 似 於 EXCEL工作表,輸入格式如圖一所示, 行標題為樣本名稱(A、B…),欄標題 為條帶位置(如1、2…),行和欄兩者 不可顛倒。有關標題名稱之修改、資料. 生 物 統 計. 圖一、PAST的輸入資料視窗及格式。. 農業試驗所技術服務.2013年09月.95期. 09.
(3) 生 物 統 計. 10. 工作表之存檔與開啟等視窗基本操作功 能,可參考PAST使用手冊之詳細說明。 (二)指定分析的資料範圍 PAST要求在執行任何分析之前, 都必須先指定欲分析的資料範圍,如圖 二所示。若全選,點選輸入畫面上功能 選單的Edit之Select all;若部分選取,則 在Edit mode勾選(內設)下按住鍵盤的 shift鍵同時用滑鼠拉曳欲分析的部分資 料範圍。 (三)估算相似性係數並進行集群分析 點選功能選單上的Multivar之Cluster analysis,出現操作畫面如圖三-A所示, 於其右側上方Alogrithm(演算法)點 選Paired group (即UPGMA法,是DNA 分子標誌資料進行集群分析最常使用的 方法),然後再於下方Similarity measure (相似度測量)點選Jaccard(顯性標 誌適用)或Dice係數(共顯性標誌適 用),此時集群樹狀圖立即顯現在畫面 左側框內,於圖上點一下可進到圖形編 輯視窗執行簡單的圖形編輯,如修改XY 軸文字、選擇黑或藍色線條、加粗或不 加粗線條、改變字體(圖三-B);但只 提供一種方向的樹狀圖(由上往下),此圖 可另存成圖形檔。 (四)估算相似性係數並進行主軸分析 重新進行上述(二)步驟後,點 選功能選單上的Multivar之Principal coordinate,出現操作畫面如圖四所示, 首先於其右側上方Similarity measure(相 似度測量)點選Jaccard(顯性標誌適 用)或Dice係數(共顯性標誌適用), 再於下方Transformation exponent (轉 換指數值)中嘗試改變c值(PAST提供 c=1,2,4,6四種選項),檢視所估算出的特 性根(Eigenvalue)的貢獻率(Percent),選 擇其中擬合效果最好的情況,亦即使第 1軸和第2軸的累計貢獻率(解釋能力) 農業試驗所技術服務.2013年09月.95期. 最大,如本例調整到c=2時前兩軸的貢獻 率各為54.09%與34.38%,兩者累加值達 88.47%,此為四種轉換指數值中擬合效 果最好者,故採用此結果所繪製出的序 列分佈圖;然後,點選View scatter功能 鍵,可進入圖形瀏覽畫面內,勾選Row labels使圖中各點出現樣本代號,也可進 而點選View number使顯示圖中各點數值 (自由選項);最後於圖上點一下可進 行簡單的圖形編輯(畫面同圖三-B), 該圖亦可存檔或直接列印。但必須注 意,PAST只提供二維分佈圖。 (五)結果解讀 綜合集群樹狀圖(圖三-A,解釋能 力達88.47%)與序列分布圖(圖四)兩者結 果,發現樣本A和D為100%相似,其餘 樣本可與此兩樣本明顯區分開來;F和A 或(D)的相似度僅57%,而B和C相似度僅 50%,E和其他樣本之相似度不到20%。. 四、PAST在分子標誌資料分析 之另類運用 PA S T 的 優 點 是 免 費、操 作 簡 易、 功 能 完 整,且 執 行 程 式 檔 案 容 量 甚 小 免 安 裝,但 為使檔 案 容量 變小,也 相對 犧 牲了一些非屬必要的功 能,例如沒有 太 多 額 外 的 輸 入 選 項、輸 出 結 果 簡 單 明瞭、以及圖形編 輯 功 能仍顯 陽春(但 仍 較 N YST S為佳)等。因此,從 上 述可 知,PA S T應 用於 分 子標 誌 資 料之多樣 性 分析,仍 有些不足 之 處,如 集 群 分析 結 果 僅 提 供 單一方 向 的 樹 狀 圖,但 我 們 可 將 該 圖 另 存 新 檔 後,再 透 過 其 他 修圖軟體工具(如 Power p oi nt等)來 調 整圖的方向或 再 美化 加工;另 外,使用 PAST 執行主軸分析結果無 法 提 供三 維 序 列分 佈圖。基此,若 希望 輸出結果更 詳細且圖形編輯效果更佳,則可以只利 用PAST 求得的相似性係數作為輸入資.
(4) 料,再進到其他一般統計套裝軟體進行 後 續 的 集 群 分 析 和 主 軸 分 析(但 前 提 是 該 統 計 套 裝 軟 體,須 具 有 可 直 接 讀 取相似性係數的功能)。. 單純使用PAST求算相似性係數的步 驟很簡單,只要在前節所述之前兩個步 驟的輸入編碼資料並指定資料範圍後, 再點選功能選單上的Statistics之Similarity. 生 物 統 計. 圖二、PAST在執行任何分析之前須先指定欲分析的資料範圍。全選:Select all/Edit;部分選取:勾選 Edit mode下按住shift鍵,同時用滑鼠拉曳擬分析資料範圍。. (A). (B). 圖三、利用PAST估算相似性係數並進行集群分析的(A)操作畫面與執行步驟,及(B)圖形編輯與存檔。. 農業試驗所技術服務.2013年09月.95期. 11.
(5) 生 物 統 計. 圖四、利用PAST估算相似性係數並進行主軸分析的操作畫面與執行步驟。. 圖五、利用PAST只計算相似性係數的操作畫面與執行步驟。. and distance indices,出現操作畫面如圖 五所示,於其右側上方index(指標)點 選係數種類,即在左視窗框內產生一個 係數矩陣。該係數矩陣可直接利用複製 與貼上到其他統計軟體的輸入視窗內, 以進行後續的統計分析。 12. 農業試驗所技術服務.2013年09月.95期. 五、參考文獻 呂秀英、魏夢麗、呂椿棠。2008。 DNA分子標誌資料之遺傳變異的歸群分 析。技術服務73:25-27。.
(6)
相關文件
為促進勞動供需平衡、協助國民充分就業、充分運用人力資源,基於「就業服
為促進勞動供需平衡、協助國民充分就業、充分運用人力資源,基於「就業服
由於資料探勘 Apriori 演算法具有探勘資訊關聯性之特性,因此文具申請資 訊分析系統將所有文具申請之歷史資訊載入系統,利用
本研究將針對 TFT-LCD 產業研發單位主管與研發人員進行 探討,並就主管於研發人員對職能重視程度作差異性分析。因此
4.1 多因子變異數分析 多因子變異數分析 多因子變異數分析 多因子變異數分析與線性迴歸 與線性迴歸 與線性迴歸 與線性迴歸 4.1.1 統計軟體 統計軟體 統計軟體 統計軟體 SPSS 簡介 簡介
在軟體的使用方面,使用 Simulink 來進行。Simulink 是一種分析與模擬動態
本研究主要以 But-for 崩塌竣工時程分析技術為基礎進行理論推導,確認此延遲分析技術 計算邏輯之問題與完整性,之後提出修正之計算邏輯,使
電腦視覺的影像處理與分析在軟體部分,本研究分別使用美國微 軟公司所開發的 Visual C++ 6.0 以及美國 Matrox Imaging 公司所發展 出來的 Matrox Imaging Library 7.0。其中