用Excel解決農業研究資料統計分析的方法(三)-χ2檢定
4
0
0
全文
(2) 生 物 統 計. 計算。但現在電腦當作計算工具,相當快 捷且正確,其實未必一定得使用簡式,直 接採用原始公式即可。 對於χ2檢定,Execl並未提供如同敘 述統計量、F和t檢定一樣之使用「工具」 中的「資料分析」(技術服務季刊64期), 但提供以原始公式為基礎的CHITEST函 數,可直接算出χ 2檢定的右尾機率值, 來進行實測值與理論值(期望值)間差異的 顯著性比較。只要活用此函數,就能應付 χ 2檢定在計數值的所有不同應用場合, 不過要特別注意χ 2檢定在不同應用場合 中的自由度算法不盡相同,此將在以下各 節中配合實例再加以說明。. 三、χ 2 檢定之求算步驟及結果 解讀:適合度檢定 假設象牙色與紅色金魚草雜交之F2後 代所得各種顏色的株數為紅色:粉紅色:象 牙色=20:55:25,欲探討其遺傳分離比是 否符合1:2:1之擬說,則利用CHITEST函 數的分析步驟如下:. 1. 首先根據擬說,將各組的期望值計算 出來:適合度檢定的期望值求算方 法,為總計乘以各組所佔比例。如本 例總計=100,故三種顏色的期望值 分別是25:50:25 (即紅色期望值 1. =100×(1+2+1),其他兩組同理類推)。 2. 將實測值和期望值以類似於兩向關連 表的型態輸入到Excel工作表中:由於 CHITEST函數對於自由度的計算, 是採用兩向關連表形式的計算方式: (r-1)(c-1),r為行數,c為欄數;因此 資料輸入的格式務必遵守此原則,否 則Excel內部在計算自由度時會出錯, 進而造成檢定結果錯誤。如本例將實 測值和期望值分置於不同欄位,各欄 內逐行輸入各組顏色的資料,如圖一 所示,此時雖然實測值(期望值)的欄 數只有一行,但我們發現Excel不會讓 (c-1)=(1-1)=0的情況發生,它自動將 自由度計算成(3-1)=2,此與適合度檢 定的實際自由度為(組數-1)=(3-1)=2 是一致的。. 2. 表一、χ 檢定的四種不同應用場合之區分說明 原始公式. 應用場合. 意 義. 計量值. 變方檢定 (test of variance). 樣本變方(s2)與一個已知族 群變方(σ2)之比較. n-1. 計數值. 適合度檢定 (test for goodness of fit). 實測頻度(O)分布與理論頻 度(E)分布(分布型態未定) 是否一致(符合)的檢定. k-1 或k-s-1. 計數值. 關連表檢定 (test of assouation table). 即獨立性檢定,測驗A、 B二因子間是否有關連, 又稱列聯表檢定(test of contingency table). (r-1)(c-1). 計數值. 純度檢定 (test of homogeneity). 計數資料的試驗,如取k個 樣本,該等樣本是否純質. k-1. z n: 觀測值個數; k: 組數; s: 已知分布介量數,如常態分布 s=2; r,c: 關連表的行及欄數。. 24. 自由度z. 資料形式. 農業試驗所技術服務. 2 006年06月.第66期.
(3) 址,2為本例自由度,由此算出相對於 機率值0.4724的χ2實測值=1.5;倘欲 得知在0.05顯著水準下自由度等於2的 χ2臨界值,同樣利用這個函數,但寫 成=CHIINV(0.05,2)。χ2檢定是否顯 著,可比較χ 2 實測值是否大於χ 2 臨 界值,也可直接查看其χ2實測值的機 率值是否小於0.05,兩者擇一即可, 因此這些再利用CHIINV函數的步驟 其實可省略,但考量在發表報告時, 或許作者希望也能將χ2實測值和臨界 值一起列出以供參考,故本文在此特 別補充介紹。. 生 物 統 計. 3. 然後於空白單格內插入CHITEST函 數:其格式為CHITEST(Actual_ range,Expected_range),括號內的 Actual_range指定實測值的範圍位 址,而Expected_range指定期望值的 範圍位址。如本例=CHITEST(B3: B5,C3:C5)。必須注意的是, CHITEST函數給出的是χ 2統計值的 單尾機率值(計數值之χ 2 檢定一律為 單尾測驗,因對立擬說是不符合,無 所謂誰大誰小),而非χ 2 統計值,因 此只要檢視該機率值是否小於顯著水 準0.05:倘小於0.05,即棄卻虛無擬 說,表示顯著不符合假設的分離比; 否則大於0.05,表示符合假設的分離 比。如本例的機率值0.4724>0.05, 故符合1:2:1分離比 (圖一)。 4. 上述步驟即已完成χ 2 檢定,但若欲 進一步得到χ 2 統計量的實測值和臨 界值,則可再利用CHIINV函數: 其格式為CHIINV(probability,deg rees_freedom),括號內probability 指定機率值或其範圍位址,而 degrees_freedom輸入自由度。如本 例=CHIINV(D8,2),D8為前步驟由 CHITEST函數所得機率值的所在位. 四、χ 2 檢定之求算步驟及結果解 讀:關連表檢定. 假設一農藥防治試驗,欲檢定兩種 農藥的防病效果有無差別,而調查試驗 田間的罹病和正常株數,如圖二之實測 值。這是一個2×2關連表檢定,虛無擬 說為農藥與防病效果二因子間無關連。 2×2關連表檢定是r×c關連表中最簡單 的一種,其原理完全一樣的,自由度為 (r-1)(c-1)。本文僅以2×2關連表檢定為 例說明,但所描述的計算方式完全可推至 r, c大於2以上的關連表。 關 連 表 的 χ 2檢 定 利 用 CHITEST函數的操作步驟與前 述之適合度檢定相同,但因此 處沒有已知的理論比例或分離 比,故必須自己推估。由於關 連表中各單格內理論值與邊界 總計呈正比的既定關係,因此 各單格內的理論值即等於其實 測值所相對應的邊際和之乘積 再除以總計。以本例而言,” 甲”農藥之病株的理論值=313 ×47/564=26.08,”乙” 農藥之病株=251×47/564= 圖一、用Excel函數進行χ2檢定-適合度檢定:以象牙色與紅色金魚草 20.92,其他單格的理論值同理 雜交之F 後代是否符合1:2:1遺傳分離比為例說明。 2. 農業試驗所技術服務. 2 006年06月.第66期. 25.
(4) 生 物 統 計. 類推。所推估的理論值和實測值,仍須維 持兩向關連表資料形式輸入於工作表中。 本例以CHITEST函數所得χ 2 檢定的機. 率值等於0.3707>0.05,無法棄卻虛無擬 說,表示農藥與防病效果間無顯著關連, 即兩種農藥的防病效果無顯著差異。另 外,可進而利用CHIINV函數反求 該機率值下的χ 2實測值和臨界值 (圖二),此處該函數內所指定的自 由度為(2-1)(2-1)=1。. 五、χ 2 檢定之求算步驟及 結果解讀:純度檢定. 圖二、用Excel函數進行χ2檢定-關連表檢定:以檢定兩種農藥 的防病效果有無差別為例說明。. 圖三、用Excel函數進行χ2檢定-純度檢定:以檢定四個 甘藍菜試區內所發現的尺蠖數之分布是否隨機為例說明。. 26. 農業試驗所技術服務. 2 006年06月.第66期. 假設一個蟲害調查試驗,從 四個甘藍菜試區發現尺蠖數各為 11,4,4,5,欲探討尺蠖之分布是否 隨機?此例的虛無擬說為隨機假 設,故四個試區的理論值應該具 等比例關係,即四個試區的理論 值各為6,6,6,6(總計24/4=6)。然 後將實測值和理論值並排輸入, 以維持兩向關連表形式,如圖三 所示,以避免CHITEST在求機 率值過程中計算自由度時產生錯 誤,但此時實測值(期望值)的欄 數雖只有一行,Excel並不會讓 (c-1)=(1-1)=0的情況發生,而自 動將自由度計算成(4-1)=3,此與 純度檢定的實際自由度等於(組數 -1)=(4-1)=3是一致的。至於使用 CHITEST函數的操作步驟與前述 均相同,本例χ 2檢定的機率值等 於0.1290>0.05,表示無法棄卻虛 無擬說,即這四個試區的尺蠖發 生呈隨機分布。至此,χ 2檢定已 經完成,但可進而利用CHIINV函 數反求該機率值下的χ 2實測值及 其臨界值(圖三)。.
(5)
相關文件
推理論證 批判思辨 探究能力-問題解決 分析與發現 4-3 分析文本、數據等資料以解決問題 探究能力-問題解決 分析與發現 4-4
在選擇合 適的策略 解決 數學問題 時,能與 別人溝通 、磋商及 作出 協調(例 如在解決 幾何問題 時在演繹 法或 分析法之 間進行選 擇,以及 與小組成 員商 討統計研
主觀機率 指一個事件發生的機率由某 人決定,包括設計上的安排 設定,或者根據相信的程度 而猜測。.. 古典機率 假設樣本空間S中的每一個
在選擇合 適的策略 解決 數學問題 時,能與 別人溝通 、磋商及 作出 協調(例 如在解決 幾何問題 時在演繹 法或 分析法之 間進行選 擇,以及 與小組成 員商 討統計研
• 教師為全班選定一個原因,並為各組選 定其中一個解決方法,著各組就該解決
樹、與隨機森林等三種機器學習的分析方法,比較探討模型之預測效果,並獲得以隨機森林
我們用一因子變異數分析的 F 檢定及 Welch、Brown-Forsythe 的 檢定,從原本的 14 個變數中找出具有區別能力的 10 個變數來做區別 分析。由卡方圖知道四種土壤的 10
表 4-4-5 彙整了不同教育程度的民眾對祭品用品電子化的接受度之 單因子變異數分析統計結果。由表 4-4-5 的整體量表的 F