• 沒有找到結果。

用Excel解決農業研究資料統計分析的方法(七)-誤差線

N/A
N/A
Protected

Academic year: 2021

Share "用Excel解決農業研究資料統計分析的方法(七)-誤差線"

Copied!
4
0
0

加載中.... (立即查看全文)

全文

(1)用 Excel 解決農業研究資料統計 分析的方法 (七) — 誤 差 線. 生 物 統 計. 農試所技服組 呂秀英. 一、前言 在統計或科學計數資料中,通常 會以資料點或長條形來代表個體的數值 或平均值,同時也在該資料點或資料標 記上加上一個誤差線,用來表達出該資 料點或資料標記的潛在誤差量或不確定 度。這種圖形表達方式相當重要,可顯 示資料的可信賴程度。然而統計圖中的 誤差線可以是SD (standard deviation)、SE (standard error of mean) 或 CI (confidence intervals),它們的計算方式和表達意義 明顯不同,但很多研究人員對於究竟應 該採用哪一種,往往不清楚。本篇目的 在釐清這三種誤差線的差異,同時說明 如何利用Excel快速計算以及在圖上繪製 出誤差線。. 二、SD、SE和CI的意義 SD、SE 和 CI的計算公式和應用場 合之區分,整理如表一。必須注意的 是,只有當資料是常態分布或近似於常 態分布時,這三種誤差量才具意義。 (一)SD:將變方開平方根後的值,用來 表達樣本各資料點分布的離散或變異情 形,簡稱「標準差」。. 作 者:呂組長秀英 連絡電話:04-23302301-7450. 16. 農試所作物組 魏夢麗 呂椿棠. (二)SE:將SD除以觀測值數目開平方根 ( )的值,用來測量樣本平均值的估計 準確度,是平均值的SD,通常在正式學 術報告中多以SEM或SE of mean 稱謂 (即 多了一個mean,以強調是平均數的標準 差,而非觀測值的標準差),因此確實的 名稱應該為「平均值的標準差」,但常 有人將它簡稱為標準誤,這種稱法過於 簡略,很容易造成與SD混淆不清。 (三)CI:當我們想了解在95%或99%可 信賴度下平均數的真值所落在範圍是 多少時,這個範圍就是CI,稱為「信 賴區間」, 平均值之95%CI的公式為 mean±(1.96×SE),而平均值之99%CI的 公式為mean±(2.58×SE) ;由於通常設 定在5%或1%統計顯著水準下(即要求 95%或99%信賴度)來檢定各樣本平均值 間的差異性,因此這種CI常被拿來作為 處理間比較分析之用。 當我們在描述資料時,應該使用 mean±SD,讓讀者可清楚地感覺到資料 觀測點的分布狀況,例如圖一-(1)實例, 兩處理資料各為11.3±2.8及17.6±4.8, 表示處理1的10個資料點之分布變異較 處理2為小 (此解讀僅限測量單位相同的 兩組資料)。而在使用mean±SEM時, 圖一-(2)的兩處理資料各為11.3±0.9及 17.6±1.5,表示我們可以推測處理1之平 均值的準確度較處理2為高。至於95%或. 農業試驗所技術服務.2009年06月.78期. 78期技術服務.indd 16. 2009/6/29 11:58:49 AM.

(2) 99%CI,可以讓我們知道平均值的95%或 99%可信賴範圍,如圖一-(3)的兩處理資 料各為11.3±1.7及17.6±3.0,表示該兩 處理平均值的95%可信賴範圍分別落在 (9.6,13.0)和(14.6, 20.6)。由此可知,統計 圖中的誤差線可以是 SD、SE或CI,因此 必須在圖中加註標明,以免混淆。其中 只有從CI誤差線的重疊與否,可直接判 斷出兩樣本平均值間的差異是否顯著或 極顯著存在,例如圖一-(3)在使用95%CI 誤差線時,當平均值較大的處理2之誤差 下限與平均值較小的處理1之誤差上限 沒有重疊時,代表在5%顯著水準下該兩 處理平均值之間存在顯著差異;倘若重 疊,則兩樣本平均值無顯著差異。不過 必須注意的是,若比較的處理超過兩個 以上時,由於我們的目標是進行兩兩處 理之間的比較,利用兩兩CI誤差線彼此 之間是否重疊來判斷多個處理平均值間 的差異顯著性,可能不是那麼精準,但 無論如何,相較於SD或SE誤差線,透過 CI誤差線仍有助於從圖示目視約略判斷 出處理間的差異性 (Streiner, 1996)。. 生 物 統 計. 三、利用EXCEL快速計算誤差 量的方法 活用Excel的函數和公式,可容易 地計算出樣本資料的平均值和三種誤差. 圖一、用Excel繪製出 (1) SD、(2) SE和 (3) 95%CI三種不 同類型的誤差線圖(兩處理之資料如圖二)。. 表一、SD、SE及CI三種誤差量的計算公式和意義 誤 差 量. 簡 稱. 計 算 公 式. 意 義. 標準差 (standard deviation). SD. SD=. 樣本各資料點分布的離散 或變異情形. 平均值的標準差 (standard error of mean). SE或SEM. SE=. 樣本平均值的估計準確度. 信賴區間 (confidence intervals). CI. 95%CI=1.96×SE 99%CI=2.58×SE. 樣本平均值的95%或99% 信賴區間. 註:上述公式中xi為資料觀測值,x 為平均值,n 為觀測值個數。. 農業試驗所技術服務.2009年06月.78期. 78期技術服務.indd 17. 17. 2009/6/29 11:58:52 AM.

(3) 量。以圖二之資料為範例,處理1資料 集所在位址為B2:B11,在指定位址輸 入=AVERAGE(B2:B11),即計算出平均 值;輸入=STDEVA(B2:B11),可得SD; 進而利用於B13位址的已知SD,輸入 =B13/SQRT(COUNT(B2:B11)),可得SE (其中SQRT為開平方根函數,COUNT 為計算觀測值個數之函數);至於95% CI可再利用於B14位址的已知SE乘以1.96 求得,即輸入=1.96*B14。另一個處理 2,則直接利用複製B12:B15範圍位址後 貼上C12:C15,即可快速求得該四種統 計量的估計值。除了直接輸入函數和公 式的方法外,平均值、SD和SE也可經由 Excel在功能表上之「工具」中的「資料 分析」,選擇「敘述統計」,可針對多 個變數性狀快速準確地一次計算出各種 常用的敘述統計量;但CI仍必須經由上 述輸入公式始能求得。. 生 物 統 計. 4.在對話方塊中的「資料範圍」區域, 指定平均值所在位址(圖三-(2)), 由於本例同時將命名為mean的資料. 圖二、利用Excel函數和公式計算平均值、SD、SE及CI的 方法。. (1). 四、在Excel圖中加入、修改和 取消誤差線的方法 利用Excel所繪製出的區域圖、橫條 圖、直條圖、折線圖或XY散佈圖上,可 加上誤差線。由於農業研究上常以處理 平均值作為資料點來進行差異性比較, 因此本篇以圖二之資料為例,說明如何 利用Excel繪製出以平均值為數列且含誤 差線的長條圖,以及產生後如何修改誤 差線類型與取消誤差線(長條圖以外其 他類型圖的誤差線之加入、修改和取消 的方法皆相同,請參照以下(二)∼(四) 步 驟)。. (2). (一)長條圖之繪製 1. 進入圖表精靈,指定直條圖類型(圖 三-(1))。 2. 按下一步,進入「來源資料」。 3. 然後按一下「資料範圍」索引標籤。. 18. 圖三、Excel「圖表精靈」中(1)指定圖表類型,(2)來源 資料中「資料範圍」索引標籤的方塊選項。. 農業試驗所技術服務.2009年06月.78期. 78期技術服務.indd 18. 2009/6/29 11:58:56 AM.

(4) 標記連同平均值一起選入作為資料範 圍(A12:C12),所以「mean」文字可 在圖例中顯示出來,倘沒有將標記選 入作為資料範圍而僅指定平均值位址 (B12:C12),則圖例文字僅以內設的 「數列」文字顯示。 5.在對話方塊中的「數列資料取自」, 由於本例的兩個平均值是逐列呈現, 因此仍維持系統內設的「列」(若數 列資料是逐欄呈現,則此項必須勾選 「欄」)。最後,按「下一步」或「完 成」。 (二)加入誤差線 1.在圖上之資料點按一下,以選取該資料 數列。 2.按右鍵或從功能表選擇「格式」,進入 「資料數列格式」。 3.然後按一下 「Y誤差線」 索引標籤。 4.在對話方塊中的 「顯示」 區域,按 一下所需要的誤差線類型,如圖四所 示。誤差線能顯示實際資料點的正 差、負差或兩者,若選擇無,則取消 誤差線。 5.在對話方塊中的「誤差量」 區域, 選項有定值、百分比(資料點的數 值)、標準差、標準誤差或自訂(手. 動指定數量),可選擇其中一種來計 算誤差線描繪出的數量。但此處請務 必勾選「自訂」,並指定要選擇的誤 差量所在範圍位址,如本例,若要繪 製SD誤差線,則在+和-區域內都選擇 SD數值所在位址B13:C13 (圖四), 按「確定」後,即在長條圖中新增SD 誤差線,如圖一-(1)所示。若繪製SE或 CI誤差線,同樣地在「自訂」的+和- 區域內改成其數值所在位址即可,結 果分別列於圖一-(2)、(3)。注意,無 論使用SD或SE時,都切勿勾選方塊區 域內的標準差或標準誤差,否則會出 錯。. 生 物 統 計. (三)修改誤差線類型 1.在圖上的誤差線按一下,以選取該誤差 線。 2.按右鍵,進入「誤差線格式」。 3.然後按一下 「Y誤差線」索引標籤。在 「自訂」的+和-區域內,重新指定其 他誤差量所在範圍位址,然後按「確 定」。 (四)取消誤差線 1.在圖上的誤差線按一下,以選取該誤差 線。 2.按右鍵,選擇「清除」。. 五、參考文獻 呂秀英、魏夢麗、呂椿棠。2005。用 Excel解決農業研究資料統計分析的方 法(一)-敘述統計量。技術服務 63: 33-36。 Streiner, D. L. 1996. Maintaining standards: d i ff e r e n c e s b e t w e e n t h e s t a n d a r d deviation and standard error, and when to use each. Can. J. Psychiatry 41:498-502. 圖四、Excel「資料數列格式」中之「Y誤差線」索引標 籤的方塊選項 (圖中「顯示」區域選擇兩者,並在「誤 差量」區域內點選自訂後指定自訂值所在之範圍位址)。. 農業試驗所技術服務.2009年06月.78期. 78期技術服務.indd 19. 19. 2009/6/29 11:58:59 AM.

(5)

參考文獻

相關文件

「公告品名成份規格」欄位預設帶入公告資料,請依

(B)Data Bus 是在 CPU 和 Memory 之間傳送資料,所以是雙向性 (C)Address Bus 可用來標明 Memory 或 I/O Port 位址的地方 (D)Data Bus 的長度和 Address

如圖1-16所示,NOT運算會改變邏輯準位。輸入為 HIGH (1) 時,輸出為LOW (0)。當輸入為LOW時,輸出

數位計算機可用作回授控制系統中的補償器或控制

下列哪一種記憶體屬於非揮發性記憶體, 不會因電源關閉而使其中的資料消 失, 但是可以透過電壓的方式重複抹除資料, 可用於基本輸入/ 輸出系統 (Basic Input / Output System,BIOS)

審查整理呈現資料:蒐集到的資料應先審核 是否完整、正確、合理與一致,然後利用敘

 想要設計一個具有兩個輸入G(gate閘控)和 D(data資料)以及一個輸出Q的閘控閂電 路。當G等於1時,在輸入D出現的二進位資料

Grant, ed., The Process of Japanese Foreign Policy (London: Royal Institute of International Affairs, 1997), p.119.