• 沒有找到結果。

基礎生統介紹

N/A
N/A
Protected

Academic year: 2021

Share "基礎生統介紹"

Copied!
75
0
0

加載中.... (立即查看全文)

全文

(1)第三章.敘述統計學 Descriptive Statistics 表格化法與製圖法 資料的整理與呈現 中心位置測定值 分散度測定值 變異係數.

(2) 3.1 資料整理 Data Organization. 將資料表格化或繪製圖形,使資料能一目瞭然。 一個好的圖表勝過千言萬語。. 資料形態有兩種: 分立變數(discrete variable): 沒有度量衡儀器的測定(無單位),分立變數都是計數 的。如家庭子女數、性別、花的顏色等。 連續變數(continuous variable): 有度量衡儀器的測定(有單位,如公分、公斤等),觀 測值間的變動是連續的,差異很小。如身高、體重 、 溫度等。 2.

(3) 3.1.2 資料表格化法 Tabulation of Data. 將資料整理成表格的形式,並以文字或數 字的形式表現出來,並求各變數之次數 (frequency)及相對次數(relative frequency)或 比例(ratio)等。 可區分為不分組及分組兩類資料型式。. 例3.1:設測定50粒四環素(tetracycline)膠 囊之重量(mg毫克)如下表,試製作次數分 配表。 3.

(4) 資料表格化法 Tabulation of Data. 表3.1 50粒250mg四環素膠囊測定重量表(mg) 252. 250. 252. 256. 249. 251. 253. 254. 248. 244. 250. 249. 250. 250. 256. 253. 251. 248. 251. 251. 249. 250. 252. 254. 250. 252. 249. 251. 246. 253. 247. 251. 249. 245. 248. 249. 246. 247. 250. 247. 248. 250. 252. 255. 252. 254. 245. 250. 251. 251. 4.

(5) 資料表格化法 Tabulation of Data 50粒四環素按重量大小排列後次數分配表(未分組) 組值. 次數登記. 次數. 累計次數. 相對次數. 累計相對次數. 244 245 246 247 248 249 250 251 252 253 254 255 256. / // // /// //// ///// //////// /////// ///// /// /// / //. 1 2 2 3 4 6 9 8 6 3 3 1 2. 1 3 5 8 12 18 27 35 41 44 47 48 50. 2% 4% 4% 6% 8% 12% 18% 16% 12% 6% 6% 2% 4%. 2% 6% 10% 16% 24% 36% 54% 70% 82% 88% 94% 96% 100%. 合計. 50. 100%. 5.

(6) 資料表格化法 Tabulation of Data. 分組的方式及步驟:  求全距(R):(最大觀測值 — 最小觀測值)  決定組數(k): • Sturges (1926) formula: K = 1 + 3.322 log10 N • N為所有資料的總次數  決定組距:組距(d)=全距(R)∕組數(K)  選擇上下組限  訂定上下組界  計算組中點(組值)  計算各組次數. 6.

(7) 資料表格化法 •本例N =50,所以組數:. K =+ 1 3.322 log10 50 =+ 1 3.322 ×1.7 = 6.65 ≅ 7 •因此每組之組距:(256—244)/7=1.714 ~ 2 •組限最小值為244,但組距為2,故第一組之上下組限 為(244,245),第二組組限為(246,247)。 •因重量為連續變數,244應在243.5與244.5之間,且第 一要包括最小值在內,第一組下組界為最小值減0.5 → 243.5,第一組上組界為243.5 + 2 = 245.5,而第 二組下上組界為(245.5, 247.5)。 •第一組組值= (243.5+245.5)/2 = 244.5,其他組值依 此類推,而得如下分組次數分布表: 7.

(8) 資料表格化法 Tabulation of Data 50粒四環素次數分配表(分組後) 組界. 組界. 組值 (x). 244-245 246-247 248-249 250-251 252-253 254-255 256-257. 243.5-245.5 245.5-247.5 247.5-249.5 249.5-251.5 251.5-253.5 253.5-255.5 255.5-257.5. 244.5 246.5 248.5 250.5 252.5 254.5 256.5. 合計. 次數 (f) 3 5 10 17 9 4 2 50. 累計 相對 次數 次數 (cf) (rf) 3 8 18 35 44 48 50. 6% 10% 20% 34% 18% 8% 4%. 累計相對 次數 (crf) 6% 16% 36% 70% 88% 96% 100%. 100% 8.

(9) 3.1.3 製圖法 Graph. 將次數分配表繪製成圖形,能使讀者一目 瞭然,常用的方法: . 分立變數(discrete variable)的統計圖: 長條圖(bar chart):由若干長條狀所構成, 每一長條所代表的是該組的發生次數。 圓形圖(pie chart):以圓形的三百六十度為百 分之百,而各分類所占的百分比即為扇形的 角度。 9.

(10) 長條圖 bar chart. 25 20. 23 18. 15 9. 10 5 0 < 250. = 250. > 250 10.

(11) 圓形圖 pie chart. = 250, 9, (18%). < 250, 18, (36%). > 250, 23, (46%). 11.

(12) 製圖法 Graph . 連續變數(continuous variable)的統計圖: 莖葉圖(stem-leaf plot):為Tukey(1960)提出 的,將資料由小到大依序排列,將每一觀察 值分成兩部分,一部分屬於「莖」(stem), 其餘的屬於「葉」(leaf),可以洞悉資料的集 中與分散情形。 直方圖(histogram):與長條圖非常類似,適 用於連續變數並且分組的資料,作法如同長 條圖,橫軸代表各組的組值,縱軸代表各組 的次數。 12.

(13) 莖葉圖(stem-leaf plot) . 50位12歲男學童之收縮壓記錄. . ------------------------------------------. 120 98 96 100 128  88 90 108 102 91  94 100 80 93 105 100 104 95 106 100 105 106 107 84 106 98 110 112 90 113 96 104 114 105 116 102 113 96 115 124 108 118 104 120 130 119 128 126 133 95 ---------------------------------------. 13.

(14) 莖葉圖. stem-leaf plot . 十位數以上為莖,個位數為葉. 12歲男童之血液收縮壓莖葉圖: 次數. 莖(stem). 3 12 18 9 6 2. 8 9 10 11 12 13. 50. 葉(leaf) - 個位數 0 0 0 0 0 0. 4 0 0 2 0 3. 8 1 0 3 4. 3 0 3 6. 4 2 4 8. 5 5 6 6 6 8 8 2 4 4 4 5 5 5 6 6 6 7 8 8 5 6 8 9 8 合計 14.

(15) 莖葉圖. stem-leaf plot. 4. 8 6 6 5. 1. 3 0. 0 9 莖(stem). 4. 5. 5. ……. 5. 6. 8. 2. 葉(leaf). 5 4 4 2. 0. 0 0. 0 10 莖(stem). 15.

(16) 直方圖 histogram. 20 15 10 5 0 .5 2 24. .5 4 24. .5 6 24. .5 8 24. .5 0 25. .5 2 25. .5 4 25. .5 6 25. .5 8 25 16.

(17) 製圖法 Graph . 連續變數的統計圖(續): 多邊圖(polygon):以直線連接直方圖之各組 頂點(組值),並在第一組之前及最後一組之 後各加一組當作假想組,此兩組的次數皆設 為0,以連接成一封閉的曲線。 累計次數多邊圖(cumulative frequency polygon):以各組之組值為中心點與累積次 數為座標,並將所得的點連接起來,則可得 一累計次數曲線圖。 17.

(18) 多邊圖 polygon. 20 15 10 5 0 .5 2 24. .5 4 24. .5 6 24. .5 8 24. .5 0 25. .5 2 25. .5 4 25. .5 6 25. .5 8 25 18.

(19) 累計次數多邊圖. cumulative frequency polygon 50 40 30 20 10 0. 244.5. 246.5. 248.5. 250.5. 252.5. 254.5. 256.5 19.

(20) 百分位數. percentile 百分位數:將順序排列後的資料化分為一百等分, 通常以第k個百分位數稱之,代表資料中有多少 百分比之樣品是在此分數之下。如樣品大小為n 其第k個百分位數計算式如下: k  如果n × 不是整數;  x n× k +1 100 100    Qk =   k  1  x +x 如果n × 是整數。  2   n× k   n× k +1  100   100 100        20.

(21) 百分位數. percentile. 四分位數:將順序資料分成四等分,第1四分位 數Q1為第25百分位數,第2四分位數Q2為第50百 分位數,即中量(中位數);第3四分位數Q3為第 75百分位數。. 25%. 25% Q1. 25% Q2. 25% Q3 21.

(22) 一百等分之 Q1 , Q2 , Q3之百分位數求法 . 設 k= n × P. 100. (n為樣品點數,P為百分數). . 若k不是整數,則 X Q =k取整數+1的變數. . 若k是整數,則 X Q =. 1 ( X k + X k +1 ) 2. 22.

(23) 例如50粒四環素之百分位數(未分組資料,表3.2a) 25 P =25%, k =50 × 12.5 = 100 Q1 X 12= X= 249 = 13 +1 50 P =50%, k =50 × =25 100 1 1 Q2 = ( X 25 + X 26 )= (250 + 250)= 250 2 2 75 P =75%, k =50 × =37.5 100 252 Q3 X 37 X= = = 38 +1 23.

(24) 累計次數百分位數圖 cumulative frequency polygon. 24.

(25) 盒鬚圖. 補充. Box and whisker plot. 又稱為箱型圖(box plot)。盒鬚圖乃依據五個彙 整量數—最小值、 第一四分位數、中位數(中 量)、第三四分位數,以及最大值—所畫出的一 種表示資料特性的統計圖形。. Xsmallest Q1 Median Q3. 4. 6. 8. 10. Xlargest. 12 25.

(26) 資料分布與盒鬚圖之關係(Shape & Box Plot). Left-Skewed Q1 Median Q3. 左偏斜分布中量偏右. Symmetric Q1. Median Q3. 常態分布中量在中間. Right-Skewed Q1 Median Q3. 右偏斜分布中量偏左.

(27) 散布圖(scatter plot) . 連續變數的統計圖(續): 散布圖(scatter plot):散布圖應用於兩連續 變數有密切關係的研究上。 •8位健康男性之血液中膽固醇(cholesterol)與 舒張壓(diastolic blood pressure)之關係: 成人. 1. 2. 3. 4. 5. 6. 7. 8. 膽固醇(x) 225 207 270 217 285 274 236 185 舒張壓(y). 76. 80. 90. 74 100 88. 78. 70 27.

(28) 散布圖 scatter plot. 120 110 y 100 舒 90 張 80 壓 70 60 160. 180. 200. 220. 240. 260. 280. 300. x 膽固醇 28.

(29) 3.2 中心位置測定值 Measures of Central Location. 以一個數值來描述資料分布的中心位置。 算術平均值(arithmetic mean):又簡稱均值, 為所有觀測值的總和除以觀測值的個數即為 算術平均值,當資料是連續變數時適用。 中量(median):或稱中位數,是將資料由小 到大順序排列後,位於中心(中間)的數值。 眾量(mode):或稱眾數,指資料中出現次數 最多的觀測值或分組名稱。 29.

(30) 3.2.1 算術平均值 Arithmetic Mean. 樣品平均值(x:讀音x-bar): n. x = ∑ xi n i =1. 式中. 樣品點(sample point). n. 其中. ∑x i =1. i. = ( x1 + x 2 +  + x n ). ∑ (讀音Summation or sigma)為總和符號. 族群平均值(μ :讀音mu): N. µ = ∑ xi N i =1. 30.

(31) 樣品算術平均值 sample Arithmetic Mean. 例3.1 表3.4 台北市某醫院一星期內20位初生嬰兒體重表(克). i. xi i. xi i. xi i. xi. 1. 3264. 6. 3323. 11. 2580. 16. 2758. 2. 3260. 7. 3650. 12. 2845. 17. 3248. 3. 3245. 8. 3200. 13. 3585. 18. 3325. 4. 3484. 9. 3030. 14. 2480. 19. 3315. 5. 4146. 10. 2070. 15. 3542. 20. 3106 31.

(32) 算術平均值 Arithmetic Mean. 將此20個觀測值當作一樣品,求此樣品算 數平均值( x ). x = (3264 +  + 3106) / 20 = 63816 / 20 = 3190.8 克 算術平均值的限制:當資料有極端值時,平均值 就易受影響,所以是非常敏感的。 如第一位嬰兒為早產兒,體重為1200克,其算術平 均值變為3087.6克. 32.

(33) 算術平均值 Arithmetic Mean. x = 3190.8. x = 3087.6. 表3.4 台北市某醫院一星期內初生嬰兒體重表(克). i 1. xi i. xi i. xi i. xi. 6. 3323. 11. 2580. 16. 2758. 2. 3264 1200 3260. 7. 3650. 12. 2845. 17. 3248. 3. 3245. 8. 3200. 13. 3585. 18. 3325. 4. 3484. 9. 3030. 14. 2480. 19. 3315. 5. 4146. 10. 2070. 15. 3542. 20. 3106 33.

(34) 族群算術平均值 population Arithmetic Mean. 如擲一骰子出現1 2 3 4 5 6等6個觀測值,如 視為一族群,則其族群算術平均值( ) 為:. µ. µ = (1 + 2 + 3 + 4 + 5 + 6) / 6 = 3.5. 34.

(35) 3.2.2 算術平均值之性質 Properties of Arithmetic Mean. 平移:將原資料同加減一個常數(C)的方式,則 新資料之平均值為原來平均值加減此常數。 n 1 n 1 n 1 n  1 n  y = ∑ y i = ∑ ( xi + c) =  ∑ xi + ∑ c  =  ∑ xi + nc  = x + c。 n i =1 n i =1 n  i =1 n  i =1 i =1  . i 1 2 3 4 平均. 原觀測值 5 2 10 3 5. 新觀測值 5+2=7 2+2=4 10+2=12 3+2=5 5+2=7. 35.

(36) 算術平均值之性質 Properties of Arithmetic Mean. 調整尺度:將原有的每一個觀測值同時乘以常 數C倍,則新資料之平均值為原來的C倍。 1 n 1 n 1 n y = ∑ y i = ∑ cxi = c ∑ xi = cx n i =1 n i =1 n i =1. i 1 2 3 4 平均. 原觀測值 5 2 10 3 5. 新觀測值 5×2=10 2×2=4 10×2=20 3×2=6 5×2=10. 36.

(37) 算術平均值之性質 Properties of Arithmetic Mean. 偏差(deviation):每一樣品觀測值與其平均值之 差,或稱離均差,以式表示為:Di = xi − x •而偏差總和等於0 n. n. ∑ D = ∑ (x i =1. i. i 1 2 3 4 平均. i =1. i. n. n. i =1. i =1. − x ) = ∑ xi − ∑ x = nx − nx = 0. 原觀測值 5 2 10 3 5. Di = xi − x. 5-5=0 2-5=-3 10-5=5 3-5=-2 0. 37.

(38) 算術平均值之性質 Properties of Arithmetic Mean. 每一樣品觀測值與其平均值之偏差平方的和, 稱為平方和(sum of squares),此值為最小,以 n 式表示為: SS = ∑ ( xi − x ) 2 i =1. 原觀測值:5,2,10,3. 平均值=5. SS =(5 − 5) + (2 − 5) + (10 − 5) + (3 − 5) =38 2. 2. 2. 2. 如以 a=4 替代平均值 5. SS =(5 − 4) 2 + (2 − 4) 2 + (10 − 4) 2 + (3 − 4) 2 =42 > 38 38.

(39) 算術平均值之性質 Properties of Arithmetic Mean. X = 5 2. 3. 5. 10. + +. a =4 2. 3. 5. 10 39.

(40) 3.2.3 中量( Median) 中量(median):是將資料由小到大順序排列 後,位於中心(間)的數值稱之,為使用率 僅次於算數平均數的中心位置測定值。  x n +1  ( 2 ) Med =    1  x n + x n   2  ( 2 ) ( 2 +1) . 如果n為奇數 如果n為偶數. 中量僅能決定樣品資料的中間值,無法反 應其他樣品點的真正數值。 40.

(41) 中量( Median ) 例3.3:某醫院入院病人的白血球測定數目(×103): 8,30,6,9,8,3,12,15,18 •. 大小排列後:3,6,8,8,9,12,15,18,30 因n=9為奇數. n +1 9 +1 = = 5 ⇒ Med = X (5) = 9 2 2 •. 若僅取前面8個觀測值,n=8為偶數. n 1 8+9 = 4, ⇒ Med =( X (4) + X (5) ) = = 8.5 2 2 2 41.

(42) 3.2.4 眾量( Mode ) 眾量(mode):指資料中發生次數最多的觀 測值。當數據或名稱各只出現一次時,眾 量便不存在,但因次數可能相同,故眾量 可能不唯一。 眾量很少被採用,其數學運算性質不高。 例3.4:某村里100個家庭之子女數,其眾 量為2(發生次數為48) 42.

(43) 100個家庭子女數          . 子女數(x) 家庭數(f) ------------------------0 2 1 15 2 48 3 26 4 6 5 2 6 1 ------------------------43.

(44) 3.2.5 中心位置測定值的關係 當資料是左右對稱的分配時,則平均數、 中位數及眾量三者皆相等(常態分配)。 右偏分配:眾量最小,中位數居中,平均 值最大。 左偏分配:平均值最小,中位數居中,眾 量最大。. 44.

(45) 3.2.5 中心位置測定值的關係 (a)常態分布. (b)右態分布. x. (c)左態分布. Med. M0. x Med M 0. M 0 Med x 圖3.8. 常態分布與偏斜分布. 45.

(46) 3.2.6 幾何平均(Geometric mean) . 若觀測值均為正數且其分佈為右偏,算術平 均數未能代表均中性,故先取對數轉換 (Logarithmic Transformation),轉換後之 觀測值分布數為對稱 –計算其算術平均數 –再取反對數轉換 –得幾何平均數 –→原始觀測值的中量 46.

(47) . 設x1,x2, …,xn為一樣品資料,各樣品點取對 數之平均值設為 u 如下: 1 n u = ∑ log10 X i n i =1. . 則幾何平均值. xg. 如下. = xg anti = log(u ) 10 . u. 或以下式開n次方也是,得為. xg = n x1 x2 ......xn 47.

(48) . 下列資料是10位病人服藥後藥量吸收達到最大 之時間(小時) ,試求其算術平均值,中量及 幾何平均值. 病人 Tmax. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 0.80 0.90 1.10 1.15 1.18 1.81 2.03 2.21 2.58 3.35. = 算術平均值 x 中量. (0.8+ =  +3.35)/10 1.71. Med = (1.18 + 1.81) / 2 = 1.50. 幾何平均值 xg 之求法如下 u (log10 x1 +  + log10 xn ) / n 令 = = (log10 0.8 +  + log10 3.35) = /10 0.18775 u = xg anti log(= u ) 10 = 100.18775 = 1.54. Med= 1.50 ≅ xg= 1.54 < x= 1.71 48.

(49) 3.2.7 調和平均值(Harmonic . mean). 各觀測值之倒數平均值,其計算式如下. xH =. =. 1 1 1 1 1 + + + ( ) n x1 x2 xn n 1 1 1 + + + ( ) x1 x2 xn. 49.

(50) 例子: 例如某人到三家雜貨店買雞蛋,每家每個蛋之 價錢分別為3.5,4,5元,求一顆蛋平均多少錢? 由(3.7)式,. 3 = xH = 4.08 1 1 1 + + 3.5 4 5 此結果與算數平均值( x = 4.17 元)略有出入。 50.

(51) 3.2.8 分組資料的求法 分組資料算數平均值的求法(例子見表 3.2b): k. k. i =1. i =1. 1.算數平均值: x = ∑ f i xi / ∑ f i. f i :組次數. xi:組中點,k:組數. 3 × 244.5 + 5 × 246.5 +  + 2 × 256.5 x = ∑ f i xi / 50 = 50 i =1 = 250.25 7. 51.

(52) 3.3 分散度(變異數)測定值 Measures of dispersion. 分散度測定值可用來描述資料中觀測值大小分 散或集中程度。例如:兩個樣品的分配可能有 同樣的中心位置,但卻有不同的分散度測定值。. x =8 人工測定法 (mg% / ml). 6.5. 4.5. 10. 12 機器自動測定法. 6. 7 8 9. 10. (mg% / ml). 圖3.9 同一組資料人工測定與機器自動化測定尿酸紀錄圖. 52.

(53) 3.3.1 全距及偏差( Range and Deviation ) 全距(range):即樣品中最大值與最小值之差, 為分散度最簡單的表示法,但容易受到極端值 的影響。 平均偏差(mean deviation):是將各觀測值與平 均值之偏差(deviation)取絕對值後之總和除以 樣品觀測值總數而得,可是實際上我們很少採 用,因為平均偏差公式在數理上無法作運算或 分解,故其用處不多。 53.

(54) 平均偏差公式 − 1 MD x−x = ∑ n. 如尿酸人工測定法 4.5, 6.5, 7, 10, 12 1 MD= ( 4.5 − 8 + 6.5 − 8 + 7 − 8 + 10 − 8 + 12 − 8 ) 5 12 = = 2.4 5. 54.

(55) 3.3.2 變異數與標準偏差(或標準差) Variance and Standard Deviation. 族群變異數(σ. 2. N. ): σ = ∑ ( xi 2. − µ). 2. N. i =1. 族群標準偏差(σ. σ = ):. N. ∑ (x i =1. n. 樣品變異數(S. 2. 樣品標準偏差(S. − µ). 2. i. S = ∑ ( xi − x ) ):. 2. 2. N. (n − 1). i =1. S= ):. n. 2 ( ) − x x ∑ i. (n − 1). i =1. 55.

(56) 族群變異數 設族群資料有N 個觀測值,其平均值為 , 則各觀測值偏差平方後之總和除以N 即得 µ 一變異數(variance)特稱此變異數為變方, 統計學上均以σ 2(讀音sigma square)符號表 示之。以式表示為 N. σ = ∑ (xi − µ ) 2. 2. N. i =1. 56.

(57) 族群標準偏差 將族群變方開方,取其正值即得,所得之 數值在統計學上稱為標準偏差(standard deviation),以式表示為. SD = σ = σ = 2. N. ∑ (x i =1. i. − µ). 2. N. 57.

(58) 例子 3.8(族群) 例3.8:擲一骰子,族群觀測值為1,2,3,4,5,6 µ =3.5,N=6則平方和: N. SS = (1 3.5) + ( 2 − 3.5) +  ∑ ( xi − µ ) =− 2. 2. 2. i =1. + ( 6 − 3.5 ) = 17.5 = 1 + 2 + ... + 6 − 21 / 6 2. 2. N. 2. 2. 2. 變方:σ = ∑ (xi − µ ) N = SS N = 17.5 6 = 2.9167 2. 2. i =1. 標準偏差: SD = σ = σ 2 = 2.9167 = 1.7078 58.

(59) 樣品變異數 族群資料往往很大或無限大,其取得不易, 而且族群平均值實際上亦未知,以樣品資 料求得樣品變異數,以推估族群變異數, 一般稱此樣品變異數為均方(mean square)。 以式表示為 n. S =∑ ( xi − x ) 2. 2. (n − 1). i =1. 59.

(60) 樣品標準偏差 將樣品均方開方,取其正值即得。以式表 示為 n. S =S =∑ ( xi − x ) 2. 2. (n − 1). i =1. 60.

(61) 自由度. Degrees of freedom (df) 樣品內獨立而能自由變動的個數。 觀測值個數減掉約束、限制條件的個數。 樣品變異數(均方): • 獨立而能自由變動的個數為 n-1。 • 限制條件為 n. ∑ (x − x) = 0 i =1. i. 61.

(62) 樣品均方之簡便計算式 n n 1 1 2 2 2 S2 = x x x x x x − = − + ( 2 ) ( ) ∑ ∑ i i i n − 1 i =1 n − 1 i =1 n n 1  n 2 2 =  ∑ xi − 2 x ∑ xi + ∑ x  n − 1  i =1 i =1 i =1 . 1  n 2 2 2 =  ∑ xi − 2n x + nx  n − 1  i =1  2 n n   1  1    2 x =  ∑ xi2 − n x 2  = ∑ i −  ∑ xi  n  n − 1  i =1  n − 1  i =1  i =1   n. 62.

(63) 例子 3.9 & 3.10(樣品) 假設同一組資料使用兩種不同方法測定人體 血液中尿酸(uric acid)濃度,資料如下。試分 別求人工測定法與儀器自動測定法尿酸濃度 之均方及標準偏差。資料記錄圖,如圖3.9。 人工測定法(mg%/ml) 機器自動測定(mg%/ml). 4.5 6.5 6. 7. 7. 10. 12. 8. 9. 10. 63.

(64) 例子 3.10(樣品) 以簡算式求得 人工測定法:. (. ∑ xi = 40. 2 x ∑ i = 355.5. ). 2 2 355 . 5 40 5 4 = 35.5 4 = 8.875 S = − 均方:. 標準偏差: S = 自動測定法:. (. S = 8.875 = 2.979 2. ∑ xi = 40. ). 2 x ∑ i = 330. 2 2 S = − 330 40 5 4 = 10 4 = 2.5 均方:. 標準偏差: S =. S 2 = 2.5 = 1.58 64.

(65) 3.3.4 變異數與標準偏差之性質 平移後之樣品變異數:原樣品 x1 , x 2 ,  , x n 及新樣品 y1 , y 2 ,  , y n,其中 2. y= xi + c i. 2. 2. 1 n 1 n 1 n 2 = sy yi − y ) x − c) xi − x ) sx2 (= ( xi + c −= (= ∑ ∑ ∑ n −1 i 1= n −1 i 1 n −1 i 1 = =. 例3.11:人工測定法尿酸值減常數c=8 I. 原觀察值. 新觀測值. 新觀測值偏差 新觀測值偏差平方. 1. 4.5. 4.5-8=-3.5. -3.5-0=-3.5. 12.5. 2. 6.5. 6.5-8=-1.5. -1.5-0=-1.5. 2.25. 3. 7. 7-8=-1. -1-0=-1. 1. 4. 10. 10-8=2. 2-0=2. 4. 5. 12. 12-8=4. 4-0=4. 16. 平均. 8. 8-8=0. 和. 35.5. 新觀測值均方與標準偏差與原觀測值均方與標準偏差相同. 65.

(66) 變異數與標準偏差之性質 調整尺度後之樣品變異數:新樣品 y1 , y 2 ,  , y n ,其中 yi = cxi 2. 2. 2. 1 n 1 n 1 n 2 2 sy cx ) c = − y) − x ) c 2 sx2 ( yi = ( cxi −= ( xi = ∑ ∑ ∑ n −1 i 1= n −1 i 1 n −1 i 1 = =. 例3.12:人工測定法尿酸值乘常數c=2 i. 原觀察值. 新觀測值. 新觀測值偏差 新觀測值偏差平方. 1. 4.5. 4.5*2=9. -7=-3.5*2. 49 =. 2. 6.5. 6.5*2=13. -3=-1.5*2. 9=. 3. 7. 7*2=14. -2=-1*2. 4. 10. 10*2=20. 4=2*2. ( −1) ( 2 ) 2 2 16 = ( 2 ) ( 2 ). 5. 12. 12*2=24. 8=4*2. 64 = ( 4 ) ( 2 ). 平均. 8. 16=2*8. ( −3.5) ( 2 ) 2. ( −1.5) ( 2 ) 2. 4=. 2. 2. 2. 2. 2. 2. 和 142 = 35.5 ( 2 )2 66.

(67) 3.3.5 標準誤差(或標準誤) Standard Error. 從N個觀測值之族群中,以歸還抽樣法抽取n個 觀測值為樣品,可得 N n 個可能樣品,分 別求此 個樣品的均值,而這些樣品均值可視 為一個新族群的觀測值,其平均值及變方,可 依照族群資料的求法。 例3.13:設族群觀測值為2,5,8, N = 3, µ = 5, σ 2 = 6 從此族群中抽取n=2個觀測值為樣品,其所有可 能樣品及其均值列如表3.7。. 67.

(68) 標準誤差(Standard Error) 樣品. 均值 x. (x − µ). 2,2 2,5 2,8 5,2 5,5 5,8 8,2 8,5 8,8. 2 3.5 5 3.5 5 6.5 5 6.5 8. 9 2.25 0 2.25 0 2.25 0 2.25 9. 和 均值. 45 5 (µ ). 27. 2. 2 3 (σ / n). 均方S 2 = ∑ ( xi − x ) (n − 1). 0 4.5 18 4.5 0 4.5 18 4.5 0 54 2 6 (σ ). 2. Sb2. (x − x ) ∑ =. 2. i. n. 0 2.25 9 2.25 0 2.25 9 2.25 0 27 3. 68.

(69) 標準誤差 Standard Error. 此值恰等於族群均值. µ. 9. µ x = ∑ xi 9 = (2 + 3.5 +  + 8) 9 = 5 i =1. 此值恰等於族群變方 σ 2 9. σ = ∑ (x − µ ) 2 x. 2. 除以樣品大小n. 9 = (9 + 2.25 +  9 ) 9 = 3. i =1. 標準誤差. σ= x. σ= 2. _. x. σ2. = n. 6 = 2. 3 1.73 = 69.

(70) 3.3.6 族群母數(或參數)與樣品統計值 (population parameter and sample statistic) . 族群母數:. µ ,σ ,σ 2 ,σ 2 ,σ . _. _. x. x. 樣品統計值: _ 2 , S ,S x. 70.

(71) 3.4 變異係數. Coefficient of Variation (CV). 若兩樣品資料的測量單位不同時,我們該如何比 較它們的分散情形呢?若以均方或標準偏差大小 而定是不恰當的,因為通常平均數的大小會影響 均方及標準偏差,此時可以變異係數來計算相對 分散程度的情形。 標準偏差 = CV ×100% 變異係數定義: 平均值. σ 族群變異係數:CV = × 100% µ. 樣品變異係數: CV =. S ×100% x. 72.

(72) 變異係數(CV) 例3.14:設今有五位初生嬰兒體重如下: X(以克為單位):3260,3246,3324,3200,2850 _. 2 = x 15880, = x 3176, = S 35178 ∑ i x. Y(以盎司為單位):114.99,115.50,117.25,112.87,100.53 _. 2 = y = y = S 560.14, 112.028, 43.7665 ∑ i y. = Sx = 35178 187.5580, = Sy. 43.7665 = 6.6156. 187.5580 × 100% = 5.905% 3176 6.6156 CVy= × 100%= 5.905% 112.028. CV= x. 兩單位標準偏差雖不同,但變異係數相同 73.

(73) 變異係數 (CV) 例3.16:假設調查10位成人的平均身高為 166公分,標準偏差為36.8公分;平均體重 為62.5公斤,標準偏差為12.3公斤,試問身 高和體重哪一項分散程度較大? 解:乍看之下,身高的標準偏差遠大於體重 的標準偏差,但因兩者的單位不同,不宜直 接由標準偏差的大小來說明分散程度大小, 此時應利用變異係數來回答本問題才正確。. 74.

(74) 變異係數(CV) 36.8  身高: CV = ×100% = 22.17% 166. 12.3 × 100% = 19.68%  體重: CV = 62.5 由此可知,此10位成人體重的分散程度 較身高來得小。 75.

(75) The End. 76.

(76)

參考文獻

相關文件

(三) 變率與微分、 求和與積分: “變率” 與 “求和” 是函數的兩種定量型 (quantitative) 的基本性質。 但是它們的定義本身就是理論的起點, 有如當年

 統計報表-全院及各單位均可設定日期區間監測 MDROs 數量趨勢:(1)泡泡圖:可設定菌種數量級 距及泡泡呈現的大小,以便從統計圖上監測

以下簡單介紹魔術三角形: 如圖 1, 若三角形每邊有 三個數且數字和都是定值, 稱為 3 階 (傳統) 魔術三角形; 如圖 2, 若每邊有三 個數且較大兩數和減最小數的差都是定值, 稱為

但是讀者還是應該可以揣測出 n 重積分的 Fubini 定理...

如果函數是由基本函數所組成,至少需要注意:分式函 數分母會等於 0

[r]

整數數量乘以分數, 理解為將整數(例如: 9個) 數量按分母(例如: 3)均分, 並按分子(例如: 1) 取多少份,

強制轉型:把 profit轉換成double的型態