在前面的單元當中,我們學了一些統計量:「眾數」、「平均數」、
「中位數」,它們都可以拿來代表整組數據,以下分別為班上的二次 數學段考成績(分):
第一次
(12個) 59、60、64、65、67、70、72、74、75、76、78、80
第二次
(12個) 58、61、67、68、69、71、71、72、72、73、77、81 請比較看看這兩次的段考成績有沒有什麼差異?
先來看看最簡單的統計量「眾數」:
在第一次段考成績中,所有的數字都剛好出現 1 次,所以沒有眾數;
而第二次段考成績中, 71、72 都出現了 2 次,所以眾數是 71、72。
再來看看另外一個統計量「平均數」:
這兩次段考的平均其實在單元三的課文 B 已經計算過了,
第一次段考成績的所有總和是 840,總共有 12 個資料,
所以第一次段考成績的平均是 840 ÷ 12 = 70;
而第二次段考成績的所有總和也是 840,同樣有 12 個資料,
所以第二次段考成績的平均也是 840 ÷ 12 = 70。
最後一個是「中位數」:
12
2 = 6,將這 12 個資料由小排到大,代表前面有 6 個、後面有 6 個,
取第 6、7 個資料的平均當中位數!
59、60、64、65、67、70、72、74、75、76、78、80
中位數
58、61、67、68、69、71、71、72、72、73、77、81
中位數
算出兩組資料的「眾數」、「平均數」、「中位數」之後,
能夠利用這些數據說明出這兩組資料的差異嗎?
我們可以發現沒有辦法完全利用「眾數」、「平均數」、「中位數」
這三個統計量來描述這兩組資料,因為這兩組資料的「平均數」與
「中位數」皆相同,但是數值的差異卻非常大,此時我們可以用其 他方法來分析數值分布的情形。
我們可以分別找找看這兩組數據的最大值及最小值!
第一次
(12個) 59、60、64、65、67、70、72、74、75、76、78、80
第二次
(12個) 58、61、67、68、69、71、71、72、72、73、77、81 這兩組數據的最大值及最小值相差多少呢?
第一次段考的最大值及最小值相差 80 − 59 = 21,
第二次段考的最大值及最小值相差 81 − 58 = 23。
而這個最大數值與最小數值的差我們就稱為「全距」。
小安根據兩次段考資料數據的全距做出推論,你認為正確嗎?
如果只單純從資料的最大值和最小值去做推論,好像不是那麼的準確,
所以我們會希望想要再多一點對資料的描述。
在單元三課文 C 當中,有介紹到中位數的概念,中位數的想法就是 將整組資料分成兩半,利用中位數來敘述資料一半的狀況。
現在我們再將資料多做分割,根據資料的個數等分成 4 等分,例如 第一次段考有 12 個資料,想想看要如何將這組資料分成 4 等分?
我們知道「第一次段考的全距是 21、第二次段考的全距是 23」,
所以應該第二次段考的資料比較分散囉?
小安
59、60、64、65、67、70、72、74、75、76、78、80
要將這組 12 個資料分成 4 等分,需要 3 個等分點:
這三個等分點的值分別會是多少呢?
第一個等分點的值會在由小排到大的第 3 個與第 4 個資料中間,第 3 個資料是 64、第 4 個資料是 65,我們取 64 與 65 的平均值 64.5 當作等分點,而這一個等分點就稱為第 1 四分位數(可以記做 Q1)。
第二個等分點稱為第 2 四分位數(記做 Q2),它剛好可以把整組資料 分成兩半,也就是中位數。第一次段考的中位數剛剛有計算過,就是 71。
第三個等分點的值會在由小排到大的第 9 個與第 10 個資料中間,
第 9 個資料是 75、第 10 個資料是 76,我們取 75 和 76 的
平均值 75.5 當作等分點,這個等分點就稱為第 3 四分位數(記做 Q3)。
59、60、64、65、67、70、72、74、75、76、78、80
59、60、64、65、67、70、72、74、75、76、78、80
64.5
71 75.5我們利用這三個四分位數加上最大最小值,就能夠大約將整組資料的
在第一、二單元時,利用了一些圖像讓我們更方便知道資料的情況。
現在我們試著用一個統計圖形來表示整組資料的狀況!
先畫出第一次段考的統計圖形,我們利用直線標示出最小值、Q1、Q2、 Q3、最大值,再將 Q1、Q2、Q3 以長方形連接起來:
這個圖形看起來像盒子的形狀,所以我們稱它為「盒狀圖」。
從盒狀圖可以知道最小值、Q1、Q2、Q3、最大值,也可以看出大致的 分布情形。
利用同樣的方式,可以畫出第二次段考的盒狀圖:
將兩組資料的盒狀圖放在一起比較看看,你能說出這兩組資料分布 的差異嗎?