國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
7
第二章 四分位數定義說明
本章旨在說明四分位數的定義於國中、高中版本之差異,及大學統計學教科 書、電腦統計軟體等許多不同的計算公式。
第一節 四分位數相關定義及計算公式說明
從統計學的觀點而言,在定義各種位數(如中位數、四分位數、百分位數 等)時,基本上是架構在連續型的隨機變數,來進行理論上的探討。由於是連續 型的隨機變數,因此這些統計量基本上是唯一確定的。不過實務上我們所取得的 資料基本上都是離散型的,因此如何取得這些統計數值,便衍生出許多不同的操 作定義。以下依學習階段(國中—高中—大學)介紹各家版本定義及計算方法。一、國中版本
因國中版本架構是將中位數、四分位數視為某一個百分位數,因此先討論百 分位數,再介紹四分位數。
(一)百分位數定義及計算方法 1. 百分位數的理論定義:
在統計學上當機率密度函數是連續函數時,則其基本的定義是:
( )=
滿足這個式子的 ,稱為這個資料的第 k 百分位數。顯然,當 k=50、25、
75 時,此時 就是這份資料的中位數、第一四分位數、第三四分位數。
不過,當一般的機率密度函數不見得是連續函數,滿足上述定義的 不見得 會存在,因此 Galton(1885)用的是一個比較弱的定義,以保證 的存在性:
(1) 至少有 k % 之觀察值(樣本)小於或等於 ,
(2) 至少有 (100-k ) % 之觀察值(樣本)大於或等於 。
亦 即 - 。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
8
2.操作定義:
國中版本:(A)康軒、南一、翰林(B)部編
(A)
版本說明 康軒、南一、翰林
定 義註 3 (1) 利用累積相對次數註 41%、2%、3%、…、99%,將資料 均分成 100 等分,中間 99 個分割點所得到對應的數值,
這些數值就稱為第 1、2、……、98、99 百分位數。
(2) 如果一群資料中至少有 k%的資料值小於或等於某個數 值 ,也至少有(100-k)%的資料大於或等於該數值
,那麼這個數值 就稱為這群資料的第 k 百分位數,
其中 k 是正整數,且 1≦k≦99。
計算方法 未分組資料:
假設有 N 個數的一群資料,將資料由小到大排列後,再求 N × 的值,令此值為 i。
如果 (正整數),而 m 是大於 i 的最小整數,那麼 排列在第 m 位的資料值就是這群資料的第 k 百分位數。
如果 i (正整數),那麼排列第 i 位與第 i+1 位的資 料值的算數平均數,就是這群資料的第 k 百分位數。
註 3:康軒、南一、翰林等定義及計算方法相同,故做同一討論。
註 4:「累積相對次數」是先求其相對次數,再求累積相對次數,即依序累加至各筆或各組的相對次數。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
9
示例與 說明
未分組資料:
(一)百分位數的求法(N × 為正整數)
【例】:一組資料有 30 個連續奇數:1、3、5、7、9、11、13…57、
59;求該組資料的第 30 百分位數。
解:設第 30 百分位數為 ,
1. 30 × 30%=9,表示這組資料中至少要有 9 個數小於或等於 P30,參考上表:資料由小排到大的第 9 的筆數值是 17。
(1) 若 =17,則小於或等於 17 的數共有 9 個。
(2) 若 =17.1,則小於或等於 17.1 的數共有 9 個。
(3) 其它:如 =17. 2、17.3、17.4…等也都符合條件。
亦即所有大於或等於 17 的數都可能是 : ≧17……○1 2. 30 ×(1-30%)=21,表示這組資料中至少要有 21 個數大於
或等於 ,參考上表:資料由大排到小的第 21 的筆數值是 19。
(1)若 =19,則大於或等於 19 的數共有 21 個。
(2)若 =18.9,則大於或等於 18.9 的數共有 21 個。
(3)其它:如 =18.8、18.7、18.6…等也都符合條件。
亦即所有小於或等於 19 的數都可能是 : ≦19……○2 由○1 和○2 知:17≦ ≦19,也就是說介於第 12 筆與第 13 筆 之間的所有數值都可以是這組資料的第 30 百分位數。通常以 17 和 19 的平均來表示,亦即 18 來表示第 30 百分位數。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
10
(二)百分位數的求法(N × 不為正整數)
【例】:一組資料有 30 個連續奇數:1、3、5、7、9、11、13…57、
59;求該組資料的第 69 百分位數。
解:設第 69 百分位數為 P69,
1. 30 × 69%=20.7,表示這組資料中至少要有 20.7 個數(取整 數 21 個)小於或等於 P69,參考上表:資料由小排到大的第 21 筆數值是 41。
(1)若 P69=41,則小於或等於 41 的數共有 21 個。
(2)若 P69=41.1,則小於或等於 41.1 的數共有 21 個。
(3)其它:如 P69=41.2、41.3、41.4…等也都符合條件。
亦即所有大於或等於 41 的數都可能是 P69:P69≧41……○1 2. 30 ×(1-69%)=9.3,表示這組資料中至少要有 9.3 個數(取
整數 10 個)大於或等於 P69,參考上表:資料由大排到小的 第 10 的筆數值是 41。
(1)若 P69=41,則大於或等於 41 的數共有 10 個。
(2)若 P69=40.9,則大於或等於 40.9 的數共有 10 個。
(3)其它:如 P69=40.8、40.7、40.6…等也都符合條件。
亦即所有小於或等於 41 的數都可能是 P69:P69≦41……○2 由○1 和○2 知:這組資料的第 69 百分位數是 41。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
11
(B)
註 5:部編版之計算方法與其他三家版本不同,但計算結果相同。
註 6:「相對累積次數」是先找出累積次數,再求其相對累積次數。即將累加至各筆或各組資料的次數除以 總次數所得的比值。
註 7:部編版百分位數的的規則證明,在部編版教師手冊中有更詳細的說明,提供參考。
版本說明 部編註 5
定 義 將整份資料由小排到大,畫一個全長為 1 並做 100 等分的參考尺。
則刻度 所指的資料就是 ,除非 正好指在兩個資料的中間(這 時 N 是 100 的倍數),此時 是這兩筆資料的平均。
# ai
# ai
-
其中 N 是資料總筆數,# ai 表示小於或等於ai的資料 數目。
計算方法 百分位數可以利用相對累積次數分配表來求得。為了敘述方便,
將用符號來表示。
i:資料次序, ai:第 i 個資料值,ni:資料值ai出現的次數,
li:從a1到ai的累積次數, :相對累積次數(
N
qi li ),N:資 料總筆數,如下表:
求第 k 百分位數的規則註 7(其中 k =1、2、……、99):
(1)如果有 qi正好等於 ,則第 k 百分位數 = + 。
(2)如果 - < < (或 < ),則第 k 分位數 = (或a1)。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
12
示例與 說明
未分組資料:
(一)百分位數的求法(qi等於
)
【例】:一組資料有 30 個連續奇數:1、3、5、7、9、11、 3… 7、
59;求該組資料的第 30 百分位數。
解:設第 30 百分位數為 ,
資料值: =17, =19,次數: =1, =1,
累積次數: =9, =10,相對累積次數: =
3 , =
3 , 由於 = 3 = 3 所以 = + = + =18 。
(二)百分位數的求法(qi不等於
)
【例】:同上,求該組資料的第 69 百分位數。
解:設第 69 百分位數為 ,
資料值: =39, =41,次數: =1, =1,
累積次數: =20, =21,相對累積次數: =
3 , =
3 , 由於 =
3 < < =
3 = 所以 = =41 。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
13
綜合上述討論,可歸納如下:
(1)康軒版、南一版、翰林版之百分位數定義與計算方法是相同的。
(2)部編版之百分位數計算方法與其它三個版本不同且複雜,但都可以了解個 別資料在一群資料中的相對位置。例如:全國國三同學的身高資料、體重 資料或者基測的分數資料,在這些情況中,資料的相對次數,或累積相對 次數一般都用「百分率」來表示,因此很自然的會考慮以相對應的百分位 數,來分析資料的分佈狀況。
(3)康軒(南一、翰林)、部編「未分組資料」百分位數之求法:
除了利用上述兩種百分位數公式計算以外,還可利用「累積百分率圖」反 求之,即:由縱軸之百分率 P 的位置作一水平線與圖中之階梯狀線相交,
由交集做鉛直線取得之橫軸之區間,若求之值為唯一解,則為其百分位數。
若反求之值不唯一,則取其中點。(95 正式綱要)
【例】:原始資料為 21,23,23,26,28,33 之累積相對次數分配圖次數表。
累積相對次數分配圖(又稱經驗分配圖)
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
14
(1)75 百分位數為 28。
(2)50 百分位數可為〔23, 26〕中之任何值,其取法不唯一;但為能配合九年一 貫能力指標 9-d-07 中中位數之慣用求法,則取中點 24.5 為 50 百分位數。
【說明】:
75 百分位數=28 5/6>0.83≧0.75 2/6>0.33≧0.25 50 百分位數=23 3/6=0.5 ≧0.5 5/6>0.83≧0.5 50 百分位數=24.5 3/6=0.5 ≧0.5 3/6=0.5 ≧0.5 50 百分位數=26 4/6>0.66≧0.5 3/6=0.5≧0.5
(二)四分位數定義及計算方法
國中版本:(A)康軒、南一、翰林(B)部編
(A)
版本說明 康軒、南一、翰林註 8
定 義註 9 將資料由小到大排列後,可以找到 3 個數值將整群資料分成四 個部分,這四個部分的資料個數「大致」一樣多。這 3 個等分 的點分別稱為第一四分位數(Q 1)、第二四分位數(Q 2)、第三 四分位數(Q 3)四分位數。亦即
( 1)至少有四分之一的資料小於或等於 Q1,也至少有四分之三的 資料大於或等於 Q1,Q1也稱為這群資料的第 25 百分位數。
( 2)Q2就是中位數,也稱為第 50 百分位數。
( 3)至少有四分之三的資料小於或等於 Q3,也至少有四分之一 的資料大於或等於 Q3,Q3也稱為這群資料的第 75 百分位數。
Q1、Q2、Q3在整體資料位置的分布情形如下圖,第三四分位數 與第一四分位數的差(Q3-Q1)稱為四分位距(簡稱 IQR)。
註 8:康軒、南一、翰林之定義及計算方法相同,故做同一討論。
註 9:此處四分位數定義是以南一版為代表,即將資料等分成四段來定義,但計算埰百分位數方法即 Q1 以 25 百分位數、Me以 50 百分位數、Q3以 75 百分位數來定義,所以 Q1 、Me、Q3是百分位數的特例。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
15
計算方法 假設一群未分組的資料共有 N 個數值,先將資料按照由小到大 的順序排列:令 = N × , r =1﹐2﹐3), :第 四 分位數位置
( 1)如果 (正整數),而 m 是大於 的最小整數,那 麼排在第 m 位的資料值就是這群資料的第 r 四分位數。
( 2 )如果 (正整數),那麼排列在第 位與第 +1 位的資料值的算數平均數就是這群資料的第 r 四分位數。
示例與 說明
【例 1】: N=9:2、2、3、3、3、4、5、6、7 令 =9 × =2 , =9 × =6 則 Q1= =3 , Q3= =5
【例 2】:N=12:0、0、0、0、0、1、1、1、1、2、4、10 令 =12 × =3, =12 × =9
則 Q1= + = + =0 , Q3= + = + =
(B)
版本說明 部編註 10
定 義 將資料依序由小到大排列,然後模仿取中位數的想法,標出資 料由左往右
4 1 和
4
3 的位置。其中標 4
1 的位置把資料切成兩部分,
註 10:部編版之計算方法與其他三家版本不同,但計算結果相同。
‧
‧
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
19
若qi1< <q(此時 N 是奇數)i ,則 Q2= ,表示資料依序的中點在 資 料中,所以和中位數的取法也一樣。
(4)國中版本所採用的定義,有一個特色,它不但是一個一致的方法,可以套 用到二分位數(即中位數)、四分位數、百分位數等 N 分位數,而且它所 取得的值都是一致的,譬如說二分位數等於第二四分位數,也等於第 50 百 分位數。又例如第一四分位數就是第 25 百分位數,第三四分位數就是第
75 百分位數。
二、高中版本
高中總計有龍騰、康熙、全華、翰林、南一、三民等版本,不過四分位數的計 算方法可以歸納成兩種:其一為南一、三民仍採用國中公式(百分位數)。其他 一律採用龍騰(康熙、全華、翰林)版本為代表的高中四分位數公式。
(A)
版本說明 龍騰、康熙、全華、翰林
定 義
龍騰:(1)所謂四分位數,就是將資料從小到大排列後,分成 四等分的分界點。
(2)當資料為連續數值時,四分位數的定義方式與中位 數定義在第 50 百分位所在的位置類似,即第一四分位數 Q1 是第 25 百分位數所在的位置,第三四分位數 Q3是第 75 百分位數所在的位置。
康熙:假設一筆數量資料 X 共有 N 項,經重排大小次序得:
≦ ≦ ≦……≦
將已排序的資料等分成四段,其中有三個分界點,最小
將已排序的資料等分成四段,其中有三個分界點,最小