• 沒有找到結果。

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

7

第二章 四分位數定義說明

本章旨在說明四分位數的定義於國中、高中版本之差異,及大學統計學教科 書、電腦統計軟體等許多不同的計算公式。

第一節 四分位數相關定義及計算公式說明

從統計學的觀點而言,在定義各種位數(如中位數、四分位數、百分位數 等)時,基本上是架構在連續型的隨機變數,來進行理論上的探討。由於是連續 型的隨機變數,因此這些統計量基本上是唯一確定的。不過實務上我們所取得的 資料基本上都是離散型的,因此如何取得這些統計數值,便衍生出許多不同的操 作定義。以下依學習階段(國中—高中—大學)介紹各家版本定義及計算方法。

一、國中版本

因國中版本架構是將中位數、四分位數視為某一個百分位數,因此先討論百 分位數,再介紹四分位數。

(一)百分位數定義及計算方法 1. 百分位數的理論定義:

在統計學上當機率密度函數是連續函數時,則其基本的定義是:

( )=

滿足這個式子的 ,稱為這個資料的第 k 百分位數。顯然,當 k=50、25、

75 時,此時 就是這份資料的中位數、第一四分位數、第三四分位數。

不過,當一般的機率密度函數不見得是連續函數,滿足上述定義的 不見得 會存在,因此 Galton(1885)用的是一個比較弱的定義,以保證 的存在性:

(1) 至少有 k % 之觀察值(樣本)小於或等於 ,

(2) 至少有 (100-k ) % 之觀察值(樣本)大於或等於 。

亦 即

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

8

2.操作定義:

國中版本:(A)康軒、南一、翰林(B)部編

(A)

版本說明 康軒、南一、翰林

定 義註 3 (1) 利用累積相對次數註 41%、2%、3%、…、99%,將資料 均分成 100 等分,中間 99 個分割點所得到對應的數值,

這些數值就稱為第 1、2、……、98、99 百分位數。

(2) 如果一群資料中至少有 k%的資料值小於或等於某個數,也至少有(100-k)%的資料大於或等於該數值

,那麼這個數值 就稱為這群資料的第 k 百分位數,

其中 k 是正整數,且 1≦k≦99。

計算方法 未分組資料:

假設有 N 個數的一群資料,將資料由小到大排列後,再求 N × 的值,令此值為 i。

 如果 (正整數),而 m 是大於 i 的最小整數,那麼 排列在第 m 位的資料值就是這群資料的第 k 百分位數。

 如果 i (正整數),那麼排列第 i 位與第 i+1 位的資 料值的算數平均數,就是這群資料的第 k 百分位數。

註 3:康軒、南一、翰林等定義及計算方法相同,故做同一討論。

註 4:「累積相對次數」是先求其相對次數,再求累積相對次數,即依序累加至各筆或各組的相對次數。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

9

示例與 說明

未分組資料:

(一)百分位數的求法(N × 為正整數)

【例】:一組資料有 30 個連續奇數:1、3、5、7、9、11、13…57、

59;求該組資料的第 30 百分位數。

解:設第 30 百分位數為

1. 30 × 30%=9,表示這組資料中至少要有 9 個數小於或等於 P30,參考上表:資料由小排到大的第 9 的筆數值是 17。

(1) 若 =17,則小於或等於 17 的數共有 9 個。

(2) 若 =17.1,則小於或等於 17.1 的數共有 9 個。

(3) 其它:如 =17. 2、17.3、17.4…等也都符合條件。

亦即所有大於或等於 17 的數都可能是 ≧17……○1 2. 30 ×(1-30%)=21,表示這組資料中至少要有 21 個數大於

或等於 ,參考上表:資料由大排到小的第 21 的筆數值是 19。

(1)若 =19,則大於或等於 19 的數共有 21 個。

(2)若 =18.9,則大於或等於 18.9 的數共有 21 個。

(3)其它:如 =18.8、18.7、18.6…等也都符合條件。

亦即所有小於或等於 19 的數都可能是 ≦19……○2 由○1 和○2 知:17≦ ≦19,也就是說介於第 12 筆與第 13 筆 之間的所有數值都可以是這組資料的第 30 百分位數。通常以 17 和 19 的平均來表示,亦即 18 來表示第 30 百分位數。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

10

(二)百分位數的求法(N × 不為正整數)

【例】:一組資料有 30 個連續奇數:1、3、5、7、9、11、13…57、

59;求該組資料的第 69 百分位數。

解:設第 69 百分位數為 P69

1. 30 × 69%=20.7,表示這組資料中至少要有 20.7 個數(取整 數 21 個)小於或等於 P69,參考上表:資料由小排到大的第 21 筆數值是 41。

(1)若 P69=41,則小於或等於 41 的數共有 21 個。

(2)若 P69=41.1,則小於或等於 41.1 的數共有 21 個。

(3)其它:如 P69=41.2、41.3、41.4…等也都符合條件。

亦即所有大於或等於 41 的數都可能是 P69:P69≧41……○1 2. 30 ×(1-69%)=9.3,表示這組資料中至少要有 9.3 個數(取

整數 10 個)大於或等於 P69,參考上表:資料由大排到小的 第 10 的筆數值是 41。

(1)若 P69=41,則大於或等於 41 的數共有 10 個。

(2)若 P69=40.9,則大於或等於 40.9 的數共有 10 個。

(3)其它:如 P69=40.8、40.7、40.6…等也都符合條件。

亦即所有小於或等於 41 的數都可能是 P69:P69≦41……○2 由○1 和○2 知:這組資料的第 69 百分位數是 41。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

11

(B)

註 5:部編版之計算方法與其他三家版本不同,但計算結果相同。

註 6:「相對累積次數」是先找出累積次數,再求其相對累積次數。即將累加至各筆或各組資料的次數除以 總次數所得的比值。

註 7:部編版百分位數的的規則證明,在部編版教師手冊中有更詳細的說明,提供參考。

版本說明 部編註 5

定 義 將整份資料由小排到大,畫一個全長為 1 並做 100 等分的參考尺。

則刻度 所指的資料就是 ,除非 正好指在兩個資料的中間(這 時 N 是 100 的倍數),此時 是這兩筆資料的平均。

ai

ai

其中 N 是資料總筆數,# ai 表示小於或等於ai的資料 數目。

計算方法 百分位數可以利用相對累積次數分配表來求得。為了敘述方便,

將用符號來表示。

i:資料次序, ai:第 i 個資料值,ni:資料值ai出現的次數,

li:從a1ai的累積次數, :相對累積次數(

N

qili,N:資 料總筆數,如下表:

求第 k 百分位數的規則註 7(其中 k =1、2、……、99):

(1)如果有 qi正好等於 ,則第 k 百分位數

(2)如果 < (或 < ),則第 k 分位數 = (或a1)。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

12

示例與 說明

未分組資料:

(一)百分位數的求法(qi等於

【例】:一組資料有 30 個連續奇數:1、3、5、7、9、11、 3… 7、

59;求該組資料的第 30 百分位數。

解:設第 30 百分位數為

資料值: =17, =19,次數: =1, =1,

累積次數: =9, =10,相對累積次數: =

3

3 由於 = 3 3 所以 =18 。

(二)百分位數的求法(qi不等於

【例】:同上,求該組資料的第 69 百分位數。

解:設第 69 百分位數為

資料值: =39, =41,次數: =1, =1,

累積次數: =20, =21,相對累積次數:

3

3 由於

3

3 所以 =41 。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

13

綜合上述討論,可歸納如下:

(1)康軒版、南一版、翰林版之百分位數定義與計算方法是相同的。

(2)部編版之百分位數計算方法與其它三個版本不同且複雜,但都可以了解個 別資料在一群資料中的相對位置。例如:全國國三同學的身高資料、體重 資料或者基測的分數資料,在這些情況中,資料的相對次數,或累積相對 次數一般都用「百分率」來表示,因此很自然的會考慮以相對應的百分位 數,來分析資料的分佈狀況。

(3)康軒(南一、翰林)、部編「未分組資料」百分位數之求法:

除了利用上述兩種百分位數公式計算以外,還可利用「累積百分率圖」反 求之,即:由縱軸之百分率 P 的位置作一水平線與圖中之階梯狀線相交,

由交集做鉛直線取得之橫軸之區間,若求之值為唯一解,則為其百分位數。

若反求之值不唯一,則取其中點。(95 正式綱要)

【例】:原始資料為 21,23,23,26,28,33 之累積相對次數分配圖次數表。

累積相對次數分配圖(又稱經驗分配圖)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

14

(1)75 百分位數為 28。

(2)50 百分位數可為〔23, 26〕中之任何值,其取法不唯一;但為能配合九年一 貫能力指標 9-d-07 中中位數之慣用求法,則取中點 24.5 為 50 百分位數。

【說明】:

75 百分位數=28 5/6>0.83≧0.75 2/6>0.33≧0.25 50 百分位數=23 3/6=0.5 ≧0.5 5/6>0.83≧0.5 50 百分位數=24.5 3/6=0.5 ≧0.5 3/6=0.5 ≧0.5 50 百分位數=26 4/6>0.66≧0.5 3/6=0.5≧0.5

(二)四分位數定義及計算方法

國中版本:(A)康軒、南一、翰林(B)部編

(A)

版本說明 康軒、南一、翰林註 8

定 義註 9 將資料由小到大排列後,可以找到 3 個數值將整群資料分成四 個部分,這四個部分的資料個數「大致」一樣多。這 3 個等分 的點分別稱為第一四分位數(Q 1、第二四分位數(Q 2)、第三 四分位數(Q 3)四分位數。亦即

( 1)至少有四分之一的資料小於或等於 Q1,也至少有四分之三的 資料大於或等於 Q1,Q1也稱為這群資料的第 25 百分位數。

( 2)Q2就是中位數,也稱為第 50 百分位數。

( 3)至少有四分之三的資料小於或等於 Q3,也至少有四分之一 的資料大於或等於 Q3,Q3也稱為這群資料的第 75 百分位數。

Q1、Q2、Q3在整體資料位置的分布情形如下圖,第三四分位數 與第一四分位數的差(Q3-Q1)稱為四分位距(簡稱 IQR)。

註 8:康軒、南一、翰林之定義及計算方法相同,故做同一討論。

註 9:此處四分位數定義是以南一版為代表,即將資料等分成四段來定義,但計算埰百分位數方法即 Q1 25 百分位數、Me以 50 百分位數、Q3以 75 百分位數來定義,所以 Q1 MeQ3是百分位數的特例。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

15

計算方法 假設一群未分組的資料共有 N 個數值,先將資料按照由小到大 的順序排列:令 = N × , r =1﹐2﹐3), :第 四 分位數位置

( 1)如果 (正整數),而 m 是大於 的最小整數,那 麼排在第 m 位的資料值就是這群資料的第 r 四分位數。

( 2 )如果 (正整數),那麼排列在第 位與第 +1 位的資料值的算數平均數就是這群資料的第 r 四分位數。

示例與 說明

【例 1】: N=9:2、2、3、3、3、4、5、6、7 令 =9 × =2 , =9 × =6 則 Q1=3 , Q3= =5

【例 2】:N=12:0、0、0、0、0、1、1、1、1、2、4、10 令 =12 × =3, =12 × =9

則 Q1=0 , Q3

(B)

版本說明 部編註 10

定 義 將資料依序由小到大排列,然後模仿取中位數的想法,標出資 料由左往右

4 1 和

4

3 的位置。其中標 4

1 的位置把資料切成兩部分,

註 10:部編版之計算方法與其他三家版本不同,但計算結果相同。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

19

 若qi1< <q(此時 N 是奇數)i ,則 Q2= ,表示資料依序的中點在 資 料中,所以和中位數的取法也一樣。

(4)國中版本所採用的定義,有一個特色,它不但是一個一致的方法,可以套 用到二分位數(即中位數)、四分位數、百分位數等 N 分位數,而且它所 取得的值都是一致的,譬如說二分位數等於第二四分位數,也等於第 50 百 分位數。又例如第一四分位數就是第 25 百分位數,第三四分位數就是第

75 百分位數。

二、高中版本

高中總計有龍騰、康熙、全華、翰林、南一、三民等版本,不過四分位數的計 算方法可以歸納成兩種:其一為南一、三民仍採用國中公式(百分位數)。其他 一律採用龍騰(康熙、全華、翰林)版本為代表的高中四分位數公式。

(A)

版本說明 龍騰、康熙、全華、翰林

定 義

龍騰:(1)所謂四分位數,就是將資料從小到大排列後,分成 四等分的分界點。

(2)當資料為連續數值時,四分位數的定義方式與中位 數定義在第 50 百分位所在的位置類似,即第一四分位數 Q1 是第 25 百分位數所在的位置,第三四分位數 Q3是第 75 百分位數所在的位置。

康熙:假設一筆數量資料 X 共有 N 項,經重排大小次序得:

≦ ≦ ≦……≦

將已排序的資料等分成四段,其中有三個分界點,最小

將已排序的資料等分成四段,其中有三個分界點,最小

相關文件