4 一幅圖真的相當於千言萬語
|
為什麼要用圖形表達資料?
現在將要做的是檢視集中趨勢測量數和變 異性測量數這兩種測量數的差異,如何造 成在圖形中不同的外形分布。
|
達到一張好圖的十種方法 1.圖中無用的內容減至最少
2.圖在你開始製作最後版本的圖之前要 先籌劃你的草圖
3.說出你的打算並且指出你想說的-不 多不少
4.幫所有的內容加上標記,不要留下任
何讓讀者誤解的內容
5.一個圖應該只傳遞一個觀點 6.保持平衡
7.維持圖中比例 8.簡單就是最好 9.限制你的用字數
10.一個圖本身應該能夠傳遞你想要說 的內容
|
第一要事:首先是建立一個次數分配
用圖說明資料的最基本方式就是建立次數 分配。次數分配是計算和展現特定數據出 現頻繁情況的一種方法。
在建立次數分配的過程中,數據通常聚集 成組間或數值範圍。
2.4 次數分配
|
所謂次數分配(frequency
distribution)是指將資料依數量大小 或類別種類而分成若干組,並列出各組 所含次數(即各組所含觀測值的個數),
最後再以次數分配圖表(或其他的處理 方式)表示之。
|
次數分配表(frequency table)可分成簡
單次數表(類別資料的次數分配)和分
組次數表(數量資料的次數分配)。
– 步驟:
1:排序 (sorting) 2:劃記 3:計算次數 4:總計
|類別資料的次數分配 - 簡單次數表
z類別資料的次數分配表
依照類別分別排列,並計算各個類別的元素出現的次數的 統計表稱為類別資料的次數分配表。
z類別資料的相對次數
) ( 總次數 所有類別的次數總合
某類別的次數 某類別的相對次數=
‧類別資料的圖形表現
長條圖(煙囪圖)、餅狀圖(圓形圖)
Nokia 28%
Motorola Ericsson 17%
15%
Siemens 13%
Acer 9%
其他 7%
Philips 0 11%
2 4 6 8 10 12 14
NokiaM otorola Ericsson SiemensPhilips Acer 其他 手機品牌 次
數
長條圖(煙囪圖)
| 當統計資料為類別或間斷型資料時,則通常會使用長 條圖(bar chart)表示之,其又可簡稱為條圖
| 長條圖依排列方式可分為縱條圖與橫條圖
縱條圖
0 5 10 15 20 25 30 35 40
彩色電視 錄影機 VCD
橫條圖
5%
15%
17%
50%
13%
0% 10% 20% 30% 40% 50% 60%
愛情小說 武俠小說 電玩雜誌 漫畫 其他
課外讀物之喜愛度
長條圖(續)
| 長條圖的種類有分段條圖、條線混合圖等
線條混和圖
金融、證券電信、醫療服務及製造等業別因應公元兩千年年序危機 執行情形統計表
(基準日:87年10月)
百 分 比
金融業 證券業 電信業 醫療服務業 醫療服務業 製造業 (醫院管理) (醫療儀器)
有效資料數 (469家) (206家) (5家) 準區域級以上醫院(51家) 總計1276家
無年序問題 已完成 測試中 修改中 清查中 擬訂計畫中
條線混合圖
圓餅圖(圓形圖)
圓餅圖
22.80%
16.90%
12.40%
4.30%
3.30%
40.30%
美國 日本 香港 德國 韓國 其他
| 圓餅圖又稱為面積圖(pie chart)
| 圓形的面積代表總數,圖形內的各扇形面積代表各 部分數量
| 例如1998年1-12月我國前五大貿易國
分組次數表(數量資料的次數分配)
| 資料編成分組次數分配表時,有兩個重要 基本假設:
1. 集中分配:各組觀測值都等於組中點。
2. 均勻分配:各組觀測值都是以均勻分佈在組內。
**以下分組次數分配表之編製方法與教科書所列方 法略有不同,請以投影片的方法為準。
周延原則 互斥原則
分組次數分配表之編製步驟:
(1) 排序
(2) 求全距(range) ,R = Xmax- Xmin (3) 決定組數 k
‧適當的組數,宜由個人判斷或經驗決定
‧使用下列任一公式求組距
或 求2k> n 之最小k值 (4) 決定組距
組距 h = 全距/組數 = R/k (注意:h*k > R)
(5) 決定各組組界及組中點
#1下限:L1= xmin– (h*k – R)/2; #1上限:U1= L1+ h
#i組下限:Li= Ui-1; #i組上限:Ui= Li+ h,
#i組中點:mi= (Li+ Ui)/2 (6) 劃記並統計各組之次數
1 log 1 3.322 log log 2
k = + n = + n
(例)分組次數分配編製步驟:
(1) 資料排序: 33, 35,………., 94, 98 (2) 全距: R = 98-33 = 65
(3) 組數 k = 1 + 3.322log(50) = 6.6142 ≈ 6 (只取整數部分)
or 2k> N
(4) 組距 h = R/k = 65/6 = 10.8333 ≈ 11
(確定:h*k > R Î 11*6 = 66 > 65)
(5) 決定各組組界及組中點:
#1下限:L1=Xmin– (h*k – R)/2
=33 – (66-65)/2 = 32.5
#1上限:U1= L1+ h
= 32.5 + 11 = 43.5
#1組中點:m1= (L1+ U1)/2
= (32.5+43.5)/2 = 38
(5) 劃記並統計各組之次數 6 87.5 ≤ x < 98.5 93 76.5 ≤ x < 87.5 82 5
65.5 ≤ x < 76.5 71 4
54.5 ≤ x < 65.5 60 3
43.5 ≤ x < 54.5 49 2
32.5 ≤ x < 43.5 38 1
組中點 組 限
組別#
|
相對次數分配表
是指各組次數佔總次數的比例分配。
第i組相對次數 = 第i組次數/總次數
|
累積次數分配表/累積相對次數分配表
1. 可知道落在某一特定值之上或之下的累積次數 有若干
2. 方便計算某些特定的敘述統計量,如中位數、
四分位數等
3. 累積(相對)次數分配可分成二類:
以下(相對)累積次數分配 以上(相對)累積次數分配
組別
# i
組 限 (L1≤ x < U1)
組中點
xmi 劃記 次數
fi
相對 次數 rfi
以下累 積次數
以下累 積相對 次數
以上累 積次數
以上累 積相對 次數
1 32.5 ≤ x < 43.5 38 //// // 7 0.14 7 0.14 50 1.0
2 43.5 ≤ x < 54.5 49 //// // 7 0.14 14 0.28 43 0.86
3 54.5 ≤ x < 65.5 60 //// //// / 11 0.22 25 0.50 36 0.72
4 65.5 ≤ x < 76.5 71 //// //// / 11 0.22 36 0.72 25 0.50
5 76.5 ≤ x < 87.5 82 //// /// 8 0.16 44 0.88 14 0.28
6 87.5 ≤ x < 98.5 93 //// / 6 0.12 50 1.0 6 0.12
總計 -- -- -- 50 1.0 -- -- -- --
例
2.5 次數分配的圖示法
z統計圖中最常見的有直方圖、多邊形圖、累積 次數曲線圖、長條圖、圓餅圖等
‧ 直方圖
‧以組界為橫座標 ,資料的次數為縱座標所形成的 矩形圖
‧ 多邊形圖
‧又稱為次數曲線圖(frequency curve)
‧是以各組組中點為橫座標,各組次數為縱座標所 繪製成的次數分配圖
‧若將縱座標改為相對次數即為相對次數多邊形圖
2.5 次數分配的圖示法(續)
‧累積次數曲線
‧以下累積次數曲線:以各組之上組界為橫座標
‧以上累積次數曲線:以各組之下組界為橫座標
【例2.8】承例題2.6, 試編製累積次數曲線圖
累積次數 組 界 組中點 次數
以下累積 以上累積 45.5-50.5
50.5-55.5 55.5-60.5 60.5-65.5 65.5-70.5 70.5-75.5
48 53 58 63 68 73
3 7 11 18 8 3
3 10 21 39 47 50
50 47 40 29 11 3
【例2.8】累積次數曲線圖
0 3 10 21
39
47 50 50 47
40 29
11
3 0 0
10 20 30 40 50 60
45.5 50.5 55.5 60.5 65.5 70.5 75.5
百萬元 累
積 次 數
以下累積 以上累積
長條圖與直方圖之比較
比較項目 長條圖 直方圖 矩形之寬度 無任何意義 代表組距的大小
縱座標
次數、相對次數,
但不具有「累積」
的觀念
可為次數、相對次數、
累積及相對累積次數
矩形間差異 矩形皆分開 矩形皆相連 條狀高度 皆顯示該組的次數多寡
計數方法
另外一個視覺表示(直方圖之外)可以藉 由對每一個數值出現的記錄來完成
下一步:次數多邊形圖
累積次數
一旦你已經建立了次數分配,而且已
經用直方圖或次數多邊形圖對那些資料
進行了視覺表示,另外一種選擇,就是
建立一個依組間的累積發生次數的視覺
表示。這就是累積次數分配。
累積次數多邊形圖的另一個名稱是肩 形圖。而且,如果資料是常態分配(更 多的內容見第7章),則肩形圖表示更 為大家瞭解的鐘形曲線或常態分配。
2.6 次數分配的型態
|
次數分配的型態可分為下列幾種:
z單峰對稱分配 ,又稱為鐘形分配
z單峰不對稱分配
‧右偏(右尾)分配
‧左偏(左尾)分配
zJ型分配
z其他分配 :U型分配、雙峰分配
|
扁平和細長次數分配
資料分布彼此之間在許多方面可以非常不 同。實際上,有四種不同的方式:平均 值、變異性、偏態和峰度。
平均值
我們再一次回到集中趨勢測量數。如圖 4.6所示,你會看到三個不同的分配在平 均值上如何不同。你注意到分配C的平均 值大於分配B的平均值,同樣地,分配B 的平均值大於分配A的平均值。
變異性
在圖4.7中,你可以看到具有相同平均值但 是變異性不同的三個分配。分配A的變異 性小於分配B的變異性,分配B的變異性小 於分配C的變異性。
偏態
偏態是對一個分配缺乏對稱性或者不平衡 性的一種測量。換句話說,就是分配的一 個「尾巴」比另一個長。例如在圖4.8 中,分配A的右尾比左尾長,相當於分配 的右端發生的次數較少。這是正偏態分 配。
分配C的右尾比左尾短,相當於分配的右 端發生的次數較多 ,這是負偏態分配。
峰度
峰度與一個分配看起來是如何扁平或者陡 峭有關,而且用於描述這個特徵的概念是 相對的。例如,低闊峰一詞是指一個分配 相對於常態分配或鐘形分配來說是十分的 扁平;高狹峰一詞是指一個分配相對於常 態分配或鐘形分配來說是十分的陡峭。
|