0
第零章 統計學概論
2006 年 9 月 18 日 最後修改
0.1 統計學的定義
0.2 敘述統計學與推論統計學 0.3 測量尺度
0.4 資料、資訊與因果關係
0.1 統計學的定義
統計學(Statistics)
蒐集、組織、呈現、分析與詮釋資料的科學,其目的在協助作更好的決策。
統計學作蒐集、組織、呈現、分析與詮釋等操作。
統計學操作的對象是資料(data)。
統計學的目的是協助決策。
範例 0.1 統計學如何協助決策
決策者需要有資訊才能最適當的決策。例如,行銷人員需要知道推出的新產品受歡迎
的程度,政治人物需要知道選民支持率。 ■
0.2 敘述統計學與推論統計學
統計學以操作資料的動作分成兩類:
敘述統計學(Descriptive Statistics)、推論統計學(Inferential Statistics)。
只作蒐集、組織、呈現資料之操作即可達到目的者為敘述統計學;
除以上三者外,還需作分析、詮釋資料者為推論統計學。
母體(Population)與樣本(Sample)
研究對象的全體稱為母體;
有特殊目的、使用特定方法挑選出來之母體的部分集合稱為樣本。
母體資料經蒐集、組織、呈現後即可達到瞭解研究對象的目的,此為敘述統計學;
樣本資料除蒐集、組織、呈現外,還需作分析、詮釋才能瞭解研究對象,此為推論統計學。
範例 0.2 母體與樣本
我們有興趣的研究對象稱為母體。如果我們關心企管系同學的學業表現,那麼企管系 所有的同學是母體;但是如果關心的是整個靜宜大學同學們的學業表現,則企管系同 學只是樣本。
一般而言,我們真正接觸、測量的對象是樣本。例如,在超市前的訪談對象是樣本,
電話訪談的對象也是樣本;前者的母體可能是所有的消費者,後者的母體會是所有的
投票公民。 ■
0.3 測量尺度
特徵(Characters)、屬性(Attributes)與變數(Variables)
用以描述具體研究對象的工具。
概念(Concept)、構念(Construct)、構面(Dimensions)與變數(Variables)
用以描述抽象研究對象的工具。
測量(Measurement):對某特定對象,賦予某變數一個內容(數值)。
範例 0.3 測量
執行測量之前需確定三樣東西:(1)測量對象,(2)測量特徵,(3)測量工具。以體重計 量張三的身高,或以 IQ 量表測量李四的智商,這兩句話中都包含上述的三樣東西。
這三樣東西中,測量工具的花樣最多。例如就測量體重而言,除體重計外,人腦的判 斷也是成用的測量工具。不是常聽到,這人看起來有六、七十公斤,或這人是肥胖身
材等等。 ■
四種測量尺度(Levels of Measurement)
(1)名目尺度(Nominal Level)
(2)順序尺度(Ordinal Level)
(3)等距尺度(Interval Level)
(4)比例尺度(Ratio Level)
資料(data):
資料是測量的產物。
資料一定與某變數相連結,而一筆資料裡應該會有很多個數值。
測量尺度是對資料的描述,不是對變數的描述。
測量尺度的意義:確定資料可以使用的哪些數學運算作整理。
名目尺度資料—只可計數(算出現幾次)
順序尺度資料—可以排序
等距尺度資料—可以作加、減運算
比例尺度資料—可以作比例(倍數)的運算
範例 0.4 與測量工具
測量尺度的不同是由測量工具的不同所產生。例如,用體重計測量體重可得到 75.6 公斤的比例尺度資料,用人腦判斷則只能有肥胖、中等、纖瘦等順序尺度資料。 ■
質性資料(Qualitative Data):名目尺度資料或順序尺度資料;
量化資料(Quantitative Data):等距尺度資料或比例尺度資料(可以作加、減計算)。
離散資料(Discrete Data)、連續資料(Continuous Data)
個體 測量 資料
變數 測量尺度
範例 0.5 質性資料與量化資料
質性資料、量化資料的分類,主要在於能否作數學的加、減運算;量化資料可作加減 運算,數學工具比較可以幫得上忙,因而從資料中可以獲得比較多的訊息。
另外,質性、量化是對資料的形容,不是對變數的形容。例如下列資料中
ID 性別 身高 體重 血型
1 1 高挑 73 A
2 1 高挑 65 O
3 0 中等 50 O
4 1 矮小 53 B
5 0 高挑 52 A
6 0 中等 45 AB
7 1 矮小 58 O
身高是質性資料(順序尺度),但一般身高計量出來的 170 公分、168.5 公分等是量化 資料。亦即,說身高是質性或量化都是不適當的。
最後,質性資料比量化資料容易得到。還是以測量身高為例,量化資料非有正式的身
高計不可,但質性資料只要人腦眼看判斷即可。 ■
互斥且周延(mutually exclusive and exhaustive)
測量儀器產生的測量解果必須有互斥且周延的特性。
互斥(Mutually Exclusive) 只有一種結果 周延(Exhaustive) 一定有結果
範例 0.6 互斥且周延
互斥且周延的限制,是希望測量出來會恰有一個結果(不多不少就是一個結果)。就 某特徵對企管系同學作測量,其結果為『一、二、三、四』之一是合理的,如果出現 結果為『一、二、三、A、B』之一就不合理了。前者的合理在於滿足互斥且周延的 精神。事實上如嚴格考究,若有延畢生則『一、二、三、四』就不周延了。解決之道
很簡單,加上一個『其他』項就可以了。 ■
0.4 資料、資訊與因果關係
資料(data)
測量的結果。
資訊(information)
資料分析、詮釋後的結果。
有用的資料為資訊。
資料有用與否一定涉及研究目的。
研究目的
會影響到變數、測量尺度、樣本的選擇(以蒐集資料)
會影響到組織、呈現資料之方法的選擇(以傳達某種資訊)
會影響到分析、詮釋資料的立場、角度
個體 測量 資料
變數 測量尺度
分析、詮釋 資訊
目的
統計關係(statistical association)與因果關係(causation)
範例 0.7 統計關係與因果關係
統計可以告訴我們兩個現象之間有同步變化的關連。例如,新書在架上的陳列數量與 銷售量之間呈正向關係——陳列數量多者銷售量亦多,潮水水位高低與路上交通擁塞 成度也呈正向關係。我們知道後者沒有因果關係,也就是說,控制交通擁塞並不會影 響潮水水位。前者是有因果關係,但是哪一個是因呢?陳列數量多造成銷售量高,還
是銷售量高引致陳列數量多? ■