1
第一章 緒論
• 甚麼是統計學(Statistics)?
是處理資料的科學,是一種研究方法,一種工具
主要是處理不確定的問題;
可用於政治、經濟、社會及教育問題以及自然現象的研 究、分析、解釋、與預測與解決,甚至個人投資理財以 及企業的經營管理、投資設廠、價格決策等。
• 明天會下雨嗎?
• 現在買股票會賺錢嗎?
• 抽煙與肺癌有關嗎?
• 人民對政府施政的滿意度為何?
• 就業與男女性別有關嗎?
• 總統選舉三黨獲勝的比率為何?
• 某產品的品質符合標準嗎?
2
• 完成統計任務的三個步驟為:
1. 統計資料的搜集與整理 2. 統計資料的分析
3. 統計資料的推論
1.1 統計學的意義
統計學是一種方法,一種工具。
狹義的統計學是指以數字來表示事實或資料(data);
廣義的統計學是指蒐集、整理、表現、分析及解釋資
料,並藉科學的方法,在不確定情況下,由樣本資料
所獲得的結果,來推論母體的性質與事實,從而做出
適切決策的一門科學。
3
1.2 統計專有名詞
• 母體與樣本
【定義1.2.1 】母體(population)
人們在研究某一現象或問題時,必須針對發生此一現象或 問題的對象進行調查研究,調查研究的全體對象即是所謂 的母體
母體(Population)是由具有某些共同特質(Characteristic) 的元素(Element)或個體所組成的群體,是研究人員所 要觀察研究的對象的 全體集合 。
母體有大有小;有的具體明確,有的則不明確
• 例:朝陽工管系學生、全台灣製造業廠商、台灣年所 得50萬以下的所有家庭、所有罹患癌症的人。
【定義1.2.2 】樣本(sample)
樣本是研究者從母體中所抽取的部分元素所組成的集合,
是母體的一部份,(即為欲研究之全體對象的部分集合)。
母體資料不易取得→ 利用抽樣方法(Sampling)自母體中抽 出樣本 → 針對此樣本進行研究分析,以瞭解母體的 特質。
此特質稱為變數(variable)
隨機樣本(Random Samples)與非隨機樣本(Non-random Sample)
5
【
定義1.2.3
】普查(Census)
一旦確定要研究的對象母體,當母體是有限的且為小母 體,則了解母體最好的方法,就是對母體內每一個元素加 以調查並記錄其特徵,這種調查方式就稱為普查。
【
定義1.2.4
】抽樣調查(sampling survey)
相對於普查,若隨機自母體中抽選出一部份具有代表性的 元素(個體)當作樣本來加以調查,依據此組樣本進行統計分 析,再將所得的結果來推論未知母體,則此種方法即稱為 抽樣調查。
隨機抽樣(機率抽樣):母體中每一元素被抽中的機會 均等¨ 隨機樣本
非隨機抽樣(非機率抽樣)¨非隨機樣本
抽樣的理由:母體資料不易取得(資源有限、毀壞性抽 測、抽象母體)例:大專畢業生的薪資水準、日光燈的 使用壽命
6
【定義1.2.5 】母體參數 (Population Parameter)
為了推論母體,研究者必須知道描述母體特徵的某些特徵 值,這些特徵值即稱為參數或母數。
通常以希臘字母表示
是一個未知的常數且只有一個值
【定義1.2.6 】樣本統計量(Sample Statistic)
統計量是由樣本中所計算出的量,其為隨機樣本觀察值的 函數,用來推論未知母體參數。
是描述樣本資料特性的統計測量數,簡稱統計量
用來估計或推論母體參數
7
例:景豐電腦經銷商的進貨
213 家經銷商(母體,N = 213個元素)中隨機抽取5家組 成一個樣本(樣本數,n=5個元素)。銷貨收入為研究對 象之特質(即變數)
公司名稱 營業收入(萬元) ← 變數 經技 5,850
元素 → 盛聲 7,605 ← 觀察值
全華 15,860 博捷 48,900 安文 69,200
變數的數值
抽樣
推論
母體 樣本
樣本統計量 母體參數
9
【定義1.2.6 】估計誤差(Error of Estimation)
當我們利用估計量來估計母體參數時,不論用什麼抽樣方 式或多精密的測量,估計量與母體參數間總會有差距。這 樣的差距即稱為估計誤差。
估計誤差 = 樣本統計量與母體參數間之差異
= 抽樣誤差 + 非抽樣誤差
抽樣誤差(Sampling Error)
• 因樣本數抽樣方法及推論方法的不同而造成樣本統計量 與母體參數間之差異
非抽樣誤差 --人為因素造成
10
• 統計學的內容與種類
敘述統計(Descriptive Statistics):
• 包括蒐集、整理、表現、分析與解釋資料。
• 是將原始資料加以整理以統計圖表等來解釋現 象。
推論統計(Inferential Statistics):
• 將敘述統計中所得之結果推論至母體,或由樣本 統計量推論到母體參數的方法
• 統計學的方法
歸納法
演繹法
11
歸納法 演繹法
抽 樣
歸 納 母體(參數未知)
樣 本
樣 本 統 計 量 母 體 參 數
依據樣本資料,利用估計與 假設檢定方法來推論母體特性
假設母體參數已知,根據已 之機率分配理論,推導出 樣本統計量之抽樣分配
抽 樣
母 體(假設參數已知) 樣 本
樣本特性 樣本統計量
統計方法的實施步驟
發現與確定問題
蒐集資料
整理呈現資料
分析解釋
13
1.3 統計學的發展
劃分階段 代表人物 主要貢獻
古 典 時 期
十六世紀中 至 十九世紀初
國勢學派發展於歐洲大陸,以研究國情為主
政治算術學 派發展於英國,舉凡與數字資料有關的社會 現象均包含在內
卡 爾 ‧ 皮 爾 生 (Karl Pearson,1857–1936)
簡單的統計量,如標準差、相 關係數等
迴歸分析的觀念和卡方檢定 近
代 時 期
十九世紀初 至
二十世紀初 費雪(R.A.
Fisher,1890–1962) 實驗設計和隨機過程 聶曼(J. Neyman,
1894-1981)及伊根‧皮爾 生(Egon Pearson )
估計和檢定方面提出理論的基 礎
現 代 時 期
二十世紀初 至今 華德
(A. Wald,1902-1950) 逐次分析(sequential analysis)
14
1.4 統計的應用
政府統計方面 :如失業率 、人口普查
企業統計方面 :如產品滿意度 、商品佔有率
財務金融統計方面 :如股價指數預測、物價變動
教育統計方面 :如學校經費預估 、師生人數比例
農業統計方面 :如季節變動與農產品收成數量的 關係
生物統計方面 :如藥物對疾病的有效度
其它統計方面 :如氣象預測
15