第一章 緒論 本章學習目標:
1.統計的意義、功用、發展、應用、方法及內容
2.基本概念 (常用術語):母體、樣本、參數、統計量、元素、變數、觀察值
【案例1】到非洲賣鞋子的故事→蒐集、整理、陳示、分析、解釋、決策
【案例2】廣告是否有效? →蒐集、整理、陳示、分析、解釋、決策
一、 統計的意義:
1. 統計示一種方法,一種工具
2. 狹義:以數字表示的事實或資料(data) 【統計處理的是 數 值 資料】
3. 廣義:是蒐集、整理、陳示、分析解釋資料,並藉由科 學 方 法 在不 確定的情況下,由 樣 本 所獲得的結果來推論 母 體 的性質與事實,
從而作出適切決策的一門科學
4. 課本定義:在不確定的情況下,提供人們能作出聰明決策的科學方法,
其過程包括資料的蒐集、整理、陳示、解釋與分析,透過此一過程,可 根據分析的結果加以推論,進而獲得合理的研判與有效的結論。
【Note】科學方法:的步驟:(1)先確立待解決的是何種問題;(2)給予問題一個合 理的假設;(3)蒐集、整理並分析與該問題有關的資料;(4)將研究資料 所獲得的結果與原先的假設核對;(5)提出研究的結果;(6)若結論可以 確立,則可應用到其他類似的問題,以期能建立原則。 (p.1-2)
二、 統計的功用
1. 使資訊變得有意義 2. 處理不確定性
3. 分析各變數之間的關係 4. 預測
三、 統計學的發展
(一) 統計意識時代 (16 世紀以前)
--西歐國家用於計數(count)的工具,即為了政治目的對人口資源加以調查 紀錄
--西元前 3050 年,埃及國王為了修建金字塔,曾舉辦全國人口及財產的調 查
--中國在周朝(西元前 2000 年)就有大量關於政府收入與支出的記載
--Statistics 這個字最早出現於 16 世紀,源自拉丁文 Status,亦即統計是 備用來表是國家的資料
(二) 古典統計學時代(16 世紀中~19 世紀初)
--此一時期早期僅對國情及社會現象加以敘述,及僅對數字資料加以初步分 析與製表比較,尚未發展成一種獨立方法
--1662 年英國人 John Graunt 觀察教堂每週死亡名單,利用簡單的統計方 法加以分析,因而得出有關死亡的ㄧ些原因及其趨勢,這是首次根據大
-2-
量原始資料所作的實證研究,Graunt 被尊稱為現代統計學之父
--Graunt 之後,有許多數學家,對統計產生興趣,把機率的研究賦予數學 的形式,甚至把機率理論應用於統計範疇
--P. Fermat, B. Pascal, J. Bernoulli 對機率論的討論與貢獻,促進人口統計、
年金計算、保險及觀測誤差的衡量
--P. S. Laplace, A. D. Moivre, C. F. Gauss 等對常態分配的研究及應用推廣,
促使統計學的發展向前邁進一大步
(三) 近代統計學時代(19 世紀初~20 世紀初)
--在此時期統計學逐漸發展成一種有系統的獨立的科學方法 -- S. F. Galton 領導發展迴歸與相關
--K. Pearson 提出相關理論,對假設檢定作有系統的研究 --Fisher 發展出實驗設計、變異數分析及最大概似法等 (四) 現代統計學時代(20 世紀初~現在)
--F. Wilcoxon 等人對無母數統計分法的研究,使得統計分法推展了應用的 領域
--因為電腦的發明,使得複雜困難的計算變得簡單而快速,此一改變導致統 計學的日漸普及,應用日廣
四、 統計學的應用
人類的行為與自然界的現象及科學的研究大都會產生大量的資料,要想將 此大量資料轉化成有用的資訊,只有靠統計學方有可能。許多社會現象與自然 科學的研究都可借統計方法來分析、解釋及預測。今天統計學已經廣泛的被應 用如物理、心理、生物、保險、教育、醫療、經濟、農業、企管、社會、工程、
政府管理等各個領域,茲說明與商業及經濟上的應用:
(一) 會計上的應用--帳目稽核時會利用統計抽樣程序
(二) 財務上的應用—財務分析師利用各種統計資訊作為投資建議的依據 (三) 行銷上的應用—了解市場資料及消費者行為
(四) 生產上的應用—品質管理
(五) 經濟上的應用—預測未來的經濟狀況或相關發展趨勢
【Note】雖然對象問題有不同,但基本概念、方法大致一致,故統計是一種工具 五、 統計學的內容
(一) 依性質可分為 1.理論統計(Theoretical Statistic)--發展統計推論的方法 2.應用統計(Applied Statistic)--著重將理論統計應用於各
種科學研究
(二) 依範圍可分為 1.敘述統計(Descriptive Statistic)--僅就統計資料本身特性 描述
2.推論統計(Inferential Statistic)--根據分析結果,進而推 論某些事實現象。(p.1-3)
【練習1】判別下列敘述何者屬於敘述統計?何者屬於推論統計? (課本習題 2) (1)由於目前產油國家減產,我們可以預期明年汽油價格將上漲一倍 (2)某城市去年的火災報告中,至少有 5%以上是蓄意縱火 (3)近來的投票結果顯示,大多數的台灣人反對增建核能電廠
Ans:(1)推論統計;(2),(3)敘述統計
【練習2】報載「根據教育部調查,台灣國中生放學後及假日經常看電視的比例 為46.4%」,(a)請問是敘述統計或推論統計的例子? (b)「與十年前比較,
國中生花在看電視的時間有顯著的提高」,此一統計分析是敘述統計或推 論統計? (課本習題 1)
Ans:(a)敘述統計;(b)推論統計 六、 統計學的方法:
1. 歸納法(Induction):從某個個別的訊息中,獲得一般性的結論。在統計上乃 是利用樣本的資料推論母體參數值得方法
2. 演繹法(Deduction):使用邏輯推理的方法去推導某些個別的特性的方法,
在統計上則是假設母體參數已知,而導出樣本統計量的方 法。
Time
成績
Time
成績 (a)假設
Time
成績 (b)觀察結果
(c)接受或拒絕假設
Time
成績
Time
成績 (a)觀察情形
Time
成績 (b)形成模式
(c)提出結論
圖2: 歸 納 法
-4-
七、 重要基本概念(p.1-5) (一) 母體(Population)
--調查(研究)者所要調查(研究)的全部對象所成的集合 --由具有共同特質之元素(element)或個體所組成
--ex:台灣地區所有的醫院診所每天平均看診人數、去年全體大專畢業生的 平均薪資所得、大統公司所有 25 個員工的平均教育年數,其中『所有的 醫院診所』、『全體大專畢業生』、『所有 25 個員工』即是母體
【Note】元素:是資料收集的實體(ex:每個醫院診所即為一個元素) A.依群體內所含個體數的多少分:
(1)有限母體(Finite population):母體大小(N)數的完(ex:A 公司今年的銷 售量)
(2)無限母體(Infinite population):母體大小(N)數不完(ex:空氣中的細菌)
【Note】在實務上,只要 N≧20n(樣本大小),或採放回式抽樣,可視為無 限母體
B.依群體內個體所顯現的特性分:
(1)質母體(Qualitative population):屬於類別性質母體(ex:教育程度) (2)量母體(Quantitative population):屬於數值型態母體(ex:年齡) (二) 樣本(Sample)
--是母體的部分集合
--ex:抽出 100 家診所調查每天平均看診人數、抽出 100 位大專畢業生調查 平均薪資,『100 家診所』或『100 位畢業生』即是樣本
A.依樣本大小分:
(1)大樣本:n(樣本大小)≧ 30 (2)小樣本:n(樣本大小) < 30 B.依取得方式分:
(1)隨機樣本:使用隨機抽樣方法(ex:簡單隨機抽樣、分層抽樣、分群抽樣) 所得的樣本
(2)非隨機樣本:使用非隨機抽樣方法(ex:便利抽樣、雪球抽樣)所得的樣本
【Note 1】變數(Variable):母體中的各個元素所具有不同的特質,亦即元素 中的各個屬性稱之為變數(ex:性別、薪資、看診人數、教育年 數…),變數是研究的對象
【Note 2】觀察值(Observation):變數的數值,對特定元素所蒐集的ㄧ組衡 量值稱之
【範例1】假設想知道台灣地區的民眾每天平均花多少時間看電視,我們可從台 灣地區的電視觀眾中抽取 1000 人,就其收視行為進行研究分析,此 時所有台灣地區的電視觀眾就是母體,所抽取的 1000 人稱為樣本,
每日收看電視的時間就是變數。
【範例2】假設菲力蒲燈泡製造公司想知道其所生產的燈泡使用壽命,現從成品 中抽取10 支燈泡來測試,則工廠生產的所有燈泡為母體,10 支燈泡 為樣本,使用壽命為變數
(三) 母體參數(Population parameters) --描述母體資料特性的統計測量數 --是統計的核心
--固定的數值(Constant)
(四) 樣本統計量(Sample statistics) --描述樣本資料特性的統計測量數 --用來推論母體
【範例3】在範例 1 中,若台灣地區電視觀眾每天看電視時間的抽樣結果為平均 2 小時 30 分鐘,則此 2 小時 30 分鐘即是一個樣本統計量的觀察值,
若對所有台灣地區的電視觀眾進行普查(所有元素都調查)結果得到 全部台灣地區電視觀眾平每天花2 小時 20 分鐘看電視,則 2 小時 20 分鐘即為母體參數值
【練習3】要調查台灣牙醫師年齡的平均數及標準差各為多少,經隨機抽取 200 名牙醫師,得其年齡平均數為45 歲,標準差為 8 歲,是問此研究中 的:(a)母體、樣本;(b)其大小各為何?(c)母體參數、樣本統計量;(d) 其值各為何?(課本習題 4)
Ans:(a)母體為全台的牙醫師,樣本為隨機抽取的 200 名醫師;(b)母體大小(N) 未知,樣本大小(n)為 200;(c)母體參數為全台灣牙醫師年齡的平均 數及標準差,樣本統計量為200 名牙醫師年齡的平均數及標準差;(d) 母體參數值未知,樣本統計量的值分別為樣本平均數45 歲,樣本標 準差8 歲
【練習 4】某汽車公司生產汽車零件,剛上任的業務經理想了解所屬 270 家經 銷商的銷售情形,他隨機調查 10 家經銷商年初至今累積的營業金額 加以分析,以便制定未來經營策略,經計算得其累積的平均金額為 200 萬元,標準差為 50 萬元,是問此調查中的(q)母體及樣本為何?(b) 其大小各為何?(c)母體參數及樣本統計為何? (d)其值各為何?(課本習 題5)
Ans:(a)母體為該汽車公司所屬全部經銷商,樣本為隨機調查的經銷商;(b)母 體大小(N)為 270,樣本大小(n)為 10;(c)母體參數為年初累積至今 的平均營業額及標準差,樣本統計量為樣本的平均營業額及標準差;
(d)母體參數值未知,樣本統計量的值分別為平均 200 萬元,標準差 為50 萬元
-6-
【練習 5】一項肺癌新療法的醫學研究顯示,在對 400 名病人治療的結果,半 年內有35%的病人癌細胞受到控制,而在過去用以往的方法所進行長 期觀察,半年的治療過程中,有15%的病人癌細胞受到控制,可推斷 新的治療方法較以往的有效,試回答:(a) 本研究之母體為何?(b)所 研究的變數為何?(c) 樣本為何?(d) 上面題目敘述中,哪一部份是推 論統計的結果?哪一部份是敘述統計的結果?
Ans:(a)所有肺癌病人;(b)半年內病人癌細胞受控制情況;(c)400 名病人;(d) 癌細胞受到控制的百分比 35%及 15%是敘述統計的結果,可以推斷 新的治療方法較以往有效是推論統計的結果
【練習6】 設教育部想要了解全台北縣國小學童平均每人有幾顆蛀牙,因此由 北、中、南、東部四個地區分別隨機各抽出3500 位學童作檢查,並 求得平均每人有1.3 顆蛀牙的結果,試問:(a)本研究之母體為何?(b) 所研究的變數為何?(c) 樣本為何?(d) 題目所提及 1.3 顆的結果是依 據敘述統計方法或推論統計方法?
Ans:(a)全台北縣國小學童;(b)每人蛀牙顆數;(c)北、中、南、東四區分別抽 出3500 人共 14000 位學童;(d)敘述統計
【練習7】 某位老師想要了解該班 50 位同學平均每日花在電視上的時間有多 少。因此從全班同學中隨機抽出15 位同學為樣本作分析,試問:(a) 母體為何?(b) 所研究的變數為何?(c) 樣本為何?
Ans:(a)全班 50 位同學;(b)平均每日看電視的時間;(c)隨機抽出的 15 位同學
【練習8】某專校為瞭解全校 5000 名學生之染髮之比率,經隨機抽查該校 200 名學生,結果發現有7%染髮,依目前青年學生趕時髦的心理與彼此 比“酷"之個性,預期三個月後,該校將有9%學生染髮,試問:(a) 研究之母體為何?(b)研究之變數為何?(c) 樣本為何?(d) 何者依據 敘述統計方法? (e) 何者依據推論統計方法?
Ans:(a)母體為全校 5000 名學生;(b)染髮的比例;(c)隨機抽查的 200 名學生;
(d)7%的染髮比例是依據敘述統計方法(e)預期三個月後,該校將有 9%
學生染髮是依據推論統計方法
【練習9】 從九十五年至合歡山旅遊的遊客中隨機抽 1000 人,調查其停留天 數如下表:(a) 本題之母體與樣本各為何?(b) 從此資料可發現 48.7%的旅客停留不到一天,此數量 48.7%是母體參數或樣本統計 量?
Ans:(a)母體為 95 年至合歡山旅遊的所有
遊客,樣本為隨 機抽出的1000 人;(b)樣本
統計量
天 數
< 1 1 2 3 4 合計 人
數 487 284 153 65 11 1000