• 沒有找到結果。

统 计

在文檔中 目 录 (頁 44-93)

社会的发展成为可控制的现实 .

———怀 特

灯泡厂要了解生 产 的 灯 泡 的 使 用 寿 命,需要将所有灯泡逐一测 试吗?

保险公司为对人 寿 保 险 制 定 适 当 的 赔 偿 标 准,需要了解人口的 平均寿命,怎样获得相关数据?

国际奥委会2003年6月29日决定,2008年北京奥运会的举办 日期将比原定日期推迟两周,改在8月8日至8月24日举行.原因是 7月末8月初北京地区的气温高于8月中下旬.这一结论是如何得到

的呢?

……

现实生活中存在大量类似的问题,如国家经济运行状况、人口普 查、市场调查及天气预报等.

● 如何科学、合理地收集数据?

● 怎样分析和研究数据,对一般情况作出估计?

2. 1 抽样方法

我们已经学习过 一 些 统 计 知 识,了解了统计的基本思想方法是 用样本估计总体,即当总体容量很大或检测过程具有一定的破坏性 时,不直接去研究总体,而是通过从总体中抽取一个样本,根据样本 的情况去估计总体的相应情况.那么,

● 如何科学地进行抽样呢?

2. 1. 1 简单随机抽样

● 为了了解高一(1)班50名学生的视力状况,从中抽取10名学 生进行检查.如何抽取呢?

1.抽签法

通常使用抽签法,方法是:将50名学生从1到50进行编号,再 制作1~50的50个号签,把50个号签集中在一起并充分搅匀,最后 随机地从中抽出10个号签.对编号与抽中的号签的号码相一致的学 生进行视力检查.

一般地,用抽签法从个体数为 N 的总体中抽取一个容量为k 的 样本的步骤为:

在学习了求概率 的方法后,可以说明用 抽签 法 能 使 每 个 个 体 被选中的机会相等.

(1)将总体中的 N 个个体编号;

(2)将这 N 个号码写在形状、大小相同的号签上;

(3)将号签放在同一箱中,并搅拌均匀;

(4)从箱中每次抽出1个号签,连续抽取k次;

(5)将总体中与抽到的号签的编号一致的k个个体取出.

这样就得到一 个 容 量 为k 的 样 本.对 个 体 编 号 时,可 以 利 用 已 有的编号,如从全班学生中抽取样本时,利用学生的学号作为编号;

对某场 电 影 的 观 众 进 行 抽 样 调 查 时,利 用 观 众 的 座 位 号 作 为 编 号等.

抽签法简单易行,适用于总体中个体数不多的情形.

2.随机数表法

用抽签法抽取样本时,编号的过程有时可以省略(如用已有的编 号),但制签的过程就难以省去了,而且制签也比较麻烦.如何简化制 签的过程呢?

一个有效的办法 是 制 作 一 个 表,其中的每个数都是用随机方法 产生的(称 为 “随 机 数”),这 样 的 表 称 为随 机 数 表(random number table).于是,我们只要按一定的规则到随机数表中选取号码就可以

了.这种抽样方法叫做随机数表法.

下面我们用随机数表法求解本节开头的问题. (1)对50个同学按01,02,03,…,50编号;

随机数表见附录1. (2)在随机数表中随机地确定一个数字,如第8行第29列的数 字7作为开始.为便于说明,我们将附录1中的6~10行摘录如下:

8行

29列

1622779439 4954435482 1737932378 8735209643 8426349164 8442175331 5724550688 7704744767 2176335025 8392120676 6301637859 1695556719 9810507175 1286735807 4439523879 3321123429 7864560782 5242074438 1551001342 9966027954 5760863244 0947279654 4917460962 9052847727 0802734328

􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋

􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋

(3)从数字7开始向右读下去,每次读两位,凡不在01~50中的 数跳过去不读,遇到已经读过的数也跳过去,便可依次得到

12,07,44,39,38,33,21,34,29,42 这10个号码,就是所要抽取的容量为10的样本.

将总体中的个体编号时可以从0开始,例如当 N =100时,编号 可以是00,01,02,…,99.这样,总体中的所有个体均可用两位数字 号码表示,便于使用随机数表.

当随机地选定 开 始 的 数 后,读数的方向可以向右,也可以向左、

向上、向下等.

用随机数表法抽取样本的步骤是:

例 如,可 以 从 抛 掷一根 大 头 针 落 在 随 机数表 上 针 尖 所 指 的 数开始.

(1)将总体中的个体编号(每个号码位数一致);

(2)在随机数表中任选一个数作为开始;

(3)从选定的数开始按一定的方向读下去,若得到的号码在编号 中,则取出;若得到的号码不在编号中或前面已经取出,则跳 过,如此继续下去,直到取满为止;

(4)根据选定的号码抽取样本.

一般地,从个体数为 N 的总体中逐个不放回地取出n 个个体作 为样本(n<N),如果每个个体都有相同的机会被取到,那么这样的抽 样方法称为简单随机抽样(simplerandomsampling).

抽签法和随机数表法都是简单随机抽样.

链 接 随机数表的制作

随 机 数 表 是 人 们 根 据 需 要 编 制 出 来 的,由 0,1,2,3,4,5, 6,7,8,9这10个数字组成,表中每一个数都是用随机方法产生

的.随 机 数 的 产 生 方 法 主 要 有 抽 签 法 、抛 掷 骰 子 法 和 计 算 机 生 成 法.

同桌的两位同学 相互协作,编制一张随 机数表.

(1)抽签法:用0,1,2,3,4,5,6,7,8,9这10个数字做10 个签,放入一个箱中并搅拌均匀,再从箱中每次抽取一个签并记下签 的数码,再放回箱中,如此重复进行下去即可得到一张随机数表.

如果需要两位数表,那么将所得的各个数码按顺序两两连在一 起.类似地,如果需要三位数表,那么就三三连在一起,如012,321, 249,460,634,105,….

2 1 1

(2)抛掷骰子法:如图2 1 1,在一个正二十面体的各面写上 0~9这10个数字(相对的两个面上的数字相同),这样就得到一个产 生0~9的随机数的骰子.不断抛掷这个骰子,并逐一记下朝上一面 (与地面或桌面平行)的数字,就能按顺序排成一个随机数表.

(3)计算机生成法:利用随机函数或随机数发生器让计算机自 动生成随机数表.

EXCEL&CALCULATOR

用 Excel可以方便地产生所需的随机数,下面介绍两种常用的 方法.

(1)利用随机函数生成随机数.在单元格 C1内输入随机函数“=

RAND()”,就能得到一个0与1之间的随机数,拖曳C1的填充柄,便 可产生不同的随机数(图2 1 2中第 C 列).Excel有65536行,利 用Excel的自动填充功能,能快速生成大量的随机数.

如果要生成从0到99的随机数,且随机数为整数,那么可在单元 格内输入“=INT(100*RAND())”(图2 1 2中第 D列).

(2)利用随机数发生器.依次选择“工具/数据分析/随机数发生 器”后,弹出如图2 1 3所示的对话框.它能根据你的要求产生所需 的随机数.图2 1 3中的设置,表示在第 A 列生成20个0与1之间 的随机数.

2 1 2 2 1 3

练 习

1.一个学生在一次知识竞赛中要回答的8道题是这样产生的:从15道历史题 中随机抽出3道,从20道地理题中随机抽出3道,从12道生物题中随机抽 2道.试用抽签法确定这个学生所要回答的8道题的序号(历史题编号分 别为1,2,…,15,地理题编号分别为16,17,…,35,生物题编号分别为 36,37,…,47).

2.从100件电子产品中抽取一个容量为25的样本进行检测,试用随机数表法 抽取样本.

3.假设一个总体有5个元素,分别记为a,b,c,d,e,采用逐个不放回抽取样 本的方法,从中抽取一个容量为2的样本,这样的样本共有多少个? 写出全 部可能的样本.

4.某学校高一年级共有200名学生,为了了解这些学生的身高状况,试用简单 随机抽样从中抽取一个容量为15的样本.

2. 1. 2 系统抽样

● 某校高一年级共有20个班,每班有50名学生.为了了解高一 学生的视力状况,从这1000人中抽取一个容量为100的样本进行检 查,应该怎样抽样?

通常先将各班学生平均分成5组,再在第一组(1~10号学生)中 用抽签法抽取一个,然后按照“逐次加10(每组中个体数)”的规则分 别确定学号为11~20、21~30、31~40、41~50的另外4组中的学 生代表.

将总体平均分成几个部分,然后按照一定的规则,从每个部分中 抽取一个个 体 作 为 样 本,这样的抽样方法称为系 统 抽 样(systematic sampling).

假设要从容量为N 的总体中抽取容量为n 的样本,系统抽样的 步骤为:

(1)采用随机的方式将总体中的 N 个个体编号;

系统抽样也可称 “等距抽样”.

(2)将编号按间隔k分段,当Nn是整数时,取k= Nn;当Nn不是整 数时,从总体中剔除一些个体,使剩下的总体中个体的个数 N'能被n 整除,这时取k= N'n ,并将剩下的总体重新编号;

(3)在第一段中用简单随机抽样确定起始的个体编号l;

(4)按照一定的规则抽取样本,通常将编号为l,l+k,l+2k,

…,l+ (n-1)k的个体抽出.

例1 某单位在岗职工共624人,为了调查工人用于上班途中的时 间,决定抽取10%的工人进行调查.试采用系统抽样方法抽取所需的 样本.

分析 因为624的10%约为62,624不能被62整除,所以为了保证

“等距”分段,应先剔除4人.

解 第一步 将624名职工用随机方式进行编号;

第二步 从总体中剔除4人(剔除方法可用随机数表法),将剩下 的620名职工重新编号(分别为000,001,002,…,619),并等距分 成62段;

第三步 在第一段000,001,002,…,009这10个编号中用简 单随机抽样确定起始号码l;

第四步 将编号为l,l+10,l+20,…,l+610的个体抽出,组 成样本.

练 习

1.为 了 了 解 参 加 一 次 知 识 竞 赛 的 1252 名 学 生 的 成 绩,如 果 决 定 采 用 系 统 抽 样 的 方 法 抽 取1 个 容 量 为 50 的 样 本,那 么 应 从 总 体 中 随 机 剔 除 个 体 的 数 目 是( ).

A.2 B.3 C.4 D.5

2.从2000个编号中抽取1个容量为20的样本,若采用系统抽样的方法,则抽 样的间隔为( ).

A.200 B.150 C.100 D.80

3.要从1003名学生中抽取1个容量为20的样本,试叙述系统抽样的步骤.

4.试用系统抽样的方法从你校学生中抽取1个适当的样本,再对抽出学生的两 臂平展的长度及身高进行测量,并分别计算两组数据的平均数.

2. 1. 3 分层抽样

● 某校高一、高二和高三年级分别有学生1000名、800名和700 名,为了了解全校学生的视力情况,从中抽取容量为100的样本,怎样 抽样较为合理?

由于不同年级的学生视力状况有一定的差异,不能在2500名学 生中随机抽取100名学生,也不宜在3个年级中平均抽取.为准确反 映客观实际,不仅要使每个个体被抽到的机会相等,而且要注意总体 中个体的层次性.

一个有效的办法 是,使抽取的样本中各年级学生所占的比与实 际人数占总体人数的比基本相同.

据此,应抽 取 高 一 学 生 100×10002500 = 40名,高 二 学 生 100×

2500=32800 名,高三学生100× 7002500=28名.

一般地,当总体由差异明显的几个部分组成时,为了使样本更客观地 反映总体情况,我们常常将总体中的个体按不同的特点分成层次比较分 明的几个部分,然后按各个部分在总体中所占的比实施抽样,这种抽样方 法叫分层抽样(stratifiedsampling),所分成的各个部分称为“层”.

分层抽样的步骤是:

(1)将总体按一定标准分层;

若按比例计算所 得的个体数不是整数, 可作适当的近似处理.

(2)计算各层的个体数与总体的个体数的比;

(3)按各层个体数占总体的个体数的比确定各层应抽取的样本 容量;

(4)在每一层进行抽样(可用简单随机抽样或系统抽样).

例2 某电视台在因特网上就观众对某一节目的喜爱程度进行调 查,参加调查的总人数为12000人,其中持各种态度的人数如表2 1 1所示.电视台为进一步了解观众的具体想法和意见,打算从中抽

取60人进行更为详细的调查,应怎样进行抽样?

2 1 1

很喜爱 不喜爱

2435 4567 3926 1072

分析 因为总体中人数较多,所以不宜采用简单随机抽样.又因为持不同 态度的人数差异较大,所以也不宜用系统抽样,而以分层抽样为妥.

在文檔中 目 录 (頁 44-93)

相關文件