• 沒有找到結果。

4.2 数理统计的若干基本概念

4.2.1 总体和样本

通过下面的例子说明总体、个体和样本的概念.

↑Example

假定一批产品有 10000 件, 其中有正品也有废品, 为估计废品率, 我们往往从中抽取一部分, 如 100 件进行检查. 此时这批 10000 件产 品称为总体, 其中的每件产品称为个体, 而从中抽取的 100 件产品称 为样本. 样本中个体的数目称为样本的大小, 也称为样本容量. 而抽 取样本的行为称为抽样.

↓Example

从本例我们可对总体和样本作如下直观的定义:

总体是与我们所研究的问题有关的所有个体组成, 而样本是总体

中抽取的一部分个体.

若总体中个体的数目为有限个, 则称为有限总体, 否则称为无限 总体.

在统计研究中, 人们所关心的不是总体内个体的本身, 而是关心 个体上的一项 (或几项) 数量指标, 如日光灯的寿命, 零件的尺寸. 在 例4.2.1中若产品为正品用 0 表示, 若产品为废品用 1 表示, 我们关心 的个体取值是 0 还是 1. 因此我又可获得总体的如下定义:

总体可以看成是由所有个体上的某种数量指标构成的集合, 因此 它是数的集合.

由于每个个体在抽样时的出现是随机的, 所以相应的个体上的数 量指标的出现也带有随机性. 从而可以把此种数量指标看成随机变量, 随机变量的分布就是该数量指标在总体中的分布. 以例4.2.1来说明, 假定 10000 只产品中废品数为 100 件, 其余的为正品, 废品率为 0.01.

我们定义随机变量 X 如下:

X =

{ 1 废品 0 正品,

其概率分布为 0–1 分布, 且有 P (X = 1) = 0.01. 因此, 特定个体上的 数量指标是随机变量 X 的观察值. 这样一来, 总体可以用一个随机变 量 X 及其分布来描述, 获得如下定义:

一个统计问题所研究的对象的全体称为总体. 在数理统计学中

总体可以用一个随机变量及其概率分布来描述. Definition

由于总体的特征由其分布来刻画, 因此统计学上常把总体和总体 分布视为同义语. 由于这个缘故, 常用随机变量的符号或分布的符号 来表示总体. 比如研究某批日光灯寿命时, 人们关心的数量指标是寿 命 X, 那么此总体就可以用随机变量 X 来表示, 或用其分布函数 F 来表示. 若 F 有密度, 记为 f, 则此总体也可用密度函数 f 来表示.

有时也根据总体分布的类型来称呼总体的名称, 如正态总体、二项分 布总体、0–1 分布总体. 若总体分布函数记为 F, 当有一个从该总体

中抽取的相互独立同分布 (i.i.d.) 的大小为 n 的样本 X1,· · · , Xn, 则 常记为

X1,· · · , Xni.i.d. ∼ F (4.1) 若 F 有密度 f, 可记为

X1,· · · , Xn i.i.d. ∼ f (4.2) 若所考虑的总体用随机变量 X 表示其分布函数为 F, 则样本 X1,· · · , Xn 可视为随机变量 X 的观察值, 亦可记为

X1,· · · , Xni.i.d. ∼ X (4.3) (4.1)、(4.1) 和 (4.3) 表示相同的意思.

当个体上的数量指标不止一项时, 我们用随机向量来表示总体.

例如研究某地区小学生的发育状况时, 人们关心的是其身高 X 和体重 Y 这两个数量指标, 此时总体就可以用二维随机向量 (X, Y ) 或其联 合分布 F (x, y) 表示.

相關文件