• 沒有找到結果。

样本的两重性和简单随机样本

4.2 数理统计的若干基本概念

4.2.2 样本的两重性和简单随机样本

1. 样本空间

我 们 知 道 样 本 是 由 总 体 中 抽 取 的 一 部 分 个 体 组 成. 设 X = (X1,· · · , Xn) 是从总体中抽取的一个样本, 其样本空间如下:

样本 X = (X1,· · · , Xn) 可能取值的全体成为样本空间 , 记

X . Definition

例如在前面称重例中, 样本空间为 X = {(x1,· · · , x5) : 0 <

xi<∞, i = 1, 2, · · · 5}, 也可以写成 X = {(x1,· · · , x5) : − ∞ <

xi<∞, i = 1, 2, · · · 5}. 虽然物重不可以取负数, 但这无关紧要, 因 为在考虑样本分布时, 可令样本取负值的概率为 0. 再看下例:

↑Example

打靶试验, 每次打三发, 考察中靶的环数. 如样本 X = (5, 1, 9) 表示三次打靶分别中 5 环、1 环和 9 环. 此时样本空间为

X ={(x1, x2, x3) : xi= 0, 1, 2,· · · 10, i = 1, 2, 3}

这个样本空间中样本点数是有限的, 上例称重问题中样本空间中的样 本点数是无限的.

↓Example

1、样本的两重性

当我们从总体中作具体抽样时, 每次抽样的结果都是些具体的 数, 如例 5.2.3 的打靶问题中, 3 维样本 X = (X1, X2, X3), 其中 0≤ Xi≤ 10为整数, i = 1, 2, 3, 它是数字向量. 但若是在相同条件下, 再打三发, 由于种种不可控制的随机因素的影响, 中靶的环数不可能 和上一次完全一样, 具有随机性. 如果无穷次打下去, 每次打三发, 出 现的结果可视为随机向量 (X1, X2, X3) 的观察值.

样本的两重性是说,样本既可看成具体的数, 又可以看成随机变 量 (或随机向量). 在完成抽样后,它是具体的数;在实施抽样前,它 被看成随机变量. 因为在实施具体抽样之前无法预料抽样的结果, 只 能预料它可能取值的范围, 故可把它看成一个随机变量,因此才有概 率分布可言。为区别起见,今后用大写的英文字母表示随机变量或随 机向量, 用小写字母表示具体的观察值.

对理论工作者, 更重视样本是随机变量这一点, 而对应用工作者 虽则将样本看成具体的数字, 但仍不可忽视样本是随机变量 (或随机 向量) 这一背景. 否则, 样本就是一堆杂乱无章毫无规律可言的数字, 无法进行任何统计处理. 样本既然是随机变量 (或随机向量), 就有分 布而言, 这样才存在统计推断问题.

2、简单随机样本

抽样是指从总体中按一定方式抽取样本的行为. 抽样的目的是通 过取得的样本对总体分布中的某些未知因素做出推断, 为了使抽取的 样本能很好的反映总体的信息, 必须考虑抽样方法. 最常用的一种抽 样方法叫作 “简单随机抽样”, 它要求满足下列两条:

(1) 代表性. 总体中的每一个体都有同等机会被抽入样本, 这意味 着样本中每个个体与所考察的总体具有相同分布. 因此, 任一样本中 的个体都具有代表性.

(2) 独立性. 样本中每一个体取什么值并不影响其它个体取什么 值. 这意味着, 样本中各个体 X1, X2,· · · , Xn 是相互独立的随机变 量.

由简单随机抽样获得的样本 (X1,· · · , Xn) 称为简单随机样本.

用数学语言将这一定义叙述如下:

设有一总体 F, X1,· · · , Xn 为从 F 中抽取的容量为 n 的样 本, 若

(i) X1,· · · , Xn 相互独立,

(ii) X1,· · · , Xn 相同分布, 即同有分布 F,

则称 (X1,· · · , Xn) 为简单随机样本, 有时简称简单样本或随 机样本.

Definition

设总体为 F, (X1,· · · , Xn) 为从此总体中抽取的简单样本, 则 X1,· · · , Xn的联合分布为:

F (x1)· F (x2)· · · · F (xn) =

n i=1

F (xi) 若 F 有密度 f, 则其联合密度为

f (x1)· f(x2)· · · · f(xn) =

n i=1

f (xi)

显然,有放回抽样获得的样本是简单样本. 当总体中个体数较大 或所抽样本在总体中所占比例较小时, 无放回抽样获得的样本可以近 似认为是简单样本.

相關文件