• 沒有找到結果。

概率论与数理统计 - 万水书苑-出版资源网

N/A
N/A
Protected

Academic year: 2021

Share "概率论与数理统计 - 万水书苑-出版资源网"

Copied!
27
0
0

加載中.... (立即查看全文)

全文

(1)第 6 章 参数估计. 6.1. 参数的点估计 设总体 X 服从某已知分布,如 N ( µ , σ 2 ) 、 e(λ ) 等,但是其中的一个或多个参. 数为未知,怎样根据抽取的样本估计未知参数的值,就是参数的估计问题. 首先讨论分布参数的点估计. 设总体 X 的分布中含有未知参数θ ,从总体 X 中抽取样本 X 1 , X 2 ,L, X n ,构 造某个统计量 θˆ( X , X ,L, X ) 作为参数θ 的估计,则称 θˆ( X , X ,L, X ) 为参数θ 1. 2. 1. n. 2. n. 的点估计量;若样本 X 1 , X 2 ,L, X n 的观测值为 x1 , x2 ,L, xn ,则称 θˆ( x1 , x2 ,L, xn ) 为 参数θ 的点估计值. 1 ( X1 + L + X n ) n 为 n 个人的平均身高,近似认为总体均值 µ 为 X ,即 µˆ = X . 用 X 来估计 µ ,这 里 µˆ 不是真值,而是估计值. 一个样本为 X 1 , X 2 ,L, X n , 则X = 例如, 人的身高 X ~ N ( µ , σ 2 ) ,. 若总体的分布中含有 m( m >1)个未知参数,则需构造 m 个统计量作为相应 m 个未知参数的点估计量. 下面介绍两种常用的求未知参数点估计量的方法. 一、矩估计法 设总体 X 的分布中含有未知参数 θ1 , θ 2 , L, θ m ,假定总体 X 的 1、2、…,m 阶 原点矩都存在,一般来说,它们都是 θ1 , θ 2 , L, θ m 的函数,即 vk ( X ) = E ( X k ) = vk (θ1 , θ 2 ,L, θ m ). ( k = 1, 2, L , m ).. 从总体 X 中抽取样本 X 1 , X 2 ,L, X n ,取样本 k 阶原点矩 Vk =. 1 n k ∑ X i 作为总体 n i =1. X 的 k 阶原点矩 vk ( X ) 的估计量,即 vˆk ( X ) =. 1 n k ∑ Xi n i =1. ( k = 1, 2, L , m ).. 由此得方程组. PDF created with pdfFactory Pro trial version www.pdffactory.com.

(2) 158.  1 n  v1 (θ1 , θ 2 ,L, θ m ) = n ∑ X i , i =1   1 n 2 v2 (θ1 , θ 2 ,L, θ m ) = ∑ X i , n  i =1  M   1 n m  vm (θ1 ,θ 2 ,L, θ m ) = ∑ X i . n i =1 . 概 率 论 与 数 理 统 计. 求这个方程组的解,得  θˆ1 = θˆ1 ( X 1 , X 2 ,L, X n ),  θˆ2 = θˆ2 ( X 1 , X 2 ,L, X n ),  M  θˆ = θˆ ( X , X ,L, X ). m 1 2 n  m. 它们分别是未知参数 θ1 , θ 2 , L, θ m 的估计量,称为矩估计量.如果已知样本观 测值为 x1 , x2 ,L, xn ,则矩估计量的观测值  θˆ1 = θˆ1 ( x1 , x 2 ,L, xn ),   θˆ2 = θˆ2 ( x1 , x2 ,L, xn ),  M  θˆ = θˆ ( x , x ,L, x ). m 1 2 n  m. 分别是未知参数 θ1 , θ 2 , L, θ m 的矩估计值.这种求未知参数的点估计的方法称为矩 估计法. 例 6.1.1. 设总体 X 在区间 [0, θ ] 上服从均匀分布,其中 θ > 0 是未知参数,如 果取得样本观测值为 x1 , x2 ,L, xn ,求θ 的矩估计值. 解. 因为总体 X 的概率密度 1  , (0 < x < θ ), f ( x;θ ) = θ  0, (其他).. 其中只有一个未知参数θ ,所以只需考虑总体 X 的一阶原点矩 θ x θ v1 ( X ) = E ( X ) = dx = , 0 θ 2 1 n 用样本一阶原点矩 V1 = ∑ X i 作为 v1 ( X ) 的估计量,即有 n i =1. ∫. θ 1 n = ∑ Xi , 2 n i =1 由此解得θ 的矩估计量是. PDF created with pdfFactory Pro trial version www.pdffactory.com.

(3) 2 n θˆ = ∑ 2 X i = 2 X , n i =1 而θ 的矩估计值就是 2 n θˆ = ∑ 2 xi = 2 x . n i =1 例 6.1.2. 设总体 X 服从正态分布 N ( µ , σ 2 ) ,其中 µ 及 σ 2 都是未知参数,如. 果取得样本观测值为 x1 , x2 ,L, xn ,求 µ 及 σ 2 的矩估计值. 解 于是有. 因为总体 X 的分布中有两个未知参数,所以应该考虑一、二阶原点矩, v1 ( x ) = E ( X ) = µ , v2 ( x ) = E ( X 2 ) = D ( X ) + [E ( X )]2 = σ 2 + µ 2 .. 于是,按矩估计法得方程组  1 n µ = n ∑ X i ,  i =1  n σ 2 + µ 2 = 1 ∑ X i2.  n i =1 解得 µ 及 σ 2 的矩估计量为  1 n µˆ = n ∑ X i = X,  i =1  n 2 1 1 n 2  σˆ 2 = X X − = ∑ i ∑ ( X i − X )2.  n i =1 n i =1 而 µ 及 σ 2 的矩估计值就是  1 n µˆ = ∑ xi = x, n i =1   n σˆ 2 = 1 ( x − x ) 2 = σ% 2 . ∑ i  n i =1 由此可见,总体均值 E ( X ) 的矩估计值是样本均值 x ;总体方差 D( X ) 的矩估计. 解. 因为. 第 6. 值就是样本二阶中心矩 σ% 2 .从解题过程易知,这个结论不仅对正态总体成立,而且 无论总体 X 服从什么分布,只要总体的均值与方差存在,上述结论都是成立的. 矩估计法的优点是直观、简便;特别是,正如前面已经指出的,对总体的均 值与方差进行估计时,并不一定要知道总体服从什么分布,但是,矩估计法对于 那些原点矩不存在的总体是不适用的. 例 6.1.3 设 X ~ U ( a, b ) ,一个样本为 X 1 , X 2 ,L, X n ,求参数 a、b 的矩估计.. 章 参 数 估 计 159. PDF created with pdfFactory Pro trial version www.pdffactory.com.

(4) 160 概 率 论 与 数 理 统 计. a+b   E ( X ) = 2 ⇒ b = 2 E ( X ) − a ,  2 2  D( X ) = (b − a) ⇒ ( E ( X ) − a ) = D( X ).  12 3 故 a = E ( X ) − 3D( X ), b = E ( X ) + 3 D( X ) ,. 则 3 n aˆ = Eˆ ( X ) − 3Dˆ ( X ) = X − ∑ (X i − X ) , n i =1 3 n bˆ = Eˆ ( X ) + 3Dˆ ( X ) = X + ∑ (X i − X ) . n i =1 二、最大似然估计法 (1)设总体 X 是离散型随机变量,概率函数是 p( x;θ ) ,其中θ 是未知参数.从 总体 X 中抽取样本 X 1 , X 2 ,L, X n ,如果得到的样本观测值为 x1 , x2 ,L, xn ,则表明 随机事件 X 1 = x1 , X 2 = x 2 ,L, X n = xn 发生了.因为随机变量 X 1 , X 2 ,L, X n 相互独 立,并且与总体 X 有相同的概率函数,所以上述 n 个相互独立的随机事件的交的 概率为 P (I ( X i = xi )) = ∏ P( Xi = xi ) = ∏ p ( xi ;θ ) , n. n. n. i =1. i =1. i =1. 设 L(θ ) =. n. ∏ p ( x ;θ ) , i. (6.1.1). i =1. 函数 L(θ ) 称为似然函数,对于已取定的 x1 , x2 ,L, xn ,它是未知参数θ 的函数. 最大似然估计法的直观想法就是:如果抽样的结果得到样本观测值 x1 , x2 ,L, xn ,则应当这样选取参数θ 的值,使这组样本观测值出现的可能性最大, 也就是使似然函数 L(θ ) 达到最大值,从而求得参数 θ 的估计值 θˆ .利用最大似然 估计法求得的参数估计值称为最大似然估计值 . 求未知参数θ 的最大似然估计值的问题,就是求似然函数 L(θ ) 的最大值点的 问题.当似然函数 L(θ ) 可导时,这个问题可以通过解下面的似然方程 dL(θ ) =0 (6.1.2) dθ 来解决.因为 ln L(θ ) 是 L(θ ) 的增函数,所以 ln L(θ ) 与 L(θ ) 在θ 的同一值处取得最 大值.因此,也可以将上面方程换成下面的方程 d ln L(θ ) =0. dθ. PDF created with pdfFactory Pro trial version www.pdffactory.com. (6.1.3).

(5) 解上面两个方程,就可以得到参数θ 的最大似然估计值. 例 6.1.4 设总体 X 服从泊松分布 P (λ ) ,其中 λ >0 为未知参数.如果取得样 本观测值为 x1 , x2 ,L, xn ,求参数 λ 的最大似然估计值. 解. 有概率函数 p( x; λ ) =. λ x −λ e x!. ( x = 0,1,2,…),. 所以,按(6.1.1) ,似然函数为 n. L (λ ) =. ∑ xi.  λ xi − λ  λ i=1 e = e− nλ ,   ∏ n i =1  xi !  ∏ ( xi !) n. i =1. 取对数,得 n  n  ln L( λ ) =  ∑ xi  ln λ − ∑ ln( xi !) − nλ , i =1  i =1  于是,按(6.1.3)得到方程 d ln L( λ ) 1 n = ∑ xi − n = 0 , dλ λ i =1. 由此解得 λ 的最大似然估计值为 1 n λˆ = ∑ xi = x . n i =1 (2)设总体 X 是连续随机变量,概率密度为 f ( x;θ ) ,其中θ 是未知参数.从 总体 X 中抽取样本为 X 1 , X 2 ,L, X n ,如果得到的样本观测值为 x1 , x2 ,L, xn ,则随 机变量 X i 落在点 xi 的领域(设其长度为 ∆xi )内的概率近似等于 f ( xi ; θ ) ∆xi ( i = 1, 2,L, n ).因为这 n 个随机事件相互独立,所以它们的交的概率近似等于 n. ∏ f ( x ;θ )∆x . 按 最 大 似 然 估 计 法 , 应 该 选 择 未 知 参 数 θ i. i. 的值使得概率. i =1 n. ∏ f ( x ;θ )∆x i. i. i =1. 达到最大值. 因为 ∆x( 与θ 无关,所以代替公式(6.1.1) , i i = 1, 2, L , n ). 取似然函数为 L(θ ) =. n. ∏ f ( x ;θ ) , i. (6.1.4). i =1. λ e− λ x, ( x > 0); f ( x; λ ) =   0, ( x ≤ 0). 其中 λ > 0 为未知参数.如果取得样本观测值为 x1 , x2 ,L, xn ,求参数 λ 的最大似然. 第 6. 再按上述方法求参数θ 的最大似然估计值. 例 6.1.5 设总体 X 服从指数分布 e(λ ) ,概率密度为. 章 参 数 估 计 161. PDF created with pdfFactory Pro trial version www.pdffactory.com.

(6) 162 概 率 论 与 数 理 统 计. 估计值. 解 按公式(6.1.4) ,似然函数为 n. n. ∏ (λ e. L (λ ) =. − λ xi. −λ. ) = λn e. ∑ xi. ,. i=1. i =1. 取对数,得 n. ln L( λ ) = n ln λ − λ ∑ xi , i =1. 按(6.1.3)得方程 d ln L( λ ) n = − dλ λ. n. ∑x. =0,. i. i =1. 由此解得 λ 的最大似然估计为 λˆ =. n n. ∑x. =. 1 . x. i. i =1. 当总体 X 的分布中含有多个未知参数 θ1 , θ 2 , L, θ m 时,最大似然估计法也是适 用的.这时,得到的似然函数 L 是这些参数的多元函数 L(θ1 , θ 2 ,L, θ m ) .为了求似 然函数 L 的最大值,代替方程(6.1.2)或(6.1.3),有方程组: ∂L = 0 ( j = 1, 2, L , m ); ∂θ j. (6.1.5). 或 ∂ ln L =0 ∂θ j. ( j = 1, 2, L , m ).. (6.1.6). 解上面方程组(6.1.5)或(6.1.6) ,就可以得到参数 θ1 , θ 2 , L, θ m 的最大似然估 计值. 例 6.1.6 设总体 X 服从正态分布 N ( µ , σ 2 ) ,其中 µ 及σ >0 都是未知参数, 如果取得样本观测值为 x1 , x2 ,L, xn ,求参数 µ 及σ 的最大似然估计值. 解. 似然函数为 n. L( µ , σ ) = ∏ i =1. −. 1 2πσ n. e.  1  =   e  2πσ . −. ( xi − µ )2 2σ 2. n. 1 2σ. −. 2. ∑ ( xi − µ )2 i =1. ,. 取对数,得 n 1 ln L( µ , σ ) = − ln(2π) − n ln σ − 2 2 2σ. n. ∑ ( x − µ) i. 2. ,. i =1. PDF created with pdfFactory Pro trial version www.pdffactory.com.

(7) 对 µ 及σ 求偏导数,并让其等于零,得  ∂ ln L 1 n  ∂ = 2 ∑ ( xi − µ ) = 0; σ i =1  µ  n n  ∂ ln L = 1 ( xi − µ )2 − = 0. ∑ 3  ∂σ σ σ i =1 解此方程组,即得 µ 及σ 得最大似然估计值是 µˆ = σˆ =. 1 n ∑ xi = x , n i =1. 1 n ∑ ( xi − x ) 2 = σ% . n i =1. 我们指出,最大似然估计具有下述性质: 设参数θ 的函数 ϕ = ϕ (θ ) 具有单值反函数 θ = θ (ϕ ) ,如果 θˆ 是θ 的最大似然估 计,则 ϕˆ = ϕ (θˆ) 是 ϕ (θ ) 的最大似然估计. 因此,由例 6.1.6 可知,正态总体的方差 σ 2 (σ > 0) 的最大似然估计值 σˆ 2 =. 1 n ∑ ( xi − x ) 2 = σ% 2 . n i =1. 所以,正态总体的均值及方差的最大似然估计与矩估计是相同的.. 6.2. 衡量点估计量好坏的标准. 上一节学习了两种总体分布中求未知参数点估计的方法,它们是矩估计法和 最大似然估计法.对于同一个未知参数,用不同的估计法得到的点估计量一般是 不相同的,那么哪一个估计量更好呢?为此需要建立判别估计量好坏的标准,而 参数θ 的所谓“最佳估计量” θˆ( X 1 , X 2 ,L, X n ) 应当是在某种意义下最接近于θ . 最佳估计量 θˆ( X , X ,L, X ) 应符合下列标准: 1. 2. n. 一、无偏性 设参数θ 的估计量 θˆ = θˆ( X 1 , X 2 ,L, X n ) 的数学期望存在且等于θ ,即 E (θˆ) = θ ,. 即不含有系统误差. 例 6.2.1 设总体 X 的均值 E ( X ) = µ ,方差 D( X ) = σ 2 ,证明. 第 6. 则称 θˆ 是参数θ 的无偏估计量. 设样本观测值为 x1 , x2 ,L, xn ,则称 θˆ( x1 , x2 ,L, xn ) 为参数θ 的无偏估计值. 显然,用参数θ 的无偏估计量 θˆ 代替参数θ 时所产生的误差的数学期望为零,. 章 参 数 估 计 163. PDF created with pdfFactory Pro trial version www.pdffactory.com.

(8) 164 概 率 论 与 数 理 统 计. (1)样本均值 X =. 1 n ∑ X i 是总体均值 µ 的无偏估计量. n i =1. 1 n ∑ ( X i − X )2 是总体方差 σ 2 的无偏估计量. n − 1 i =1 证:(1)因为样本 X 1 , X 2 ,L, X n 相互独立,且与总体 X 服从相同分布,所. (2)样本方差 S 2 =. 以有 E ( X i ) = µ , D( X i ) = σ 2 ( i = 1, 2, L, n ), 由于 1 n  1  n  1 n 1 n 1 E ( X ) = E  ∑ X i  = E  ∑ X i  = ∑ E (X i ) = ∑ µ = ⋅ n µ = µ , n n n n n  i =1   i =1  i =1 i =1 所以样本均值 X 是总体均值 µ 的无偏估计量. (2)因为 S2 =. 2 1 n 1  n 2 2 ( X − X ) =  ∑ X i − nX  , i ∑ n − 1 i =1 n − 1  i =1 . 利用关于方差的定理得 E ( X i 2 ) = D( X i ) + [ E ( X i )]2 = σ 2 + µ 2. ( i = 1, 2,L, n ),. 2. E ( X ) = D( X ) + [ E ( X )]2 1 n  1 n = D  ∑ X i  + µ 2 = 2 ∑ D( X i ) + µ 2 n i =1  n i =1  2 1 σ + µ2 , = 2 ⋅ nσ 2 + µ 2 = n n 于是,利用关于数学期望的定理得  1  n 2  2 E (S 2 ) = E   ∑ X i − nX    n − 1  i =1 2  1  n 2  ∑ E ( X i ) − nE ( X )  n − 1  i =1  2 σ  1  2 2 = + µ 2  = σ 2 ,  n(σ + µ ) − n  n − 1   n  . =. 所以, S 2 是 σ 2 的无偏估计量: σˆ 2 = S 2 . 应当指出,同一参数θ 的无偏估计量不是唯一的.例如,有 E ( X i ) = µ ,这表 明任一样本 X i ( i =1,2,…, n )都是总体均值 µ 的无偏估计量.在参数θ 的许多无偏 估计量中,当然是以对θ 的平均偏差较小者为好,也就是说,较好的估计量应当有 尽可能小的方差.为此,引进点估计的第二个标准.. PDF created with pdfFactory Pro trial version www.pdffactory.com.

(9) 二、有效性 设 θˆ1 = θˆ1 ( X 1 , X 2 ,L, X n ) 与 θˆ2 = θˆ2 ( X 1 , X 2 ,L, X n ) 都是参数 θ 的无偏估计量, 如果 D(θˆ1 ) < D(θˆ2 ) 则称 θˆ1 较 θˆ2 有效. 当样本容量 n 一定时,若θ 的所有无偏估计量中,θˆ 的方差 D(θˆ) 最小,则称 θˆ 是参数θ 的有效估计量. 例 6.2.2 证 明 样 本 均 值 X 作 为 总 体 均 值 µ 的 估 计 量 较 个 别 样 本 X i. ( i = 1, 2, L, n )有效.. 证:由例 6.2.1 知, X 与 X i 都是总体均值 µ 的无偏估计量,即 E( X ) = µ , E( X i ) = µ. ( i = 1, 2, L, n ),. 又 1 n  1 n 1 σ2 D( X ) = D  ∑ X i  = 2 ∑ D( X i ) = 2 nσ 2 = , D( X i ) = σ 2 ( i = 1, 2, L, n ). n n n n i =1  i =1  所以当 n ≥ 2 时, D( X ) < D( X i ) ,故样本均值 X 作为总体均值 µ 的估计量较 个别样本 X i ( i = 1, 2, L, n )有效. 例 6.2.3 从总体 X 中抽取样本 X 1 , X 2 , X 3 ,证明下列三个统计量 X X X X X X X X X θˆ1 = 1 + 2 + 3 , θˆ2 = 1 + 2 + 3 , θˆ3 = 1 + 2 + 3 2 3 6 2 4 4 3 3 3 都是总体均值 E ( X ) = µ 的无偏估计量,并确定哪个估计量更有效. 证:. X X  µ µ µ X E (θˆ1 ) = E  1 + 2 + 3  = + + = µ , 3 6  2 3 6  2 X X  µ µ µ X E (θˆ2 ) = E  1 + 2 + 3  = + + = µ , 4 4  2 4 4  2. X X  µ µ µ X E (θˆ3 ) = E  1 + 2 + 3  = + + = µ . 3 3 3  3 3 3  所以三个统计量都是总体均值 µ 的无偏估计量.. X X  σ 2 σ 2 σ 2 24 2 X D(θˆ3 ) = D  1 + 2 + 3  = + + = σ , 3 3  9 9 9 72  3. 第 6. X X  σ 2 σ 2 σ 2 28 2 X D(θˆ1 ) = D  1 + 2 + 3  = + + = σ , 3 6  4 9 36 72  2 X X  σ 2 σ 2 σ 2 27 2 X D(θˆ2 ) = D  1 + 2 + 3  = + + = σ , 4 4  4 16 16 72  2. 章 参 数 估 计 165. PDF created with pdfFactory Pro trial version www.pdffactory.com.

(10) 166 概 率 论 与 数 理 统 计. 24 2 σ 的值最小,所以 θˆ3 是三个估计量中最有效估计量. 72 还应指出,估计量 θˆ( X 1 , X 2 ,L, X n ) 是与样本容量 n 有关的,为了明确起见,不 妨记作 θˆ .希望当 n 越大时,对θ 的估计越精确.于是引进点估计的第三个标准. 由于 D(θˆ3 ) =. n. 三、一致性 如果当 n → ∞ 时, θˆn 按概率收敛于θ ,即对于任意给定的正数 ε ,有 lim P(| θˆ − θ |< ε ) = 1 , n →∞. n. 则称 θˆn 是参数θ 的一致估计量. 例 6.2.4 X=. 1 n. 设 总体 X 的 均 值 E ( X ) = µ , 方 差 D( X ) = σ 2 , 证 明 样 本均 值. n. ∑X. i. 是总体均值 µ 的一致估计量.. i =1. 证:因为样本 X 1 , X 2 ,L, X n 相互独立,且与总体 X 服从相同的分布,所以 E ( X i ) = µ , D( X i ) = σ 2 于是,由切比雪夫定理知: 1 n 1 lim P  Xi − n n →∞ n  i =1 所以 X 是 µ 的一致估计量.. ∑. ( i = 1, 2, L, n ),. . n. ∑ E( X ) < ε  = i. i =1. lim P(| X − µ | < ε ) = 1 . n →∞. 此外,还可以证明:样本方差 S 2 是总体方差 σ 2 的一致估计量. 综上所述,对于未知参数θ 的估计量,可以运用无偏性、有效性、一致性来判 断其优劣,以便选择出较好的估计量.. 6.3. 参数的区间估计. 前面两节介绍了点估计的概念.点估计只是给出了待估参数或参数函数的值 是多少,但无法回答如估计误差有多大、在允许可靠范围之内最大估计误差是多 少等这样的问题,这正是下面内容要回答的问题. 区间估计就是将一个未知参数或参数函数值估在一个区间范围之内,例如一 个人的年龄,可以估计为 30 岁,这就是点估计;但也可估计其年龄在 29 岁到 31 岁之间,这种估计就是区间估计.从直观上说,后者给人的印象要比前者更为可 信,因为后者已经把可能出现的误差考虑在内. 先看下面两个例子. 例 6.3.1 某农作物的平均亩产量 X (单位:kg)服从正态分布 N ( µ ,100 2 ) , 今随机抽取 100 亩进行试验,观察其亩产量值 x1 , x2 ,L, x100 ,基此算出 x =500kg,. PDF created with pdfFactory Pro trial version www.pdffactory.com.

(11) 因此 µ 的点估计值为 500.由于抽样的随机性, µ 的真值与 x 的值总有误差,希 望以 95%的可靠度估计 x 与 µ 的最大误差是多少?  σ2 因为, X ~ N  µ , n .   ,从而存在 c >0,使得  P (| X − µ |≤ c) = 0.95 ,. 因此,这个 c 就是可允许的最大误差. 注 意 : 事 件 | X − µ |≤ c 等 价 于 µ ∈ [ X − c, X + c] , 这 就 是 说 : 随 机 区 间 [ X − c, X + c ] 覆盖未知参数 µ 有 95%的机会,习惯上称此随机区间为 µ 的区间估 计. 例 6.3.2 某工厂欲对出厂的一批电子器件的平均寿命进行估计,随机地抽取 n 件产品进行试验,通过对试验的数据的加工得出该批产品是否合格的结论?并要 求此结论的可信程度为 95%,应该如何来加工这些数据? 对于“可信程度”如何定义,下面再说,但从常识可以知道,通常对于电子 元器件的寿命指标往往是一个范围,而不必是一个很准确的数.因此,在对这批 电子元器件的平均寿命估计时,寿命的准确值并不是最重要的,重要的是所估计 的寿命是否能以很高的可信程度处在合格产品的指标范围内,这里可信程度是很 重要的,它涉及到使用这些电子器件的可靠性.因此,若采用点估计,不一定能 达到应用的目的,这就需要引入区间估计. 区间估计粗略地说是用两个统计量 θˆ1 和 θˆ2 (θˆ1 ≤ θˆ2 ) 所决定的区间 [θˆ1 ,θˆ2 ] 作为 参数θ 取值范围的估计.显然,一般地这样说是没有多大的意义的,首先,这个估 计必须有一定的精度,即是说 θˆ2 − θˆ1 不能太大,太大不能说明任何问题;其次,这 个估计必须有一定的可信程度, 因此 θˆ − θˆ 又不能太小,太小难以保证这一要求.比 2. 1. 如从区间[1,100]去估计某人的岁数,虽然绝对可信,却不能带来任何有用的信息; 反之,若用区间[30,31]去估计某人的岁数,虽然提供了关于此人年龄的信息,却很 难使人相信这一结果的正确性.希望既能得到较高的精度,又能得到较高的可信 程度,但在获得的信息一定(如样本容量固定)的情况下,这两者显然是不可能 同时达到最理想的状态.通常是采取将可信程度固定在某一需要的水平上,求得 精度尽可能高的估计区间. 下面给出区间估计的正式的定义. 设 X 1 , X 2 ,L, X n 是来自总体 f ( x,θ ) 的样本,对于参数θ ,如果有两个统计量 θˆ = θˆ ( X , X ,L, X ) , θˆ = θˆ ( X , X ,L, X ) ,满足对给定的 α ∈ (0,1) ,有 1. 1. 1. 2. n. 2. 2. 1. 2. n. [θˆ1 ( x1 , x 2 ,L, xn ) , θˆ2 ( x1 , x2 ,L, xn )]. 第 6. P{θˆ1 ≤ θ ≤ θˆ2 } = 1 − α , 则称区间 [θˆ1 ,θˆ2 ] 是θ 的一个区间估计或置信区间, θˆ1 , θˆ2 分别称为置信下限、置 信上限,1 − α 称为置信水平.一旦样本有观测值 x1 , x2 ,L, xn ,则称相应的. 章 参 数 估 计 167. PDF created with pdfFactory Pro trial version www.pdffactory.com.

(12) 168 概 率 论 与 数 理 统 计. 为置信区间的观察值 . 这里的置信水平,就是对可信程度的度量.置信水平为1 − α ,在实际上可以 这样来理解如取1 − α = 95% ,就是说若对某一参数θ 取 100 个容量为 n 的样本,用 相同方法做 100 个置信区间. [θˆ ( k ) ,θˆ (k ) ] ( k = 1, 2, L ,100 ),其中有 95 个区间包含 1. 2. 真参数θ .因此,当实际上只做一次区间估计时,有理由认为它包含真参数.这样 判断当然也可能犯错误,但犯错误的概率只有 5%. 下面来讨论一下区间估计的一般步骤. (1)设欲估参数为θ ,先取θ 的一个点估计 θˆ ,它满足两点:一是它较前面 提出的标准应该是一个“好的”估计量,二是它的分布形式应该已知,且只依赖 未知参数θ . (2)所求的区间考虑为θˆ 的一个邻域[θˆ − a, θˆ + b] ,a, b > 0 ,使得对于0 < α < 1 , P{θˆ − a ≤ θ ≤ θˆ + b} = 1 − α ,. (6.3.1). 且一般要求 a + b 尽可能小.为确定 a、b ,须用解不等式的方法将(6.3.1)式中的 随机事件变成类似于下述等价形式: {θˆ − a ≤ θ ≤ θˆ + b} = {− g (a ) ≤ T ( X1 , X 2 ,L X n ;θ ) ≤ g (b)} . (6.3.2) 其中,g ( x) 为可逆的 x 的已知函数,T = T ( X 1 , X 2 ,L, X n ; θ ) 的分布与θ 无关且已知, 一般其分位点应有表可查,这是关键的一步.于是就可得出 g (a) 、 g (b) 为某个分 位点,如 g (a) = c 、 g (b) = d . (3)从 g (a) 和 g (b) 的表达式中解出 a、b 即可. 区间估计涉及到抽样分布,对于一般分布的总体,其抽样分布的计算通常有 些困难,因此,我们将主要研究正态总体参数的区间估计问题.. 6.4. 正态总体均值与方差的区间估计 设 X 1 , X 2 ,L, X n 为 N ( µ , σ 2 ) 的样本,对给定的置信水平1 − α ( 0 < α < 1 ),分别. 研究参数 µ 与 σ 2 的区间估计. 一、正态总体均值 µ 的区间估计 在上述前提下,求 µ 的置信水平为1 − α 的区间估计. 考虑 µ 的点估计为 X 和  σ2  X ~ N  µ,  ,确定 a > 0、b > 0 使 n   P ( A) = P{ X − a ≤ µ ≤ X + b} = 1 − a , 且使区间长 a + b 尽可能小.下面分两种情况. 1. σ 2 已知 变换事件 A ,使 A 表成式(6.3.2)的形式:. PDF created with pdfFactory Pro trial version www.pdffactory.com.

(13) µ−X b   −a A= ≤ ≤  σ / n σ / n σ / n  这里 U (µ ) = 使. a +b σ/ n. µ−X ~ N (0,1) ,为使 P ( A) = 1 − α ,又要尽量使 a + b 最小,亦即 σ/ n. 最小,如图 6-1 所示,从 N (0,1) 密度函数的特点来看(对称、原点附近 a. 密度最大,往两边密度减小) ,只有取. σ/ n. =. b σ/ n. = µα ,即 a = b = µα σ / n , 2. 2. 从而所求的区间是 uα σ uα σ   X − 2 , X + 2  .  n n . (6.4.1). 图 6-1. 例 6.4.1 从一批零件中,抽取 9 个零件,测得其直径(单位:mm)为: 19.7 20.1 19.8 19.9 20.2 20.3 设零件直径服从正态分布 N ( µ , σ 2 ) ,且已知σ =0.21mm,求这批零件直径的 均值 µ 的置信水平为 0.95 及 0.99 的置信区间. 解 有 x ≈ 20.01mm. 如果置信水平1 − α =0.95,则α =0.05,查正态分布表得 uα = u0.025 = 1.96 . 由 2. 此得 σ0 n. uα = 2. 0.21 9. ×1.96 ≈ 0.14 mm,. 所以,置信区间为. 第. 2. 由此得. 6. (19.87,20.15) mm. 如果置信水平1 − α =0.99,则α =0.01,查附表 2 得 uα = u0.005 = t 0.005(∞) = 2.58 .. 章 参 数 估 计 169. PDF created with pdfFactory Pro trial version www.pdffactory.com.

(14) 170 概 率 论 与 数 理 统 计. σ0 n. uα = 2. 0.21 9. × 2.58 ≈ 0.18 mm,. 所以,置信区间为 (19.83,20.19) mm. 从这个例子,可以看到,当样本容量 n 一定时,为了提高区间估计的可靠性, 应当取较高的置信水平,但这时求出的置信区间也较大,这样就使估计的精确度 降低;如果要提高估计的精确度,则应当缩小置信区间,然而对应的置信水平也 将随之降低.由此可见,区间估计与置信水平有密切的关系. 2. σ 2 未知 将事件 A 变换成式(6.3.2)的形式 µ−X b  − a  ≤ ≤ A= .  S / n − 1 S / n − 1 S / n − 1  µ−X 已知 T (µ ) = ~ t ( n − 1) ,为使 P ( A) = 1 − α ,且区间尽量短,与 N (0,1) 情 S / n −1 a b 形一样,只有取 = = tα (n − 1) .因此所求区间为 S / n −1 S / n − 1 2 t α (n − 1) S tα (n − 1) S   X − 2 . ,X+ 2  n −1 n − 1 . (6..4.2). 图 6-2. 例 6.4.2. 在上面例 6.4.1 中,设σ 未知,求零件直径的均值 µ 的置信水平为. 0.95 的置信区间. 解 有 x ≈ 20.01 mm, s ≈ 0.203 mm, 已给置信水平 1 − α =0.95,则 α =0.05;自由度 k = 9 − 1 = 8 ;查 t 分布表得 t α (1 − α ) = t0.025 (8) = 2.31 .由此得 2. s n. tα = 2. 0.203 9. × 2.31 ≈ 0.16 mm,. PDF created with pdfFactory Pro trial version www.pdffactory.com.

(15) 所以,置信区间为 例 6.4.3. (19.85,20.17) mm. 一批零件尺寸服从 N ( µ , σ 2 ) ,对 µ 进行区间估计( σ 2 未知),要求估. 计精度不低于 2δ ,置信水平保持为1 − α ,问至少要抽取多少件产品作为样本? 解 显然,此处要求 P{ X − δ ≤ µ ≤ X + δ } = 1 − α , 由式(6.4.2)知 δ = t. 1−. α 2. (n − 1) S / n − 1 ,. 故  t α (n − 1) S   1−  n= 2  +1 , δ     2. 上式不是 n 的显式,但对于具体数值,可采取“试算法”来确定 n .一般是先对 S 2 作个大致估计(可以由以往的经验确定) ,然后用试算的方式确定适合上面方程的 2 n .例如若估计出 S ≈ 200 ,又已知 δ = 10, α = 0.05 ,来试算 n : 2 取 n = 10,t0.975 (9) = 2.2622,t 0.975 (9) × 2 + 1 ≈ 11.24 , 2 (10) × 2 + 1 ≈ 10.93 , 取 n = 11,t0.975 (10) = 2.2281,t 0.975. 显然,如果任正整数不可能严格满足上面方程的话,则应取使方程左边大于 右边的最小的 n ,因此应该取 n = 11 . 二、方差 σ 2 的区间估计 1. µ = µ0 已知 样本函数 χ2 =. 1 σ2. n. ∑ (X. i. − µ0 ) 2 ~ χ 2 ( n) .. i =1. χ 2 分布的分布曲线是不对称的,对于已给的置信水平1 − α ,要想找到最短的 置信区间是困难的.因此,仿照上述分布曲线为对称的情形,选取这样的的区间 ( χ α 2 (n),χ α 2 (n) ),使得 1−. 2. 2. 第 6.     α α P  χ 2 ≥ χ α 2 ( n)  =1 − , P  χ 2 ≥ χα 2 ( n)  = , 1− 2  2   2  2 是合理的如图 6-3 所示.于是,有   P  χ α 2 ( n) < χ 2 < χα 2 ( n)  =1 − α ,  1− 2 2 . 章 参 数 估 计 171. PDF created with pdfFactory Pro trial version www.pdffactory.com.

(16) 172 概 率 论 与 数 理 统 计.  1 P  χ α 2 ( n) < 2 1− σ  2. n. ∑(X i =1. i.  − µ0 ) 2 < χ α 2 ( n)  =1 − α ,  2. 即  n 2  ∑ ( X i − µ0 ) = 1 i P  <σ2 <  χ α 2 (n)  2 .  − µ0 ) 2  i =1  =1 − α . χ 2 α (n)  1−  2  n. ∑ (X. i. 图 6-3. 上式表明,总体方差 σ 2 的置信水平为1 − α 的置信区间是 n  n  2 ( X i − µ0 ) 2   ∑ ( X i − µ0 ) ∑  i =1 . , i =1 2  χ α 2 (n) χ α (n)  1−   2 2   由此得到总体标准差σ 的置信水平为1 − α 的置信区间是 n  n   ∑ ( X i − µ0 ) 2 ( X i − µ0 ) 2  ∑  i =1 . i =1 ,  χ α 2 (n) χ 2 α (n)   1−  2 2     2. µ 未知 样本函数 χ2 =. (n − 1)S 2 ~ χ 2 (n − 1) , 2 σ. 与上面类似,对于已给的置信水平1 − α ,有   (n − 1) S 2 P  χ α 2 ( n − 1) < < χ α 2 ( n − 1)  = 1 − α , 2 σ  1− 2 2  即. PDF created with pdfFactory Pro trial version www.pdffactory.com.

(17)    (n − 1)S 2 (n − 1) S 2  2 P 2 <σ < 2  = 1−α . χ α (n − 1)   χ α (n − 1) 1− 2  2  上式表明,总体方差 σ 2 的置信水平为1 − α 的置信区间是   (n − 1) S 2 ,  2  χ α (n − 1)  2.  (n − 1)S 2  . χ 2 α (n − 1)  1−  2. 由此得到总体标准差 σ 的置信水平为1 − α 的置信区间是    (n − 1) S 2 (n − 1) S 2  ,  . 2 2  χ α (n − 1) χ1− α (n − 1)  2 2   例 6.4.4 在上面例 6.4.1 中,求零件直径的方差 σ 2 的置信水平为 0.95 的置信 区间,如果: (1)已知零件直径的均值 µ = 20 mm; (2) µ 未知. 解 (1)已知 µ = 20 ,不难计算 9. ∑ ( x − 20) i. 2. = 0.33 mm2.. i =1. 已给置信水平1 − α =0.95,则α =0.05;自由度 k =9;查 χ 2 分布表, χ. 1−. α 2. 2. (n) = χ 0.9752 (9) =2.70,. χ α 2 (n) = χ 0.0252 (9) =19.0. 2. 所以,所求置信区间为  0.33 0.33  ,  ,  19.0 2.70  即 (0.0174, 0.1222) mm 2. (2) µ 未知,有 s 2 ≈ 0.0411 mm2. 已给置信水平1 − α =0.95,则α =0.05;自由度 k =9;查附表得. 第 6. χ. 1−. α 2. 2. (n − 1) = χ. 2 0.975. (8) =2.18, χ α (n − 1) = χ 2. 2 0.025. (8) =17.5.. 2. 所以,所求置信区间为. 章 参 数 估 计 173. PDF created with pdfFactory Pro trial version www.pdffactory.com.

(18) 174 概 率 论 与 数 理 统 计.  8 × 0.0411 8 × 0.0411  ,  , 2.18   17.5 即 (0.0188, 0.1508) mm 2.. 6.5. 两个正态总体均值差及方差比的置信区间 现在讨论关于两个正态总体的均值差及方差比的区间估计问题. 设总体 X 服从正态分布 N ( µ1 , σ 12 ) ,从其中抽取容量为 n1 的样本,得到样本观. 测值为 x1 , x2 ,L, xn1 ;又设总体Y 服从正态分布 N ( µ2 , σ 22 ) ,从其中抽取容量为 n2 的 样本,得到样本的观测值为 y1 , y2 ,L, yn2 ;求两个总体的均值差 µ1 − µ2 及方差比. σ 12 σ 22. 的置信水平为1 − α 的置信区间. 一、两个正态总体均值差的区间估计 1. σ 12 及 σ 22 已知 当 σ 12 及 σ 22 已知时,有  σ2    σ2  σ2 σ2  X ~ N  µ1 , 1  , Y ~ N  µ2 , 2  , X − Y ~ N  µ1 − µ 2 , 1 + 2  , n1  n2  n1 n2     得 ( X − Y ) − ( µ1 − µ2 ) σ 12 σ 22 + n1 n2. ~ N (0,1) ,. 对于已知置信水平1 − α ,则有  | ( X − Y ) − (µ1 − µ2 ) | < uα P σ 12 σ 22  2 +  n1 n2 .   = 1−α ,   . 即   σ 12 σ 22 P  | ( X − Y ) − (µ1 − µ2 ) |< + uα  = 1 − α ,  n1 n2 2    所以两个总体均值差 µ1 − µ2 的1 − α 置信区间为   σ2 σ2 σ 12 σ 22  X − Y − 1 + 2 uα , X − Y + + uα  .  n1 n2 2 n1 n2 2   . PDF created with pdfFactory Pro trial version www.pdffactory.com. (6.5.1).

(19) 2. σ 12 及 σ 22 未知,假定 σ 12 = σ 22 样本函数 T=. ( X − Y ) − ( µ1 − µ2 ) Sw. 1 1 + n1 n2. ~ t ( n1 + n2 − 2) ,. 其中 Sw =. (n1 − 1) S12 + (n2 − 1) S 22 , n1 + n2 − 2. 对于已知的置信水平1 − α ,有  | ( X − Y ) − ( µ1 − µ2 ) |  P < tα ( n1 + n2 − 2)  = 1 − α , 1 1   2 Sw +   n n 1 2   即   1 1 + ⋅ S w ⋅ tα (n1 + n2 − 2)  = 1 − α , P  | ( X − Y ) − (µ1 − µ2 ) |< n1 n2   2 故可得两个总体均值差 µ1 − µ2 的置信水平为1 − α 的置信区间为   1 1 1 1 + ⋅ Sw ⋅ tα (n1 + n2 − 2), X − Y + + ⋅ S w ⋅ t α (n1 + n2 − 2)  .(6.5.2)  X − Y − n1 n2 n1 n2   2 2 例 6.5.1 为了估计磷肥对某种农作物的增产作用,分别各选 10 块土地,分别 做 施 肥 和不 施 肥的 试 验 ,设 施 肥的 亩 产量 X ~ N ( µ1 , σ 12 ) , 不 施肥 的 亩 产量 10. Y ~ N ( µ2 , σ 22 ) .测得如下数据:n1 = n2 = 10,x = 600,y = 540 ,∑ ( xi − x ) = 6400 , 2. i =1. 10. ∑ ( y − y) i. 2. = 2400 ,取置信水平为 95%,求施肥和不施肥的平均亩产之差 µ1 − µ2 的. i =1. 置信区间. 解 由题设知 x = 600,y = 540 ,并求得 n1. n2. (n1 − 1) S12 = ∑ ( xi − x ) = 6400 , (n2 − 1) S 22 = ∑ ( yi − y ) = 2400 , i =1. 2. i =1. (n1 − 1) S12 + (n2 − 1) S 22 6400 + 2400 = = 22.11 , n1 + n2 − 2 10 + 10 − 2. 由 α = 0.05 ,查表得 t α (18) = 2.10 .故 µ1 − µ2 的置信区间为 2. 第 6. Sw =. 2. 章 参 数 估 计 175. PDF created with pdfFactory Pro trial version www.pdffactory.com.

(20) 176.  1 1 1 1 + ⋅ S w ⋅ tα,x − y + + ⋅ Sw ⋅t α  x − y − n1 n2 n1 n2  2 2  1 1 + ⋅ 22.11× 2.10,600 − 540 + =  600 − 540 − 10 10  =(60-20.7646,60+20.7646) =(39.2354,80.7646). 概 率 论 与 数 理 统 计.     1 1 + ⋅ 22.11 × 2.10  10 10 . 因为置信区间的下限 39.235470,所以在置信水平为1 − α=0.95 下,认为施肥 的平均产量 µ1 大于不施肥的平均亩产量 µ2 . 二、两个正态总体方差比的区间估计 当 µ1 和 µ2 都未知时,有 (n1 − 1)S12 (n2 − 1) S 22 2 ~ ( − 1) , ~ χ 2 ( n2 − 1) , χ n 1 σ 12 σ 22 因此 S12 σ 12 ~ F ( n1 − 1, n2 −1) . S22 σ 22 对于置信水平1 − α ,如图 6-4 所示,有. 图 6-4.   S2 S2 P  F α ( n1 − 1, n2 − 1) < 12 22 < Fα ( n1 −1, n2 −1)  = 1 − α , 1− σ1 σ 2 2  2  即  S2  σ 2 S2 1 1  P  12 ⋅ < 12 < 12 ⋅ = 1− α .  S2 Fα σ 2 S 2 F1−α   2 2  σ 12 所以,两个总体方差比 2 的置信水平为1 − α 的置信区间为 σ2  S2  S12 1 1  1 ⋅ . , ⋅  S22 Fα ( n1 − 1, n2 − 1) S 22 F α ( n1 − 1, n2 −1)  1−  2 2 . PDF created with pdfFactory Pro trial version www.pdffactory.com. (6.5.3).

(21) 例 6.5.2. 已知两个正态总体 X ~ N ( µ1 , σ 12 ) , Y ~ N ( µ2 , σ 22 ) ,其中 µ1 和 µ2 未. 知,分别测得有关数据为 n1 = 4,S12 = 4.8,n2 = 5,S 22 = 4.0 .试求方差比. σ 12 的置信 σ 22. 水平为 90%的置信区间. 解 由题设知 S12 4.8 = =1.2, Fα ( n1 − 1, n2 − 1) = F0.05 (3, 4) =6.59 S22 4.0 2 F. 1−. α 2. ( n1 − 1, n2 − 1) = F0.95 (3, 4) =. 由(6.5.3)式知,所求. 1 1 = F0.05 (4,3) 9.12. σ 12 的置信区间为 σ 22. 1   , 1.2 × 9.12  =(0.182,10.944).  1.2 × 6.59   因为置信区间下限 0.185<1,而上限 10.944>1,所以在置信水平 90%下,可以 认为两个总体的方差没有明显差异.. 6.6. 单侧置信区间. 前面所讨论的置信区间都是双侧的,但在实际问题中,有时只需要讨论单侧 置信上限或单侧置信下限就可以了.例如,对于家用电器的使用寿命来说,当然 希望使用寿命越长越好,我们关心的是一批家用电器的平均寿命 µ 的下限;又如, 对于产品的次品率来说,当然希望次品率越低越好,我们关心的是一批产品的次 品率的上限. 定义 6.6.1 设总体 X 的分布中含有未知参数θ ,对于给定的置信水平1 − α , 若存在统计量 θˆ 下 ,使得 P (θ >θˆ ) =1 − α , 下. 则称 θˆ 下 为θ 的置信水平为1 − α 的单侧置信下限. 类似地,若存在统计量 θˆ ,使得 上. P (θ <θˆ上 )=1 − α , 设总体 X ~ N ( µ , σ 2 ) ,其中 µ、σ 2 都未知,由已学过的定理知 X −µ (n − 1)S 2 ~ t (n − 1) , ~ χ 2 ( n − 1) , S σ2 n. 第 6. 则称 θˆ上 为θ 的置信水平为1 − α 的单侧置信上限.. 章 参 数 估 计 177. PDF created with pdfFactory Pro trial version www.pdffactory.com.

(22) 178 概 率 论 与 数 理 统 计. 故有  X −µ  P < tα ( n − 1)  = 1 − α , S   n   即 S   Pµ > X − tα (n − 1)  = 1 − α , n   所以, µ 的置信水平为1 − α 的单侧置信下限为 µˆ 下 = X −. S n. tα (n − 1) .. (6.6.1). 同理知,有  (n − 1) S 2  P > χ12−α ( n − 1)  = 1 − α , 2  σ  即  (n − 1) S 2  P σ 2 < 2  = 1− α , χ1−α (n − 1)   所以得 σ 2 的置信水平为1 − α 的单侧置信上限为  (n − 1) S 2  2 = 2 σˆ 上 (6.6.2) .  χ1−α (n − 1)  例 6.6.1 已知电子元件的寿命 X(小时)服从正态分布 N ( µ , σ 2 ),其中 µ 和 σ 2 都未知,随机抽取 6 个元件测试,得有关数据 X = 4563.2, S 2 = 1024 .已给置信水 平为 0.95,试分别求 µ 的单侧置信下限和 σ 2 的单侧置信上限. 解. 由题设知 X = 4563.2, S = 32 .由(6.6.1)式知 µ 的置信水平为1 − α 的单. 侧置信下限为 µˆ 下 = X −. S n. tα (n − 1) ,. 其中 tα (n − 1) = t0.05 (5) = 2.02 ,代入得 µˆ 下 = 4563.2 −. 32 6. × 2.02 = 4563.2 − 26.39 = 4536.81 ;. 查表得 2 χ12−α (n − 1) = χ0.95 (5) = 1.145 ,. 由(6.6.2)式知 σ 2 的置信水平为1 − α 的单侧置信上限为  (n − 1) S 2  5 ×1024 2 σˆ 上 = 2 = 4471.62 . =  χ1−α (n − 1)  1.145. PDF created with pdfFactory Pro trial version www.pdffactory.com.

(23) 概率故事. 社会舆论调查. 第 6. 即使我下定决心,我仍充满了犹豫. ——奥斯卡·列文托(Oscar Levant) 过去,当权者们利用侦探系统来查明公众的观点.或许,由此所收集的信息 帮助他们形成公众政策,制定和实施法律.现代的社会舆论调查的历史,是从盖 洛普民意调查的第一个报告开始的.今天,社会舆论调查在报纸和其他新闻媒介 中已经扮演了一个非常重要的角色.他们收集公众对各种社会、政治和经济问题 上的信息,出版摘要报告.这样的舆论调查在民主政治社会中能起到积极的作 用.他们可以告诉政治领导人和官僚们什么是公众的需要,什么是公众的爱好.他 们也向公众报告新闻来通告公众的想法,或许可在某个重要的问题上帮助公众明 确表现他们的观点. 通常以某种特定的统计形式宣布公众舆论调查的结果同时需要一定的解 释.例如,播音员说: “赞成总统外交政策的人占 42%,正负误差界限为 4%. ”代 替给出单个数字,这里播音员给出一个区间(42-4,42+4) = (38,46).这是如何得到 的?如何解释呢? 假设所有美国成人中,实际赞成总统外交政策的比率为数值 T.为了了解 T 的大小,必须接触每一个美国成人,得到他们对“你赞成总统的外交政策吗?” 这样问题的反应.如果必须要得到一个限时的、迅速的答案,这是不可能的.最 好的方法是求出一个最接近于 T 的估计值.新闻媒介对某一数量的“任意选择的 个体”进行电话采访,得到他们的答案.如果接触了数量为 n 的个体,其中有 m 个 人回答“赞成” ,则 T 的估计值可为 100×(m/n).当然,这样的估计是存在一定的 误差的,因为所取的仅仅是某个集合中的样本(美国成人中很小的一部分).如果 接触另外的 n 个人,可能得到不同的估计值.如何求出估计值的误差呢?基于两个 统计学家内曼和阿·皮尔森发展起来的一个理论,可以根据算出一个数字 ε ,使得 T 的真实值有很高的概率,一般为 95%(或 99%),落于区间(100×(m/n) −ε ,100 ×(m/n)+ ε )之内.也就是说,这个区间不包含真实值的事件,等价于在装有 5 个 (或 1 个)白球,95 个(或 99 个)黑球的口袋中随机地抽取一球,抽得白球这样 一个几乎很少发生的事件. 社会舆论调查的有效性,基于所选择个体的“代表性”.十分明显的是,调查 的结果是依赖于所选择个体所属的政治团体的(民主党或共和党).即便假设所选 择的个人的政治所属是没有偏差的,如果有些个体不回答问题,有些又恰恰属于 某些特别的政治团体,则结果也会不同.任何调查中,都有不同程度的不回答者,. 章 参 数 估 计 179. PDF created with pdfFactory Pro trial version www.pdffactory.com.

(24) 180 概 率 论 与 数 理 统 计. 这种场合要评价误差是困难的,除非有更多的可利用的信息.. 习题六 1.设 X 1 , X 2 ,L, X n 是取自总体 X 的一个样本,在下列情形下,试求总体参数 的矩估计与最大似然估计: (1) X ~ B (1, p) ,其中 p 未知, 0 < p < 1 ; (2) X ~ E (λ ) ,其中 λ 未知, λ >0. 2.设总体 X 服从“0-1”分布: p( x; p) = p x (1 − p )1− x ( x = 0,1) . 如果取得样本观测值为 x1 , x2 ,L, xn ( xi = 0或1 ),求参数 p 的矩估计值与最大似然 估计值. 3.设总体 X 服从几何分布: p( x; p ) = p x (1 − p) x −1 ( x = 0,1) . 如果取得样本观测值为 x1 , x2 ,L, xn ,求参数 p 的矩估计值与最大似然估计值. 4.设 X 1 , X 2 ,L, X n 是取自总体 X 的一个样本,其中 X 服从参数为 λ 的泊松分 布,其中 λ 未知, λ >0,求 λ 的矩估计值与最大似然估计值.如果得到一组样本 观测值如表 6-1 所示. 表 6-1 X. 0. 1. 2. 3. 4. 频数. 17. 20. 10. 2. 1. 求参数 λ 的矩估计值与最大似然估计值. 5.已知某种灯泡的寿命 X ~ N ( µ , σ 2 ) ,但 µ 和 σ 2 未知,今随机抽取 5 只灯 泡测得寿命(单位:小时)分别为 1623 1527 1287 1432 1591 求 µ 和 σ 2 的估计值. 6 . 设 总 体 在 区 间 [a, b] 上 服 从 均 匀 分 布 , 但 a、b 未 知 , 现 抽 取 样 本 X 1 , X 2 , X 3 , X 4 , X 5 ,测得一组观测值(1,3,0,4,-2) ,试用矩估计法估计 a、b . λ e− λ x, ( x > 0), 7.设总体 X 的密度函数为 f ( x, λ ) =  ,其中参数 λ 未知而待  0, ( x ≤ 0). 定,抽样得样本观测值 x1 , x2 ,L , xn1 ,求参数 λ 的极大似然估计. 8,若 X ~ N ( µ , σ 2 ) ,其中 µ 和 σ 2 均未知,设样本一组观测值为 x1 , x2 ,L , xn1 , 用极大似然估计法估计 µ 和 σ 2 . 9.已知某种电子元件的使用寿命(从开始使用到初次失效为止)服从指数分. PDF created with pdfFactory Pro trial version www.pdffactory.com.

(25) 布 f ( x ) = λ e− λ x ( x > 0, λ > 0) ,今随机抽取 250 个元件,测得寿命数据如表 6-2 所 示(单位:小时) . 表 6-2 寿命时间(小时). 元件数(个). 0~100. 39. 100~200. 58. 200~300. 47. 300~400. 33. 400~500. 25. 500~600. 22. 600~700. 11. 700~800. 6. 800~900. 7. 900~1000. 2. 合计. 250. 试采用极大似然估计法估计该指数分布中的参数 λ . 10.设总体 X 服从二项分布 B (n, p) , n 为正整数, 0 < p < 1 ,其中 n, p 均为 未知参数, x1 , x2 ,L, xm 是从 X 中抽取的一个样本,试分别求 n, p 的矩估计. 11.设 x1 , x2 , x3 是正态总体 N ( µ , σ 2 ) 的一个样本,其中 µ = 0 并 σ 2 未知,求 x1 , x2 , x3 的似然函数,并对 x1 , x2 , x3 的一个样本 2.1、2.2、2.0 估计 σ 2 .  1 − θx  e , ( x ≥ 0) 12.设 x1 , x2 ,L, xn1 来自指数分布 f ( x, λ ) = θ 的样本,试分别用  0, ( x < 0)  矩估计法和极大似然法求θ 的估计量. 13.证明:如果已知总体 X 的均值 µ ,则总体方差的无偏估计量为 σˆ 2 =. 1 n. n. ∑(X. i. − µ)2 ,. i =1. 其中 X 1 , X 2 ,L, X n 是从总体 X 中抽取的样本. 14.设正态总体 N ( µ , σ 2 ) 中 µ 未知而 σ 2 已知,又设 x1、x2 是来自正态总体的 一个样本,问下列样本函数中哪个是统计量?在统计量中,哪些是 µ 的无偏估计?. 6. 哪个是最佳无偏估计? 1 2 (1) µ1 = x1 + x2 ; 3 3. 参 数 估 计. 1 (2) µ 2 = ( x1 + µ ) ; 3. 第 章. 181. PDF created with pdfFactory Pro trial version www.pdffactory.com.

(26) 182 概 率 论 与 数 理 统 计. (3) µ3 =. 1 1 x1 + x2 ; 2 2. (4) µ4 =. 2. ∑σ . xi. i =1. 15.设 X 1 , X 2 , X 3 为总体 X 的样本,证明 1 1 1 X 1` + X 2 + X 3 , 6 3 2 2 1 2 µˆ 2 = X 1` + X 2 + X 3 , 5 5 5 都是总体均值 µ 的无偏估计,并进一步判断哪一个估计更有效. µˆ1 =. 16.设总体 X ~ N ( µ ,0.09) ,测得一组样本的观测值为 12.6,13.4,12.8,13.2, 求 µ 的置信度为 0.95 的置信区间. 17.对某型号飞机的飞行速度进行了 15 次试验,测得最大飞行速度(米/ 秒)为 422.2 417.2 425.6 420.3 425.8 423.1 418.7 428.2 438.3 434.0 412.3 431.5 413.5 441.3 423.0 根据长期经验,最大飞行速度可以认为是服从正态分布的,试利用上述数据对最 大飞行速度的期望值进行区间估计(置信度 0.95). 18.对某种材料的强度只有下限的要求,已知该材料的强度 X ~ N ( µ , σ 2 ) , 但 µ 、 σ 2 均未知,今进行 5 次测试,得样本均值和样本均方差分别为 X = 1160kg/cm2, s =99.75kg/cm2,现求 µ 的 0.99 单侧置信区间 (θˆ, +∞) . 19.正态总体 X ~ N ( µ , σ 2 ) 中抽取一组样本容量为 n = 25 的样本,计算得样 本均值 x = 79 ,样本方差为 s 2 = 112.36 ,试求(1)已知 σ 2 = 102 ;(2) σ 未知两 种情况分别求总体均值 µ 的置信度为 0.95 的置信区间. 20.为确定某种液体的浓度,取 4 个独立的测定值,其平均值 x = 8.38% ,样 本标准差 s = 0.03% ,设被测总体近似地服从正态分布 N ( µ , σ 2 ) ,求总体均值 µ 的 置信度为 95%的置信区间. 21.从一批钉子中随机地抽取 16 枚,测得其长度(单位:cm)为 2.14 2.10 2.13 2.15 2.13 2.12 2.13 2.10 2.15 2.12 2.14 2.10 2.13 2.11 2.14 2.11 设钉长服从正态分布 N ( µ , σ 2 ) ,试求(1)已知 σ =0.1(cm); (2) σ 未知,两种 情况分别求总体均值 µ 的 90%的置信区间. 22.某食品加工厂有甲乙两条加工猪肉罐头的生产线.设罐头质量服从正态 分布并假设甲生产线与乙生产线互不影响.从甲生产线抽取 10 只罐头测得其平均 质量 x = 501g ,已知其总体标准差 σ 1 = 5g ;从乙生产线抽取 20 只罐头测得其平均 质量 y = 498g ,已知其总体标准差 σ 2 = 4g ,求甲乙两条猪肉罐头生产线生产罐头. PDF created with pdfFactory Pro trial version www.pdffactory.com.

(27) 质量的均值差的 µ1 − µ2 的双侧 0.99 置信区间. 23.为了比较甲乙两种显像管的使用寿命 X 和 Y ,随机地抽取甲乙两种显像 管各 10 只,测得数据 x1 , x2 ,L, x10 和 y1 , y2 ,L, y10 (单位:104h)且由此算得 x = 2.33, y = 0.75,. 10. ∑(x − x) i. 2. = 27.5,. i =1. 10. ∑( y. i. − y ) 2 = 19.2 .. i =1. 假定两种显像管的使用寿命均服从正态分布,且由生产过程知道它们的方差相等, 试求两个总体均值之差 µ1 − µ2 的双侧 0.95 置信区间. 24.从汽车轮胎厂生产的某种轮胎中抽取 10 个样品进行磨损试验,直至轮胎 行驶到磨坏为止,测得它们的行驶路程(km)如下: 41 250 41 010 42 650 38 970 40 200 42 550 43 500 40 400 41 870 39 800 2 设汽车轮胎行驶路程服从正态分布 N ( µ , σ ) ,求: (1) µ 的置信水平为 0.95 的单侧置信下限; (2)σ 的置信水平为 0.95 的单侧置信上限.. 第 6 章 参 数 估 计 183. PDF created with pdfFactory Pro trial version www.pdffactory.com.

(28)

參考文獻

Outline

相關文件

对于二元函数的自变量,我

[r]

上述定理, 即 Dini, Lipschitz, Dirichlet 判别法, 给出函数能展开成 Fourier 级数的充分条件... 下面罗列几个例子,

微积分的创立是数学发展中的里程碑, 它的发展 和广泛应用开启了向近代数学过渡的新时期, 为研究 变量和函数提供了重要的方法和手段. 运动物体的瞬

下面我们将用 这一点将一元函数的 Taylor 展开推广到多元函数.. 我们希望借助此给出多元函数

笛卡儿企图通过坐标系给几何引进新方 法, 他的成就远远超出他的期望. 坐标系是数 学中的双刃剑, 使得几何的目的可以通过代 数达到, 反过来,

3.正弦函数y=Asin(ωx+φ)的图象之间的变换关系是学生最熟悉的一种伸缩变换.教 材从学生最熟悉的这一内容入手 ,分别比较了函数y=sin2x 和y=sinx 的图象之间的关

为此, 我们需要建立函 数的差商与函数的导数间的基本关系式, 这些关系式称为“微分学中值定理”...