Posts 第六章 抽样分布
Post
Cancel

第六章 抽样分布

1.简述中心极限定理及意义。

答:(1)中心极限定理:
从任意一个均值为$\mu$、方差为$\sigma^2$的总体中随机抽取一个样本容量为$n$的样本,当样本量$n$足够大时,样本均值$\bar x$近似服从均值为$\mu$、方差为$\sigma^2/n$的正态分布。
(2)中心极限定理的意义:
中心极限定理为数理统计在统计学中的应用铺平了道路。用样本推断总体的关键在于掌握样本特征值的抽样分布,而中心极限定理表明:只要样本容量足够地大,那么未知总体的样本特征值就近似服从正态分布。从而,只要采用大量观察法获得足够多的随机样本数据,几乎就可以把数理统计的全部处理问题的方法应用于统计学,这从另一个方面也间接地开辟了统计学的方法领域,其在现代推断统计学方法论中居于主导地位。

2.简述样本均值和总体分布之间的关系,样本均值分布在统计推断中的具体应用。

答:(1)样本均值和总体分布之间的关系

① 如果总体是正态分布,无论样本容量的大小,样本均值也服从正态分布。其分布的数学期望为总体均值,方差为总体方差的1/n。
② 根据中心极限定理,在样本容量足够大的情况下,不管总体分布是什么,样本均值都会近似地服从正态分布;
③ 样本均值的期望和方差不受总体分布的影响。一个期望为$\mu$,方差为$\sigma^2$的总体,从其中抽取一个容量为n的样本,则样本均值的期望为$\mu$,方差为$\sigma^2/n$。

(2)样本均值分布在统计推断中的具体应用
在统计推断中,样本均值的分布一定程度上是由总体分布决定的。因此,样本均值的分布有如下的应用:

① 利用样本均值的分布可推测总体的分布;
② 利用样本均值的分布可以构建总体均值的置信区间;
③ 利用样本均值的分布可以对总体的参数进行假设检验。

3.何谓统计量?χ2分布、t分布、F分布是不是统计量?它们在统计分析中各有何用处?

答:设$X_1,X_2,…,X_n$是从总体X中抽取的容量为n的一个样本,如果由此样本构造一个函数$T(X_1,X_2,…,X_n)$,不依赖于任何未知参数,则称函数$T(X_1,X_2,…,X_n)$是一个统计量。通常,又称为样本统计量。当获得样本的一组具体观测值$x_1,x_2,…,x_n$时,代入T,计算出$T(X_1,X_2,…,X_n)$的数值,就获得一个具体的统计量值。在总体X的分布类型已知时,若对任一样本容量n,都能导出统计量$T=T(X_1,X_2,…,X_n)$的分布的数学表达式,这种分布称为精确的抽样分布。在正态总体条件下,主要有χ2分布、t分布、F分布,常称之为统计三大分布。即χ2分布、t分布、F分布是由样本构造的函数(也就是统计量)服从的分布,这些分布与样本无关,它们与统计量有本质的区别,所以说χ2分布、t分布、F分布都不是统计量。

  • χ2分布:χ2分布可以用来构造t分布与F分布,并且可以用来构造非参数检验中χ2拟合优度检验的检验统计量,该检验统计量常用于列联分析。
  • t分布:一般当n≥30时,t分布与标准正态分布就非常接近。t分布的诞生对于统计学中小样本理论和应用有着重要的促进作用。例如在单样本、两个样本的均值假设检验与线性回归方程中回归系数的显著性检验中,常用t分布来构造检验统计量。
  • F分布:在比较两个总体方差的假设检验时通常用F统计量,且F分布常被用来构造检验统计量以应用于线性回归方程的整体显著性检验与方差分析中。

4.重复抽样和不重复抽样相比,抽样均值分布的标准差有什么不同?

答:样本均值的方差与抽样方法有关。在重复抽样条件下,样本均值的方差为总体方差的1/n,即
    $\sigma_\bar{x}^2=\dfrac{\sigma^2}{n}$
在不重复抽样条件下,样本均值的方差则需要用修正系数$(N-n)/(N-1)$去修正重复抽样时样本均值的方差,即
    $\sigma_\bar{x}^2=\dfrac{\sigma^2}{n}(\dfrac{N-n}{N-1})$
对于无限总体进行不重复抽样时,可以按重复抽样来处理,因为其修正系数$(N-n)/(N-1)$趋向于1;对于有限总体,当N很大而n很小时,其修正系数$(N-n)/(N-1)$也趋向于1,这时样本均值的方差也可以按重复抽样公式来计算。

This post is licensed under CC BY 4.0 by the author.

第七章 参数估计

第五章 概率与概率分布

Comments powered by Disqus.