Posts 第八章 假设检验
Post
Cancel

第八章 假设检验

1. 试简述假设检验的P值的含义及用P值进行假设检验相对于传统方法的优点,并简述用P值做假设检验的步骤。

答:(1)假设检验的P值的含义:
P值是在原假设为真的前提下出现观察样本或更极端情况的概率,它是观察到的实际显著性水平,是拒绝原假设的最小显著性水平。
(2)使用P值进行假设检验相对于传统方法的优点:
① P值法给出了拒绝H0的最小显著性水平。
② 检验结论对任何统计量均适用,不需改变。
③ 在改变显著性水平时,无须重新计算P值。
(3)使用P值做假设检验的步骤:
① 根据实际问题建立检验假设H0和H1。
② 构建检验统计量,根据观测样本计算在原假设成立条件下检验统计量的值,并给出得到样本观察结果或更极端结果出现的概率即P值。
③ 根据选定的显著性水平,决定拒绝或不能拒绝H0。当P值小于给定的显著性水平时,拒绝原假设。

2. 以总体均值来举例说明双侧检验与单侧检验拒绝域的不同。

答:对总体均值进行单侧和双侧检验的拒绝域分别为:
(1)双侧检验
① 在双侧检验中,原假设和备择假设一般是:H0:μ1=μ2,H1:μ1≠μ2;
② 拒绝域:双侧检验的拒绝域一般是均匀分布在左右两侧,即|z|>zα/2。
(2)单侧检验
① 在左侧检验中,原假设和备择假设一般是:H0:μ1≥μ2,H1:μ1<μ2。其拒绝域为:z<-zα,α为显著性水平。
② 在右侧检验中,原假设和备择假设一般是:H0:μ1≤μ2,H1:μ1>μ2。其拒绝域为:z>zα,α为显著性水平。

3. 为何在决策时要避免使用“接受原假设H0”这样的措辞?

答:在假设检验中,若检验结果为不拒绝原假设,也要避免使用“接受原假设”的措辞,其原因为:
(1)在假设检验时,当拒绝原假设时,表明样本提供的证据证明原假设是错误的;当没有拒绝原假设时,只是说明,现在没有足够的证据说明原假设是错误的,但也不代表存在充分的理由证明原假设是正确的。
(2)采用“接受原假设”的说法意味着样本提供的证据证明了原假设是正确的,但没有足够的证据拒绝原假设并不等于能够证明原假设是真的,仅仅意味着目前还没有足够的证据拒绝原假设,只表示由样本提供的证据还不足以拒绝原假设。

4. 假设检验中显著性水平α有何意义?试写出几个常用的用于假设检验的统计量。

答:显著性水平取α,意味着:在原假设成立时,如果事件的发生概率小于α,即小概率事件发生了,则认为原假设不成立。α取不同的水平,将直接影响到拒绝域的临界值,并进而影响到判断结果。常用于假设检验的统计量有z统计量、t统计量、χ2统计量、F统计量等。

5. 什么是拒真错误?什么是采伪错误?犯拒真错误的概率与犯采伪错误的概率有何联系与区别?important

答:由部分来推断总体,判断有可能正确,也有可能不正确,即有犯错误的可能。所犯的错误有两种类型,第Ⅰ类错误是原假设H0为真却被拒绝了,犯这种错误的概率用α表示,所以也称α错误或拒真错误;第Ⅱ类错误是原假设为伪却没有被拒绝,犯这种错误的概率用β表示,所以也称β错误或采伪错误。对于一定的样本量n,如果减小α错误,就会增大犯β错误的机会;若减小β错误,也会增大犯α错误的机会。要使α和β同时变小,只有增大样本量。

6. 在研究方法上,参数估计与假设检验有什么相同点和不同点?

答:(1)参数估计和假设检验的相同点:
① 都是根据样本信息推断总体参数;
② 都是以抽样分布为理论依据建立在概率论基础之上的推断,推断结果都有风险;
③ 对同一问题的参数进行推断,使用同一样本、同一统计量、同一分布,因而二者可以相互转换。
(2)参数估计和假设检验的不同点:
① 参数估计是以样本资料估计总体参数的可能范围,假设检验是以样本资料检验对总体参数的先验假设是否成立;
② 区间估计求得的是以样本估计值为中心的双侧置信区间,假设检验既有双侧检验,也有单侧检验;
③ 区间估计立足于大概率,通常以较大的把握程度(可信度)1-α去估计总体参数的置信区间;假设检验立足于小概率,通常是给定很小的显著性水平α去检验对总体参数的先验假设是否成立。

7. “假设检验的基本思路是:概率性质的反证法;主要依据的是:小概率事件原理”。你同意这种说法吗?简要叙述你对假设检验的理解和检验步骤

答:(1)同意。假设检验所遵循的推断依据是统计中的“小概率原理”:小概率事件在一次试验中几乎是不会发生的。例如,在10000件的产品中,如果只有1件是次品,那么可以得知,在一次试验中随机抽取1件次品的概率就为0.01%,此概率是非常小的。或者是说,在一次随机抽样试验中,次品几乎是不会被抽到的。反过来,如果从这批产品中任意抽取1件,恰好是次品,我们就可以断定,该次品率应该不是很小的,否则就不会那么轻易的就能抽到次品。从而就有足够的理由否认产品的次品率是很低的假设。
(2)假设检验的基本步骤为:第一,对所考察总体的分布形式或总体的某些未知参数做出某些假设,称之为原假设,并给出与之对立的备择假设;第二,根据检验对象构造合适的检验统计量,并通过数理统计分析确定在原假设成立的条件下该检验统计量的抽样分布;第三,在给定的显著性水平下,根据抽样分布得出原假设成立时的临界值,由临界值构造拒绝域和接受域;第四,由所抽取的样本资料计算样本统计量的取值,并将其与临界值进行比较,从而对所提出的原假设做出接受还是拒绝的统计判断。
假设检验就是利用样本中所蕴含的信息对事先假设的总体情况做出推断。假设检验不是毫无根据的,而是在一定的统计概率下支持这种判断。

8. 在单个总体均值的假设检验中,检验统计量要根据总体是否服从正态分布、总体方差是否已知,以及样本量的大小来确定。说明在不同情况下分别需要使用何种检验统计量。important

答:在对单个总体均值进行假设检验时,采用何种检验统计量取决于所抽取的样本是大样本(n≥30)还是小样本(n<30),此外还需要区分总体是否服从正态分布、总体方差是否已知等几种情况。
(1)在大样本情况下,样本均值的抽样分布近似服从正态分布。设总体均值为$\mu_0$,总体方差为$\sigma^ 2$。当总体方差σ2已知时,总体均值的检验统计量为:
  $z = \dfrac{\bar x-\mu_0}{\sigma/\sqrt{n}}$
当总体方差$\sigma^ 2$未知时,可以用样本方差$s ^2$来近似代替总体方差,时总体均值检验的统计量为:
  $z = \dfrac{\bar x-\mu_0}{s/\sqrt{n}}$
(2)在小样本情况下,假设总体服从正态分布:
① 当总体方差$\sigma^ 2$已知时,样本均值的抽样分布服从正态分布。总体均值检验的统计量为:
  $z = \dfrac{\bar x-\mu_0}{\sigma/\sqrt{n}}$
② 当总体方差$\sigma^ 2$未知时,需要用样本方差$s^2$代替总体方差$\sigma^ 2$,样本均值的抽样分布服从自由度为(n-1)的t分布。因此需要采用t分布来检验总体均值。检验的统计量为:
  $t = \dfrac{\bar x-\mu_0}{s/\sqrt{n}}$

This post is licensed under CC BY 4.0 by the author.

第九章 分类数据分析

第七章 参数估计

Comments powered by Disqus.