type
status
date
slug
summary
tags
category
icon
password
Property
假设检验的概念
假设检验,也称为显著性检验,指通过样本的统计量,来判断与总体参数之间是否存在差异(差异是否显著)。我们事先对总体参数进行一定的假设,然后通过收集到的数据,来验证我们之前作出的假设(总体参数)是否合理。
在假设检验中,我们会建立两个完全对立的假设,分别为原假设与备择假设。然后根据样本信息进行分析判断,是选择接受原假设,还是拒绝原假设(接受备择假设)。假设检验基于“反证法”。首先,我们会假设原假设为真,如果在此基础上,得出了违反逻辑与常理的结论,则表明原假设是错误的,我们就接受备择假设。否则,我们就没有充分的理由推翻原假设,此时我们选择去接受原假设。
第一类错误: 为真,但错误地拒绝了
第二类错误: 为假,但错误地接受了
假设检验的理论依据(小概率事件)
在假设检验中,违反逻辑与常规的结论,就是小概奉事件。我们认为,小概率事件在一次试验中是不会发生的。我们首先认为原假设为真,如果在此基础上,小概率事件发生,则我们就拒绝原假设,否则,我们就选择去接受原假设。
假设检验遵循“疑罪从无”的原则,接受原假设,并不代表原假设一定是正确的,只是我们没有充分的证据,去证明原假设是错误的,因此只能维持原假设。那么,假设检验中的小概率事件是怎么得出的呢?想想之前讲到的置信区间,是不是一切都验然开朗了?
“疑罪从无”很形象的说明的假设检验向我们传达的含义。也就是说,当我们没有充分的理由拒绝原假设,就必须接受原假设,即使原假设是错误的,但是你找不到证据证明原假设是错误的,你就只能认为原假设是对的。反之,经过一次随机试验,你如果找到了某个理由拒绝了原假设,那么原假设肯定就是错误的,这个是一定的。
P-Value值与显著性水平
假设检验,用来检验样本的统计量与总体参数,是否存在显著性差异。那么如何才算显著呢?我们就可以计算一个概率值P-Value,该概率值可以认为就是支持原假设的概率,因为在假设检验中,通常原假设为等值假设,因此,P-Value也就表示样本统计量与总体参数无差异的概率。然后,我们再设定一个阈值,这个阈值叫做“显著性水平 ” (使用表示),通常的取值为(叫做置信度)。当P-Value的值大于时,接受原假设。当P-Value的值小于时,拒绝原假设。简单记为:p值越小越拒绝原假设。
假设检验和参数估计是推断统计的两个组成部分,都是利用样本对总体进行某种推断,但是两者进行推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的一种方法,总体参数在估计前是未知的。而假设检验,则是对总体参数先提出一个假设,然后用样本信息去检验这个假设是否成立。
假设检验的步骤
- 根据实际问题的要求,提出原假设和备择假设。
- 给出显著性水平以及样本容量
- 确定检验统计量和拒绝域。
- 计算出检验统计量的值,并作出决策。
单边检验和双边检验
常用的假设检验
单个正态总体均值的假设检验法(Z检验:方差已知)
Z检验用来判断样本均值是否与总体均值具有显著性差异。Z检验是通过正态分布的理论来推断差异发生的概率,从而比较两个均值的差异是否显著。Z检验适用于:
- 总体呈正态分布。
- 总体方差已知。
- 样本容量较大。
案例如下
单个正态总体均值的假设检验法(t检验:方差未知)
t检验,与Z检验类似,用来判断样本均值是否与总体均值具有显替性差异。不过,t检验是基于t分布的。检验适用于:
- 总体呈正态分布。
- 总体方差未知。
- 样本容量较小。
案例说明
方差分析
汇总:
单因子方差分析:
双因子方差分析带交叉项:
定义命名和数据:
- 序号表示在A因素中的标号,总共a个
- 序号表示在B因素中的标号,总共b个
- 序号表示在AB因素相同时,多次抽取的样本的标号。然后假设每组数量都一样,都是n个
H0: