【数理知识】显著性水平与两类错误

假设检验

  1. 给出零假设和备择假设:

    零假设和备择假设是参数空间的真子集,且不能相交。

    常把没有把握不能轻易肯定的命题作为备择假设$H_1$,而把没有充分理由不能轻易否定的命题作为零假设$H_0$。或者说我们将希望通过实验结果推翻的假设记为零假设$H_0$。

  2. 根据备择假设确定检验方向:

    备择假设含≠则为双尾;含<或>则为单尾,含<为左尾,含>为右尾。

  3. 判断抽样分布类型:

    主要判断抽样分布是否近似正态分布

  4. 确定检验类型及检验统计量:在判断用什么检验的时候,首要考虑的条件是样本量,其次是总体服从的分布

    • 样本容量大时(统计学上一般认为n≥30),总体的均值和标准差未知,不要求总体近似服从正态分布。根据中心极限定理,样本容量大,则样本均值的抽样分布服从正态分布,总体标准差可以用样本标准差来估计,可用Z检验;

    • 当样本容量小于30,且满足总体近似服从正态分布时,如果总体标准差已知,可用Z检验;

    • 当样本容量小于30,且满足总体近似服从正态分布时,如果总体标准差未知,可以用样本标准差去估计总体标准差,由此可用T检验;($z = t=\frac{\bar X-\mu_0}{S/\sqrt n}$)

    • 当样本容量小于30,且不满足总体近似服从正态分布,不能用Z检验和T检验。

    简单地说其实就是,总体标准差怎么估计的问题。检验类型确定了,检验统计量也就确定了。

    除此以外,还可以使用$\chi^2$检验,检验观测频次与假设频次是否一致$\chi^2 = \sum^k_{i=1}\frac{(O_i-E_i)^2}{E_i}$

  5. 确定显著性水平$\alpha$,一般取5%

两类错误

两类显著性错误分别是弃真错误和纳伪错误,含义很简单,顾名思义即可,他们分别用$\alpha$和$\beta$表示。

这个$\alpha$其实也就是上面提到的显著性水平,我们设定了原假设$H_0$,目前有$\alpha$的概率发生我们错误的把正确的原假设$H_0$拒绝的情况,当$\alpha$足够小,这个事件就几乎不可能发生,但是我们计算出的结果确实发生了这样的情况,那就说明原假设是错误的,那么相反的备择假设就是正确的了。这就是假设检验的原理。