【数理知识】显著性水平与两类错误

6Young2024-03-172024-12-23

假设检验

给出零假设和备择假设：

零假设和备择假设是参数空间的真子集，且不能相交。

常把没有把握不能轻易肯定的命题作为备择假设$H_1$，而把没有充分理由不能轻易否定的命题作为零假设$H_0$。或者说我们将希望通过实验结果推翻的假设记为零假设$H_0$。
根据备择假设确定检验方向：

备择假设含≠则为双尾；含<或>则为单尾，含<为左尾，含>为右尾。
判断抽样分布类型：

主要判断抽样分布是否近似正态分布
确定检验类型及检验统计量：在判断用什么检验的时候，首要考虑的条件是样本量，其次是总体服从的分布。
- 样本容量大时（统计学上一般认为n≥30），总体的均值和标准差未知，不要求总体近似服从正态分布。根据中心极限定理，样本容量大，则样本均值的抽样分布服从正态分布，总体标准差可以用样本标准差来估计，可用Z检验；
- 当样本容量小于30，且满足总体近似服从正态分布时，如果总体标准差已知，可用Z检验；
- 当样本容量小于30，且满足总体近似服从正态分布时，如果总体标准差未知，可以用样本标准差去估计总体标准差，由此可用T检验；（$z = t=\frac{\bar X-\mu_0}{S/\sqrt n}$）
- 当样本容量小于30，且不满足总体近似服从正态分布，不能用Z检验和T检验。
简单地说其实就是，总体标准差怎么估计的问题。检验类型确定了，检验统计量也就确定了。

除此以外，还可以使用$\chi^2$检验，检验观测频次与假设频次是否一致$\chi^2 = \sum^k_{i=1}\frac{(O_i-E_i)^2}{E_i}$
确定显著性水平$\alpha$，一般取5%

两类错误

两类显著性错误分别是弃真错误和纳伪错误，含义很简单，顾名思义即可，他们分别用$\alpha$和$\beta$表示。

这个$\alpha$其实也就是上面提到的显著性水平，我们设定了原假设$H_0$，目前有$\alpha$的概率发生我们错误的把正确的原假设$H_0$拒绝的情况，当$\alpha$足够小，这个事件就几乎不可能发生，但是我们计算出的结果确实发生了这样的情况，那就说明原假设是错误的，那么相反的备择假设就是正确的了。这就是假设检验的原理。