1. 假设检验概述
1.1. 基本概念
-
原假设 (Null Hypothesis) $H_0$: $\mu = \mu_0$
-
备择假设(Alternative Hypothesis)$H_1$:$\mu \not= \mu_0$
-
显著性水平(Significance Level)$\alpha$:小概率水平
-
确定假设的界限 $\mathcal{K}$
-
假设检验的拒绝域 $\mathscr{D} \subseteq \mathbb{X}^n$
1.2. 两种错误
1. 第一类错误
2. 第二类错误
1.3. 显著性水平与p值
1. 使用p值进行假设检验的基本法则是:
若 $p$ 值小于 $\alpha $ , 则拒绝 $H_0$,否则就不拒绝 $H_0$ ($\alpha$ 决定是否显著,$p$ 表现有多显著)
$p$ 值越小,则认为拒绝原假设的理由越充分
1.4. 单边与双边检验
1. 双边(Two-Tail)检验
2. 单边(One-Tail)假设
1.5. 基本步骤
-
建立原假设和备选假设,选择合适的 $p$ 值
-
对总体抽样,获取总体样本值
-
选取统计量(其抽样分布要明确,不含参数)
-
分两种(或同时)方法进行决策判断
<1> 利用 $\alpha$ 决定什么是拒绝域
<2> 利用样本数据计算 $p$ 值,将其与 $\alpha$ 比较
2. 参数假设检验
(先假定分布形式,再来估计参数)
2.1. Z 检验 (大样本或方差已知)
-
建立有关均值的备择假设和原假设,选择合适的显著性水平 $\alpha$
-
建立统计量 $Z\sim \mathbb{N}(0,\ 1)$,计算统计量数值 $z$
-
根据统计量数值和显著性水平 $\alpha$ 决定拒绝域
-
判断是否落入拒绝域,有需要的话再考察 $p$ 值
2.2. t 检验 (小样本且 $\sigma^2$ 未知)
-
建立有关均值的备择假设和原假设,选择合适的显著性水平 $\alpha$
-
建立统计量 $t\sim t(n')$,计算统计量数值 $t$
-
根据统计量数值和显著性水平 $\alpha$ 决定拒绝域
-
判断是否落入拒绝域,有需要的话再考察 $p$ 值
2.3. $\chi^2$检验 (判断方差变化是否显著)
-
建立有关均值的备择假设和原假设,选择合适的显著性水平 $\alpha$
-
建立统计量 $\chi^2\sim \chi^2(n')$,计算统计量数值 $\chi^2$
-
根据统计量数值和显著性水平 $\alpha$ 决定拒绝域
-
判断是否落入拒绝域,有需要的话再考察 $p$ 值
2.4. F检验 (判断方差比变化是否显著)
-
建立有关均值的备择假设和原假设,选择合适的显著性水平 $\alpha$
-
建立统计量 $F\sim F(n_1,\ n_2)$,计算统计量数值 $F$
-
根据统计量数值和显著性水平 $\alpha$ 决定拒绝域
-
判断是否落入拒绝域,有需要的话再考察 $p$ 值
3. 非参数假设检验(对总体分布形式未知)
3.1. 符号检验(Sign Test)
3.2. 秩和检验(Wilcoxon Rank-Sum)
1. 秩(Rank)指的是两组数据混合排序后的序号均值
定理7.1:大样本逼近
当两样本容量较大时(经验要求 $n_1$, $n_2 > 10$ ),秩和统计检验量 $T$ 近似服从 $\mathbb{N}(\mu,\sigma^2)$,其中:
则:
所以秩和检验的拒绝域为 $|U|>z_{\frac{\alpha}{2}}$
3.3. 偏度峰度检验
1. 偏度与峰度
偏度:
峰度: