対応があるデータの場合
\(X_iとY_i\)に対応がある場合は、\(X_i – Y_i\)を変数として1標本での検定を行えばよい。
以下では
\[\begin{cases}
X_1 \ldots X_n ~ N(\mu_1, \sigma_1^2) \\
Y_1 ~\ldots ~Y_m ~ N(\mu_2, \sigma_2^2)
\end{cases} \]
について、分散の状態で場合分けする。
2標本の平均の差のZ検定
\(\sigma_1^2 = \sigma_2^2 = \sigma^2\)で、分散\(\sigma^2\)の値がわかっている場合、
\(H_0 : \mu_1 = \mu_2\)のもとで、Z統計量
\[ Z = \frac{\overline{X} ~-~ \overline{Y}}{\sqrt{\sigma^2 ( \frac{1}{n} + \frac{1}{m} )}} \]
が標準正規分布\(N(0, 1)\)に従う。
t検定:等分散と仮定した場合
\(\sigma_1^2 = \sigma_2^2 = \sigma^2\)のとき、分散の推定量として不偏分散
\[ \hat{\sigma}^2 = \frac{\sum_{i=1}^{n} (X_i – \overline{X})^2 + \sum_{i=1}^{m} (Y_i – \overline{Y})^2}{n + m – 2} \]
を計算する。\(H_0 : \mu_1 = \mu_2\)ときは、これをもとにt統計量は
\[ t = \frac{\overline{X} ~-~ \overline{Y} -~ (\mu_1 – \mu_2)}{\sqrt{\hat{\sigma}^2 (\frac{1}{n} + \frac{1}{m})}} = \frac{\overline{X} ~-~ \overline{Y}}{\sqrt{\hat{\sigma}^2 (\frac{1}{n} + \frac{1}{m})}} \]
と計算され、自由度(n + m – 2)のt分布に従う。
ウェルチの検定:分散が異なる場合
推定量として不偏分散\(\hat{\sigma_1}^2 , ~\hat{\sigma_2}^2\)を用いて、t統計量
\[ t = \frac{\overline{X} ~-~ \overline{Y}}{\sqrt{\frac{\hat{\sigma_1}^2}{n} + \frac{\hat{\sigma_2}^2}{m}}} \]
を計算すると、これは\(H_0\)のもとで自由度fのt分布に近似的に従う。自由度fは次のように計算される。
\[ f = \frac{(\frac{\hat{\sigma_1}^2}{n} + \frac{\hat{\sigma_2}^2}{m})^2}{\frac{(\frac{\hat{\sigma_1}^2}{n})^2}{n – 1} + \frac{(\frac{\hat{\sigma_2}^2}{m})^2}{m – 1}} \]