2標本の平均の差の検定（Z検定とt検定）

対応があるデータの場合

\(X_iとY_i\)に対応がある場合は、\(X_i – Y_i\)を変数として1標本での検定を行えばよい。

以下では

\[\begin{cases}
X_1 \ldots X_n ～ N(\mu_1, \sigma_1^2) \\
Y_1 ~\ldots ~Y_m ～ N(\mu_2, \sigma_2^2)
\end{cases} \]

について、分散の状態で場合分けする。

2標本の平均の差のZ検定

\(\sigma_1^2 = \sigma_2^2 = \sigma^2\)で、分散\(\sigma^2\)の値がわかっている場合、

\(H_0 : \mu_1 = \mu_2\)のもとで、Z統計量

\[ Z = \frac{\overline{X} ~-~ \overline{Y}}{\sqrt{\sigma^2 ( \frac{1}{n} + \frac{1}{m} )}} \]

が標準正規分布\(N(0, 1)\)に従う。

t検定：等分散と仮定した場合

\(\sigma_1^2 = \sigma_2^2 = \sigma^2\)のとき、分散の推定量として不偏分散

\[ \hat{\sigma}^2 = \frac{\sum_{i=1}^{n} (X_i – \overline{X})^2 + \sum_{i=1}^{m} (Y_i – \overline{Y})^2}{n + m – 2} \]

を計算する。\(H_0 : \mu_1 = \mu_2\)ときは、これをもとにt統計量は

\[ t = \frac{\overline{X} ~-~ \overline{Y} -~ (\mu_1 – \mu_2)}{\sqrt{\hat{\sigma}^2 (\frac{1}{n} + \frac{1}{m})}} = \frac{\overline{X} ~-~ \overline{Y}}{\sqrt{\hat{\sigma}^2 (\frac{1}{n} + \frac{1}{m})}} \]

と計算され、自由度(n + m – 2)のt分布に従う。

ウェルチの検定：分散が異なる場合

推定量として不偏分散\(\hat{\sigma_1}^2 , ~\hat{\sigma_2}^2\)を用いて、t統計量

\[ t = \frac{\overline{X} ~-~ \overline{Y}}{\sqrt{\frac{\hat{\sigma_1}^2}{n} + \frac{\hat{\sigma_2}^2}{m}}} \]

を計算すると、これは\(H_0\)のもとで自由度fのt分布に近似的に従う。自由度fは次のように計算される。

\[ f = \frac{(\frac{\hat{\sigma_1}^2}{n} + \frac{\hat{\sigma_2}^2}{m})^2}{\frac{(\frac{\hat{\sigma_1}^2}{n})^2}{n – 1} + \frac{(\frac{\hat{\sigma_2}^2}{m})^2}{m – 1}} \]

正規分布やt分布, カイ二乗分布のExcel関数