2群の平均の差の検定で用いる検定統計量
ここでは、2グループ(群)の平均の差を統計的に検討する「2群の平均の差の検定」において、用いる検定統計量についてまとめる。
(1)対応のない(独立した)2群の差の検定
比較する2グループが独立しており、関連がない(例えば同じ人物のビフォーアフターなどではない)とき、「対応のない(独立した)2群」という。
(1.1)母分散が既知または大標本で、かつ母分散が等しい場合
比較する2グループの標本平均を, 、標本サイズを,とする。
さらに2グループで等しく、既知または大標本の母分散をとすると、検定統計量は次式になる。
- 正規分布表を用いて検定する。
- 自由度は考えなくてよい。
- 前提を満たす状況は一般に発生しない(実際はこの統計量を使うことは考えにくい)。
(1.2)母分散が未知で小標本の場合
比較する2グループの標本平均を, 、標本サイズを,とする。
(1.1)と異なり、母分散は未知であるため、比較する2グループそれぞれの不偏分散,を求めて検定統計量計算に用いる。ただし、比較する2グループの分散が等しいと仮定できるか否かが問題になる。
(1.2.1)両群の分散が等しい(等分散の検定により等分散性が仮定できる)場合
- t分布表を用いて検定する。
- 自由度は、。
(1.2.2)両群の分散が等しくない(等分散の検定により等分散性が仮定できない)場合
- t'値は厳密にはt分布に従わないためt分布表をそのまま用いることはできない。
- 自由度を次の式で計算してt分布表を使う検定をウェルチの検定と呼ぶ。
- 等分散の検定で等分散性が仮定できない場合に使う近似方法。使用可否については諸説ある。
(2)対応のある(関連した)2群の差の検定
比較する2グループが関連している(例えば同じ人物のビフォーアフターなど)とき、「対応のある(関連した)2群」という。
(2.1)母分散が未知で小標本の場合
比較する2グループの標本と標本のペアごとの差を、その平均をと定義する。の数(標本サイズ)をとすると検定統計量は次式になる。
なお、は、個々の差の不偏標準偏差であり次式の通りである。
- t分布表を用いて検定する。
- 自由度は、。
- 対応のない場合よりも標本サイズが小さくてすむ。
- 同じ個体の変化をとらえることで、変化を生み出した対象を考察しやすくなる。
まとめ
良く使うのは対応のある2群の差の検定だろうか。
ここでは式だけを列挙してその理論的なことは省いたが、理論込みでちゃんと理解していないと、説得力のある説明ができない気がする。参考文献は導出過程も書かれていて理解しやすい。