はじめに:どちらの検定を使うべきか迷っていませんか?
実験や観察研究の結果を解析する際に、「2群の平均差」を評価する場面は非常に多いです。
そのときによく候補に上がるのが、
- paired t検定(対応のあるt検定)
- ウィルコクソンの符号付順位検定(Wilcoxon signed-rank test)
両者は似ているようで、適用条件や仮定、検出力に違いがあります。
本記事では、大学院生の皆さんが正しく統計手法を選択できるように、この2つの検定の違いを徹底比較します。
paired t検定とは?|基本と前提条件
概要
paired t検定は、同じ被験者の2時点での数値を比較するための手法です。
例:薬投与前後の血圧、トレーニング前後の筋力変化
前提条件(とても重要)
条件 | 内容 |
---|---|
対応あり | データがペアになっている(例:同一個体の前後) |
差分が正規分布に従う | 「差のデータ」が正規性を満たしている必要があります(Shapiro-Wilk検定などで確認) |
連続変数 | 測定値が連続量(間隔尺度または比例尺度) |
検定の目的
「平均の差」が偶然かどうかを評価(母集団の平均差がゼロかどうかを検定)。
ウィルコクソンの符号付順位検定とは?|ノンパラメトリックな選択肢
概要
ウィルコクソン検定は、paired t検定と同じ状況で使えるが、より柔軟なノンパラメトリック手法です。
例:測定値が外れ値を含む、または差分が正規分布に従わない場合
前提条件
条件 | 内容 |
---|---|
対応あり | t検定と同様にデータはペアである必要あり |
正規性は不要 | 差分の分布が正規でなくてもOK |
順序が重要 | 差分の「符号」と「大きさの順位」に注目する |
検定の目的
中央値の差に基づき、「位置(中央値)のズレがあるかどうか」を評価します。
平均値ではなく中央値ベースの検定である点が重要です。
paired t検定とウィルコクソン検定の違いまとめ
項目 | paired t検定 | ウィルコクソン検定 |
---|---|---|
分布の仮定 | 正規分布が必要(差分) | 仮定不要(ノンパラメトリック) |
比較する値 | 平均値の差 | 中央値の差(順位) |
外れ値の影響 | 受けやすい | 比較的頑健(順位ベース) |
データ型 | 間隔/比例尺度 | 順序尺度以上 |
統計的検出力 | 正規分布下で高い | 正規性がなければこちらが有利 |
使用例 | 血圧、体重などの変化量 | 疼痛スコア、アンケート評価など |
どちらを使うべき?|選び方のガイドライン
✅ paired t検定を使うべきケース
- 差分データが正規分布に近い
- 測定データが連続量で、外れ値がほとんどない
✅ ウィルコクソン検定を使うべきケース
- サンプルサイズが小さい(n < 30)
- 差分が非正規分布である
- 外れ値やスケールの偏りがある
🎯 実践ポイント
- データの差分を求める
- Shapiro-Wilk検定などで正規性を確認
- 正規ならpaired t検定、非正規ならウィルコクソン検定
RやSPSSでの実行例
Rの場合(paired t-test)
t.test(data$before, data$after, paired = TRUE)
Rの場合(ウィルコクソン検定)
wilcox.test(data$before, data$after, paired = TRUE)
SPSSでも簡単に実行可能
「分析 > 比較 > 対応のあるサンプルのt検定」
「ノンパラメトリック検定 > 関連のある2群の比較 > Wilcoxon」で実行
H2:まとめ|研究の信頼性は正しい統計選択から始まる
paired t検定とウィルコクソン検定は、似た状況で使われるものの、前提条件や検出の対象が異なるため、適切に選び分ける必要があります。
正規性のチェックやデータの分布を理解することが、再現性のある信頼性の高い研究を支える第一歩です。