はじめに:t検定には2種類ある
t検定は、「2つのグループの平均に差があるか」を検定する代表的な統計手法です。
しかし、意外と混同されがちなのが、
- paired t-test(対応のあるt検定)
- unpaired t-test(対応のないt検定)
この2つの使い分けです。
研究のデザインに合っていない検定を使うと、誤った結論や低い統計的検出力につながることも。
本記事では、大学院生が迷わず選べるように、両者の違いと使い分けを丁寧に解説します。
paired t-test(対応のあるt検定)とは?
概要
paired t-testは、同じ対象を2回測定することで得られたデータの比較に使います。
例:
- 薬を投与する前と後の血圧変化
- トレーニング前後の筋力変化
- 左右の目の視力比較(同一被験者内)
前提条件
条件 | 内容 |
---|---|
データが「ペア」になっている | 同じ被験者の2時点、または同一個体から得られた2つの値 |
差分が正規分布に従う | 差(after – before)が正規性を持つ |
連続データ(間隔・比例尺度) | 測定値が連続変数である必要あり |
検定の目的
「前後の平均の差が偶然か、実際に意味があるのか」を評価します。
unpaired t-test(対応のないt検定)とは?
概要
unpaired t-testは、異なる2群間の平均を比較するときに使います。
別名「独立2群のt検定(independent t-test)」とも呼ばれます。
例:
- 男性群 vs 女性群の体重
- 薬A群 vs 薬B群の治療効果
- 野生型マウス vs 遺伝子KOマウスの発現量
前提条件
条件 | 内容 |
---|---|
2群は独立している | 被験者やサンプルが別々のグループ |
各群が正規分布 | 各群のデータが正規性を満たす |
分散の等質性(理想) | Welchの補正ありで緩和可能 |
連続データ | 測定値が連続変数である必要あり |
検定の目的
「2群の平均値に統計的に有意な差があるかどうか」を評価します。
pairedとunpaired t-testの違いまとめ
比較項目 | paired t-test | unpaired t-test |
---|---|---|
比較対象 | 同一サンプルの前後 or ペア | 異なる2群 |
データの独立性 | 非独立(対応あり) | 独立した群(対応なし) |
前提条件 | 差分の正規性 | 各群の正規性+分散の等質性 |
統計的検出力 | 通常、高い(ばらつきが小さい) | 条件次第で変動 |
使用例 | 治療前後、同個体比較 | 群間比較(男女、治療法) |
具体的な選び方のフローチャート
データは同じ対象からの繰り返し測定ですか?
├─ はい → paired t-test
└─ いいえ → unpaired t-test
実装例(Rによる解析)
paired t-test
t.test(group$before, group$after, paired = TRUE)
unpaired t-test
t.test(group1, group2, paired = FALSE) # デフォルト
分散が等しくない場合(Welchのt検定)
t.test(group1, group2, var.equal = FALSE)
H2:よくあるミスと注意点
❌ ペアデータをunpairedで解析
→ 誤検定により精度が落ちる可能性大。
❌ 正規性を確認せずt検定を使う
→ 正規性がない場合、ノンパラメトリック検定(例:Wilcoxon検定)を検討。
まとめ|検定の選び方が研究の質を左右する
paired t-testとunpaired t-testは、データ構造(ペアか独立か)に応じて使い分ける必要があります。
誤った使い方をすると、p値の解釈が誤りになり、論文の信頼性が損なわれることも。
正しい検定を選ぶためには、まず研究デザイン・データ収集方法・正規性の確認を忘れずに行いましょう。