統計的検定の選び方【目的別フロー図と手法一覧】

データ解析を始めると、すぐに壁にぶつかります。「t検定を使えばいい？それとも分散分析？ノンパラメトリック検定が必要？」という判断です。目的とデータの条件を整理すれば、使うべき手法は自然に絞れます。このページをブックマークして、迷ったときの判断の起点として使ってください。

🧭 検定の選び方早わかりフローチャート

まず「データの種類」から下に向かってたどると、使う検定にたどり着きます。各検定名はクリックで解説記事へ移動します。

STEP1　データは何を測っている？

計量値（長さ・強度・収率など連続した数値）→ STEP2へ
計数値（個数・良/不良・比率などカテゴリ）→ 母比率の検定／カイ二乗検定
2変数の関係を見たい → 相関分析と回帰分析の使い分け

STEP2　比べるグループはいくつ？

1群（基準値と比較）→ 1標本t検定（t検定とは）
2群 → STEP3へ
3群以上 → STEP4へ

STEP3　2群：対応とデータの形は？

独立・正規分布 → スチューデントのt検定（分散が違えばウェルチのt検定）
対応あり（同一対象の前後）・正規分布 → 対応のあるt検定
正規分布でない → ウィルコクソン順位和検定（対応ありは符号順位検定）

STEP4　3群以上：要因とデータの形は？

要因1つ・正規分布 → 一元配置分散分析 →（差があれば）多重比較法
要因2つ → 二元配置分散分析（繰り返しがあれば交互作用も検定）
正規分布でない → クラスカル・ウォリス検定（対応ありはフリードマン検定）

※ このフローチャート・下の判定表は、出典として本ページへのリンクを添えていただければ、社内資料・授業・ブログ等でご自由に引用いただけます。

検定の選び方判定マトリクス（一覧表）
検定を選ぶときに確認する3つのポイント
検定手法の選び方フローチャート
1. 2グループを比較する場合
2. 3グループ以上を比較する場合
複数の要因がある場合
「正規性の確認」をどこで実施するか
Pythonで検定を選ぶ際のコード雛形
まとめ：迷ったときの判断軸

検定の選び方判定マトリクス（一覧表）

条件から逆引きできる一覧表です。「データの種類・群の数・対応・分布」の4つが決まれば、使う検定が1つに絞れます。

目的	条件	使う検定
基準値と比べる	1群・正規	1標本t検定
2群の平均を比べる	独立・正規（等分散）	スチューデントのt検定
2群の平均を比べる	独立・正規（分散不等）	ウェルチのt検定
2群（対応あり）の平均	同一対象の前後・正規	対応のあるt検定
2群（非正規）	独立	ウィルコクソン順位和検定
2群（非正規）	対応あり	ウィルコクソン符号順位検定
3群以上の平均	要因1つ・正規	一元配置分散分析＋多重比較
3群以上・2要因	正規（繰り返しあり）	繰り返しのある二元配置分散分析
3群以上（非正規）	独立	クラスカル・ウォリス検定
3群以上（非正規）	対応あり	フリードマン検定
比率・度数を比べる	計数値	母比率の検定／カイ二乗検定
分散（ばらつき）を比べる	2群の分散	F検定
2変数の関係を見る	連続データ	相関分析・回帰分析

表を使う前に、前提となる「分布の形」と「等分散かどうか」の確認が必要です。正規性はシャピロ・ウィルク検定、等分散性はルビーン検定で確かめます。判定に迷ったら、まずこの2つで前提をチェックしてください。

用語や公式をまとめて見たいときは統計・実験計画法の用語と公式まとめも活用できます。

検定を選ぶときに確認する3つのポイント

手法選択に必要な情報は3つだけです。

1つ目は比較するグループの数。2グループか、3グループ以上かで使う手法が変わります。

2つ目はデータの対応関係。同じ対象を2回測定した（改善前・改善後など）「対応あり」のデータか、別々のサンプルを測定した「対応なし」のデータかを確認します。

3つ目は正規性と等分散性。シャピロウイルク検定で正規性を、ルビーン検定で等分散性を確認します。これが成立するかどうかで、パラメトリック検定かノンパラメトリック検定かが決まります。

検定手法を選んだら、実験前に必要なサンプル数も計算しておきましょう。サンプルサイズの決め方｜t検定・分散分析に必要なn数で手順を解説しています。

検定手法の選び方フローチャート

テキストでも確認できるよう、フローを以下にまとめます。

2グループを比較する場合

対応	正規性	等分散性	使う手法
あり	あり	—	対応のあるt検定
あり	なし	—	ウイルコクソンの符号順位和検定
なし	あり	あり	スチューデントのt検定
なし	あり	なし	ウェルチのt検定
なし	なし	—	ウイルコクソンの順位和検定

2グループ比較で迷ったときは、ウェルチのt検定を使う、と決めてしまうのも実務的な選択です。スチューデントのt検定は等分散を仮定しますが、ウェルチはその仮定が不要なので、等分散かどうか確認せずに済みます。

3グループ以上を比較する場合

対応	正規性	使う手法	有意差後の多重比較
なし	あり	一元配置分散分析	Tukey HSD / ボンフェローニ / ホルム
なし	なし	クルスカルワリス検定	Dunnの多重比較
あり	あり	反復測定分散分析	対応あり多重比較
あり	なし	フリードマン検定	Dunnの多重比較（対応あり版）

分散分析で有意差が出ても「どのグループ間に差があるか」はわかりません。どのペアに差があるかを調べるには多重比較法が必要です。比較するグループが3〜5つならTukey HSDが使いやすく、グループ数が多い場合や検出力を重視する場合はホルム補正が向いています。

複数の要因がある場合

「温度と原料の2つの要因を同時に調べたい」など、要因が2つ以上ある実験では分析手法が変わります。

要因数	手法	特徴
2要因	二元配置分散分析	交互作用（要因の組み合わせ効果）を検出できる
3要因以上・効率重視	実験計画法（直交表）	実験回数を減らして多要因を評価
最適条件を求めたい	応答曲面法（RSM）	要因と応答の関係を曲面でモデル化、最適値を探索

「正規性の確認」をどこで実施するか

フローチャートに「正規性あり？」という分岐があります。確認の手順は以下の通りです。

まずシャピロウイルク検定をグループごとに実施します。p値が0.05を超えれば「正規性あり」として進めます。Pythonなら scipy.stats.shapiro() 一行です。

次に等分散性をルビーン検定で確認します（3グループ以上の比較時）。p値が0.05を超えれば「等分散あり」として一元配置分散分析に進めます。Pythonなら scipy.stats.levene() です。

サンプルサイズが大きい（n ≧ 30 程度）場合は、中心極限定理の効果でパラメトリック検定がある程度ロバストに機能します。ヒストグラムや Q-Q プロットで視覚的に確認するだけで十分な場面も多いです。

Pythonで検定を選ぶ際のコード雛形

前提確認から検定まで、2グループ比較のコード例です。

from scipy import stats

# データ
group_a = [52, 55, 53, 49, 56, 58, 54]
group_b = [48, 51, 47, 53, 50, 46, 52]

# Step 1: 正規性確認（各グループ）
_, p_a = stats.shapiro(group_a)
_, p_b = stats.shapiro(group_b)
is_normal = (p_a > 0.05) and (p_b > 0.05)

# Step 2: 等分散性確認
_, p_lev = stats.levene(group_a, group_b)
is_equal_var = p_lev > 0.05

# Step 3: 手法を選択して検定
if is_normal:
    if is_equal_var:
        stat, p = stats.ttest_ind(group_a, group_b, equal_var=True)
        method = "スチューデントのt検定"
    else:
        stat, p = stats.ttest_ind(group_a, group_b, equal_var=False)
        method = "ウェルチのt検定"
else:
    stat, p = stats.mannwhitneyu(group_a, group_b, alternative='two-sided')
    method = "ウイルコクソンの順位和検定"

print(f"使用手法: {method}")
print(f"統計量 = {stat:.4f}, p値 = {p:.4f}")

このコードをテンプレートとして手元に置いておくと、前提確認から検定まで迷わず進められます。