カイ二乗検定（χ²検定）とは｜独立性の検定と適合度検定をExcelで実践

工程ラインが3本あって、不良率がラインごとに違う気がする——でも「気がする」だけでは根拠にならない。そういうときに使うのがカイ二乗検定（χ²検定）です。

この記事では、カイ二乗検定の2つの使い方を製造業の例題で解説します。

独立性の検定：工程ライン（A/B/C）と合否の間に関連があるか
適合度検定：不良の種類に偏りがあるか

計算はExcelの関数だけで完結します。

カイ二乗検定とは
独立性の検定：工程別不良率の比較
適合度検定：不良の種類に偏りがあるか
検定を使う前の確認事項
まとめ

カイ二乗検定とは

カイ二乗検定は、カテゴリデータ（分類データ）の度数を比較する検定です。t検定や分散分析が「平均値を比べる」のに対し、カイ二乗検定は「個数・割合を比べる」ときに使います。

使い場面	手法
ラインAとBで不良率が違うか	カイ二乗検定（独立性の検定）
不良の種類が均等かどうか	カイ二乗検定（適合度検定）
2グループの平均を比べる	t検定
3グループ以上の平均を比べる	分散分析

検定の手法の選び方全体は統計的検定の選び方（フロー図付き）を参照してください。

独立性の検定：工程別不良率の比較

3本の工程ライン（A・B・C）でそれぞれ200個を検査した結果です。

工程	合格	不良	合計	不良率
工程A	190	10	200	5.0%
工程B	170	30	200	15.0%
工程C	180	20	200	10.0%
合計	540	60	600	10.0%

工程Bの不良率15%は工程Aの3倍です。この差は偶然の範囲か、それとも工程間に本当の差があるのか——カイ二乗検定で判断します。

Step 1：仮説を立てる

帰無仮説 H₀：工程と合否は独立である（工程ラインで不良率に差はない）
対立仮説 H₁：工程と合否は独立でない（工程ラインで不良率に差がある）
有意水準：α = 0.05

Step 2：期待度数を計算する

「もし工程と合否が独立なら、各セルに何個入るはずか」を計算します。これを期待度数と言います。\[ E_{ij} = \frac{(\text{行の合計}) \times (\text{列の合計})}{\text{総計}} \]

今回の例では、どの工程も合計が200個で同じなので：\[ E_{\text{合格}} = \frac{200 \times 540}{600} = 180, \quad E_{\text{不良}} = \frac{200 \times 60}{600} = 20 \]

工程	期待度数（合格）	期待度数（不良）
工程A	180	20
工程B	180	20
工程C	180	20

期待度数がすべて5以上あれば、カイ二乗検定を適用できます（今回は最小20で問題なし）。

Step 3：χ²統計量を計算する

観測度数 \( O \) と期待度数 \( E \) のずれを集計します。\[ \chi^2 = \sum \frac{(O – E)^2}{E} \]

セル	観測 O	期待 E	\( (O-E)^2/E \)
工程A・合格	190	180	\((190-180)^2/180 = 0.556\)
工程A・不良	10	20	\((10-20)^2/20 = 5.000\)
工程B・合格	170	180	\((170-180)^2/180 = 0.556\)
工程B・不良	30	20	\((30-20)^2/20 = 5.000\)
工程C・合格	180	180	\((180-180)^2/180 = 0.000\)
工程C・不良	20	20	\((20-20)^2/20 = 0.000\)
合計	—	—	11.111

\[ \chi^2 = 11.111 \]

Step 4：自由度とp値を確認する

自由度は行数と列数から決まります。\[ df = (\text{行数} – 1) \times (\text{列数} – 1) = (3-1) \times (2-1) = 2 \]

χ²分布表より、自由度2・有意水準5%の棄却域は \( \chi^2 > 5.991 \) です。今回の \( \chi^2 = 11.111 \) はこれを上回っており、p値は約0.004です。

H₀を棄却します。工程ラインによって不良率に有意な差があります（p = 0.004）。

各セルの寄与を見ると、工程B（不良）と工程A（不良）の寄与がそれぞれ5.0と大きく、工程Bの不良数が特に多いことが主な原因だとわかります。

Excelでの計算手順

分割表（観測度数）をA1:C4の範囲に入力する
期待度数を別セルに計算する（行合計 × 列合計 ÷ 総計）
χ²統計量の計算：=CHITEST(観測度数の範囲, 期待度数の範囲) でp値が直接得られる
または各セルで =(O-E)^2/E を計算してSUMで合計する
p値の計算：=CHIDIST(χ²の値, 自由度)（Excel 2010以前）または =CHISQ.DIST.RT(χ²の値, 自由度)（Excel 2010以降）

適合度検定：不良の種類に偏りがあるか

ある工程で発生した不良50件を種類別に集計したところ、次のようになりました。

不良の種類	観測件数	期待件数（均等の場合）
キズ	12	12.5
寸法不良	8	12.5
異物混入	25	12.5
その他	5	12.5
合計	50	50

「4種類が均等に発生するなら各12.5件のはず」という帰無仮説を検定します。\[ \chi^2 = \frac{(12-12.5)^2}{12.5} + \frac{(8-12.5)^2}{12.5} + \frac{(25-12.5)^2}{12.5} + \frac{(5-12.5)^2}{12.5} \] \[ = 0.020 + 1.620 + 12.500 + 4.500 = 18.640 \]

自由度 \( df = 4 – 1 = 3 \)、棄却域は \( \chi^2 > 7.815 \)。今回の18.640は大きく超えており、p値は0.001未満です。

不良の種類に有意な偏りがあります。異物混入（25件）が突出しており、この工程の改善は異物対策を優先すべきだと判断できます。

検定を使う前の確認事項

カイ二乗検定には前提条件があります。適用前に次の点を確認してください。

条件	目安	違反した場合
期待度数	全セルで5以上が望ましい	フィッシャーの正確検定を使う
データの独立性	同一個体が複数のセルに入らない	マクネマー検定など対応のある検定を使う
サンプルサイズ	総数が小さすぎないこと（目安n≥20）	フィッシャーの正確検定を使う

期待度数が5未満のセルがある場合は、カテゴリを統合するか、フィッシャーの正確検定（Fisher’s exact test）に切り替えます。