t検定で「p=0.03、有意差あり」という結果が出ても、それだけでは差が実用上どれほど意味があるかはわかりません。サンプル数が多ければ、ごくわずかな差でも有意差として検出されます。
そこで使うのが効果量です。効果量は差の「大きさ」を標準化した指標で、サンプル数の影響を受けません。t検定にはCohen’s d、分散分析にはη²(イータ二乗)がよく使われます。この記事ではそれぞれの計算手順とExcelでの求め方、解釈の目安を解説します。
効果量とは
統計的検定は「差がゼロではない」という証拠を示しますが、効果量は「差がどれくらいの大きさか」を示します。
たとえばn=1000のデータでt検定を行えば、0.1点の差でもp<0.05になりえます。一方、n=10でも差が大きければ有意になります。効果量はこのn数の影響を除いた「純粋な差の大きさ」を表します。論文や社内報告で効果量を示すのが、国際的な学術基準(APA)でも推奨されています。
Cohen’s d(t検定の効果量)
計算式
2群を比較するt検定の効果量はCohen’s d で表します。\[ d = \frac{\bar{x}_1 – \bar{x}_2}{s_{pooled}} \]
プールした標準偏差 \( s_{pooled} \) は次の式で求めます。\[ s_{pooled} = \sqrt{\frac{s_1^2(n_1-1) + s_2^2(n_2-1)}{n_1 + n_2 – 2}} \]
解釈の目安(Cohen, 1988)
| Cohen’s d | 効果の大きさ | 目安 |
|---|---|---|
| 0.2前後 | 小(small) | 注意しないと見落とすくらいの差 |
| 0.5前後 | 中(medium) | 目視でも気づく程度の差 |
| 0.8以上 | 大(large) | 明らかに違うとわかる差 |
この目安はあくまで一般的な基準です。製造業では工程特性や規格幅によって「実用的に意味のある差」は変わるので、ドメイン知識で判断することも大切です。
例題:ラインAとラインBの引張強度を比較する
2つの製造ラインで生産した部品の引張強度を測定し、t検定を行った結果がp=0.04で有意差あり。次に効果量を計算します。
| ラインA | ラインB | |
|---|---|---|
| サンプル数 n | 15 | 15 |
| 平均 x̄ (MPa) | 52.4 | 51.1 |
| 標準偏差 s (MPa) | 2.5 | 2.3 |
Step 1:プールした標準偏差を計算する\[ s_{pooled} = \sqrt{\frac{2.5^2 \times 14 + 2.3^2 \times 14}{15 + 15 – 2}} = \sqrt{\frac{87.5 + 74.06}{28}} = \sqrt{\frac{161.56}{28}} = \sqrt{5.770} \approx 2.402 \]
Step 2:Cohen’s d を計算する\[ d = \frac{52.4 – 51.1}{2.402} = \frac{1.3}{2.402} \approx 0.54 \]
d≒0.54は「中程度の効果量」に相当します。統計的に有意でしたが、差の大きさ自体は中程度。サンプル数を増やせば有意差は出やすくなりますが、製造上の実用的な差かどうかは規格要求と照らし合わせて判断します。
ExcelでCohen’s dを計算する
群ごとの平均・標準偏差・サンプル数が揃っていれば、次のように計算できます。
| セル | 内容 | 計算式の例 |
|---|---|---|
| B2 | ラインA 平均 | =AVERAGE(データ範囲A) |
| B3 | ラインA 標準偏差 | =STDEV(データ範囲A) |
| B4 | ラインA n | =COUNT(データ範囲A) |
| C2〜C4 | ラインB 同上 | 同様 |
| B6 | s_pooled | =SQRT((B3^2*(B4-1)+C3^2*(C4-1))/(B4+C4-2)) |
| B7 | Cohen’s d | =(B2-C2)/B6 |
データが手元にある場合は AVERAGE・STDEV・COUNT を直接使えます。統計量だけ手元にある場合は数値を直接入力します。
η²(イータ二乗):分散分析の効果量
計算式
一元配置分散分析や二元配置分散分析の結果には η² を使います。\[ \eta^2 = \frac{SS_{between}}{SS_{total}} \]
分散分析表から「群間変動(SS_between)」と「全体変動(SS_total)」を読み取るだけで求められます。
解釈の目安(Cohen, 1988)
| η² | 効果の大きさ |
|---|---|
| 0.01前後 | 小(small) |
| 0.06前後 | 中(medium) |
| 0.14以上 | 大(large) |
例題:3工程の収率を分散分析で比較する
3つの製造工程(A・B・C)の収率(%)をそれぞれ5回測定し、一元配置分散分析を行いました。
| 繰り返し | 工程A | 工程B | 工程C |
|---|---|---|---|
| 1 | 78 | 76 | 82 |
| 2 | 81 | 79 | 85 |
| 3 | 80 | 77 | 83 |
| 4 | 79 | 78 | 84 |
| 5 | 82 | 80 | 81 |
| 平均 | 80.0 | 78.0 | 83.0 |
Step 1:全体平均を求める\[ \bar{\bar{y}} = \frac{80.0 \times 5 + 78.0 \times 5 + 83.0 \times 5}{15} = \frac{400 + 390 + 415}{15} = \frac{1205}{15} \approx 80.33 \]
Step 2:群間変動 SS_between を計算する\[ SS_{between} = n_i \sum_{i=1}^{k}(\bar{y}_i – \bar{\bar{y}})^2 = 5 \times [(80-80.33)^2 + (78-80.33)^2 + (83-80.33)^2] \] \[ = 5 \times [0.111 + 5.444 + 7.111] = 5 \times 12.667 \approx 63.33 \]
Step 3:群内変動 SS_within を計算する
各工程内のばらつき(各データ点と工程平均の差の二乗和)を合計します。
工程A: \( (78-80)^2+(81-80)^2+(80-80)^2+(79-80)^2+(82-80)^2 = 4+1+0+1+4 = 10 \)
工程B: \( (76-78)^2+(79-78)^2+(77-78)^2+(78-78)^2+(80-78)^2 = 4+1+1+0+4 = 10 \)
工程C: \( (82-83)^2+(85-83)^2+(83-83)^2+(84-83)^2+(81-83)^2 = 1+4+0+1+4 = 10 \)\[ SS_{within} = 10 + 10 + 10 = 30 \]
Step 4:η² を計算する\[ SS_{total} = SS_{between} + SS_{within} = 63.33 + 30 = 93.33 \] \[ \eta^2 = \frac{SS_{between}}{SS_{total}} = \frac{63.33}{93.33} \approx 0.679 \]
η²≒0.68は「大きな効果量」です。工程間の違いが全体のばらつきの約68%を占めており、工程の選択が収率に大きく影響していることを示しています。
ExcelでのSS計算
Excelの「データ分析」アドイン(分散分析:一元配置)を使うと、分散分析表の「変動」列にSS_between(グループ間)とSS_within(グループ内)が出力されます。その数値を使って η² = SS_between / SS_total を計算するだけです。
一元配置分散分析のExcel手順はExcelで分散分析で解説しています。
効果量とサンプルサイズの関係
効果量が事前にわかっている(または仮定できる)場合、必要なサンプルサイズを逆算できます。Cohen’s d=0.5(中程度)の差をα=0.05、検出力80%で検出するには、各群n≒34が必要です(両側検定)。
サンプルサイズの計算についてはサンプルサイズの決め方|t検定・分散分析に必要なn数で詳しく解説しています。効果量の推定 → サンプルサイズ計算 → 検定 → 効果量の報告、という流れで進めると、説得力のある分析結果になります。
t検定・分散分析の結果に効果量を加える
報告書や論文に記載する際は、p値だけでなく効果量と信頼区間を一緒に示すのが標準的になっています。
記載例:「2群間の引張強度に有意差が認められた(t(28)=2.18, p=0.038, d=0.54)。効果量は中程度であり、実用上の差は検討が必要である。」
信頼区間の求め方については信頼区間の求め方|Excelで95%信頼区間を計算する手順で解説しています。
まとめ
- 効果量は差の「大きさ」を示す指標で、サンプル数の影響を受けない
- t検定にはCohen’s d(小:0.2, 中:0.5, 大:0.8)
- 分散分析にはη²(小:0.01, 中:0.06, 大:0.14)
- Cohen’s d = (x̄₁−x̄₂) / s_pooled で計算。Excelで手計算できる
- η² = SS_between / SS_total。分散分析表から直接読み取れる
- p値と効果量と信頼区間の3点セットで報告するのが現在の標準

