品質管理や研究開発の現場で「2つの条件に差があるかどうか確かめたい」というシーンは多いです。そういうときに使うのがt検定です。ただ、t検定には3種類あって、使い方を間違えると結果の信頼性が下がります。この記事では3種類の違いと使い分けを、製造業の具体例で説明します。
t検定とは

とあるチョコレートを製造している工場が2拠点あります。
2拠点とも同じメーカーの同じ商品です。
それぞれ製品検査のため無作為に製品を10個選び、重量を測定したところ平均値は、工場Aは100g、工場Bは102gでした。
平均値で見ると差があるように見えますが「ぐうぜん平均値に差があっただけ」ではなく、本当にちがいがあるといえるでしょうか?
t検定(t-test)は、このように2つのグループの平均値の差が統計的に意味のある差かどうかを判定する検定手法です。
統計的仮説検定の一種で、データのばらつき(分散)を考慮したうえで平均の差を評価します。
t検定の3つの種類
t検定には、データの性質に応じて3種類あります。どれを使うかは「データが対応しているか」と「分散が等しいか」で決まります。
| 種類 | 使う場面 | 前提条件 |
|---|---|---|
| スチューデントのt検定 | 対応なし・等分散 | 2グループの分散が等しい |
| ウェルチのt検定 | 対応なし・不等分散 | 分散が異なってもよい(推奨) |
| 対応のあるt検定 | 同一個体の前後比較 | ペアになったデータがある |
スチューデントのt検定
2グループのデータが独立していて、かつ分散が等しいと仮定できる場合に使います。ルーヴェン検定などで等分散性を確認してから適用します。計算の詳細はスチューデントのt検定を例題で解説にまとめています
【具体例】
「AクラスとBクラスで数学のテスト平均点に差があるかを調べたい。2つのクラスの点数のばらつきはほぼ同じと考えられる。このとき、スチューデントのt検定を使って平均点に有意な差があるかを調べる。」
ウェルチのt検定
2グループのデータが独立しているが、分散が異なる可能性がある場合に使います。等分散性の仮定が不要なため、迷ったらウェルチを選ぶのが実務上の定石です。手順はウェルチのt検定を例題で解説で確認できます。
【具体例】
「AクラスとBクラスで数学のテスト平均点に差があるかを調べたい。Aクラスは点数のばらつきが小さいが、Bクラスは点数のばらつきが大きかった。このように2つのグループで分散が同じとは言えない場合、ウェルチのt検定を使って平均点に有意な差があるかを調べる。」
対応のあるt検定
同じ測定対象(人・製品・機械など)に対して2条件で測定したデータのペアがある場合に使います。たとえば「同じ製品を処理前・処理後で計測した」「同じ作業者がA治具とB治具で加工時間を計測した」といったケースです。ペアデータの扱い方は対応のあるt検定を例題で解説で詳しくまとめています。
【具体例】
「ある人たちに勉強法を変える前と変えた後で、同じ数学テストを受けてもらい、平均点が上がったかを調べたい。このように同じ人を2回測定して比較する場合は、対応のあるt検定を使う。」
t検定の手順(ウェルチのt検定で解説)
実際の数値で確認します。
具体例:製品強度の比較
製造ラインAとラインBで製造した製品の引張強度(単位:MPa)を5個ずつ計測しました。2つのラインの平均強度に差があるかどうかを有意水準5%で検定します。
| 測定値 | ラインA | ラインB |
|---|---|---|
| 1 | 510 | 495 |
| 2 | 523 | 501 |
| 3 | 518 | 488 |
| 4 | 506 | 512 |
| 5 | 533 | 494 |
| 平均 | 518.0 | 498.0 |
| 標準偏差 | 10.54 | 8.70 |
Step 1:仮説を設定する
- 帰無仮説 H₀:ラインAとラインBの平均強度に差はない(μ_A = μ_B)
- 対立仮説 H₁:ラインAとラインBの平均強度に差がある(μ_A ≠ μ_B)
仮説検定の考え方について詳しくは仮説検定の考え方と手順をご覧ください。
Step 2:t統計量を計算する
t統計量はこの式で求めます。\[ t = \frac{\bar{x}_A – \bar{x}_B}{\sqrt{\dfrac{s_A^2}{n_A} + \dfrac{s_B^2}{n_B}}} \]
各記号の意味はこちら。
- \(\bar{x}_A, \bar{x}_B\):各グループの標本平均
- \(s_A^2, s_B^2\):各グループの不偏分散
- \(n_A, n_B\):各グループのサンプルサイズ
数値を代入すると:\[ t = \frac{518.0 – 498.0}{\sqrt{\dfrac{10.54^2}{5} + \dfrac{8.70^2}{5}}} = \frac{20.0}{\sqrt{\dfrac{111.1}{5} + \dfrac{75.7}{5}}} = \frac{20.0}{\sqrt{22.22 + 15.14}} = \frac{20.0}{\sqrt{37.36}} \approx \frac{20.0}{6.11} \approx 3.27 \]
Step 3:自由度を計算する(ウェルチ・サタースウェイト式)
ウェルチのt検定では、自由度を次の式(ウェルチ・サタースウェイト式)で求めます。\[ \nu = \frac{\left(\dfrac{s_A^2}{n_A} + \dfrac{s_B^2}{n_B}\right)^2}{\dfrac{\left(\dfrac{s_A^2}{n_A}\right)^2}{n_A – 1} + \dfrac{\left(\dfrac{s_B^2}{n_B}\right)^2}{n_B – 1}} \]
数値を代入すると:\[ \nu = \frac{(22.22 + 15.14)^2}{\dfrac{22.22^2}{4} + \dfrac{15.14^2}{4}} = \frac{37.36^2}{\dfrac{493.7}{4} + \dfrac{229.2}{4}} = \frac{1395.8}{123.4 + 57.3} = \frac{1395.8}{180.7} \approx 7.72 \]
自由度は小数点以下を切り捨てて \(\nu = 7\) とします。
Step 4:p値(または棄却域)を確認する
自由度7、有意水準5%(両側検定)のt臨界値は \(t_{0.025}(7) = 2.365\) です。
計算したt統計量は \(t = 3.27 > 2.365\) なので、帰無仮説を棄却します。
つまり「ラインAとラインBの平均強度には統計的に有意な差がある(有意水準5%)」と結論づけられます。
Excelでt検定を行う方法
同じ計算はExcelでも実行できます。「データ分析」ツールを使う方法とT.TEST関数を使う方法があります。操作手順はExcelでt検定のやり方を種類ごとに解説にまとめています。
PythonでのT検定
Pythonなら scipy.stats を使います。数行のコードで同じ結果が出ます。実装例はPythonでt検定(対応ありなし)で確認できます。
t検定の前提条件
t検定には前提条件が3つあります。
- 各グループのデータが正規分布に従っている(正規性)
- データが独立して得られている(対応のあるt検定を除く)
- 両グループの分散が等しい(スチューデントのみ。ウェルチは不要)
データが正規分布に従っていない場合や、サンプルサイズが小さい場合はノンパラメトリック検定の利用を検討してください。対応がない2グループの比較ならウイルコクソンの順位和検定がt検定の代替手法になります。
「何サンプル集めればいいか」を事前に計算することも重要です。必要なサンプル数の求め方はサンプルサイズの決め方|t検定・分散分析に必要なn数を参照してください。<
t検定のやり方を具体例でわかりやすく解説
「2標本のt検定(対応あり、なし)」の具体例を見ていきましょう。
2標本のt検定 対応ありの具体例
状況: ダイエットプログラム前後での体重の変化を検証する。
- 参加者数: 10人
- 体重の平均変化: -4kg
- 体重変化の標準偏差: 2kg
- 有意水準0.05(5%)
- 帰無仮説と対立仮説の設定
- 帰無仮説 (H0): 体重の変化の平均 = 0
- 対立仮説 (H1): 体重の変化の平均 ≠ 0
- t統計量の計算
- 各参加者の体重変化(後 – 前)の平均と標準偏差を計算。
- t値 = (平均体重変化 – 0) / (標準偏差 / √標本サイズ)
t値 = (-4 – 0) / (2 / √10) = -6.32
- t分布から臨界値を求める
- 有意水準と自由度(標本サイズ – 1)を用いて臨界値を求める
自由度 = 10 – 1 = 9
臨界値:t分布表より自由度9の片側検定 1.8331 ※体重が減ったかどうかなので「片側検定」
棄却域:1.8331 < t
- 有意水準と自由度(標本サイズ – 1)を用いて臨界値を求める
- 結論の導出
- t値 -6.32 < 臨界値 1.8331 したがって帰無仮説を採用する。
つまり、ダイエットプログラムの効果があり、体重が減ったことを示唆している。
- t値 -6.32 < 臨界値 1.8331 したがって帰無仮説を採用する。
2標本のt検定 対応なしの具体例
状況: あるチョコレートを製造している2拠点の工場間で同一製品が作られているか検証する
- 工場Aの標本平均: 100g
- 工場Bの標本平均: 102g
- 両工場の標本標準偏差: 5g
- 両工場の標本サイズ: 各10個
- 有意水準0.05(5%)
- 帰無仮説と対立仮説の設定
- 帰無仮説 (H0): 2つの工場で作られた製品(重量)は同じ (μA = μB)
- 対立仮説 (H1): 2つの工場で作られた製品(重量)は異なる (μA ≠ μB)
- t統計量の計算
- 両工場の平均重量と標準偏差を計算
- t値 = (A工場平均の重量 – B工場の平均重量) / √((標準偏差A²/サイズA) + (標準偏差B²/サイズB))
t値 = (100−102)/√(52/10)+(52/10) = -0.89
- t分布から臨界値を求める
- 有意水準と自由度(標本サイズ – 1)を用いて臨界値を求める
自由度 = 10 – 1 = 9
臨界値:t分布表より自由度9の両側検定 2.2622
棄却域:t < -2.2622, 2.2622 < t
- 有意水準と自由度(標本サイズ – 1)を用いて臨界値を求める
- 結論の導出
- t値 -0.89 > -2.2622 したがって帰無仮説を採用する。
つまり、工場Aの製品の平均重量が工場Bのそれよりも統計的に有意に低いとは言えないことを示唆しています。
- t値 -0.89 > -2.2622 したがって帰無仮説を採用する。
まとめ
要点をまとめます。
- t検定は2グループの平均値の差を検定する手法
- 種類は「スチューデント(対応なし・等分散)」「ウェルチ(対応なし・不等分散)」「対応あり」の3種類
- 迷ったらウェルチのt検定を選ぶのが実務上の基本
- 手順は①仮説設定→②t統計量の計算→③自由度の計算→④p値との比較
- ExcelやPythonで簡単に実装できる
迷ったらまずウェルチから始めてみてください。たいていのケースはそれで対応できます。各手法の詳しい計算例は以下の記事で確認できます。
📚 この記事の内容をもっと深く学ぶ
本書はフルカラーで図や写真がふんだんに使われていて、初学者にとっつきやすく、飽きが来ないように工夫されています。楽しく学べることは一番大事。
読者のつまづきポイントがだいたいわかっていて、本文中で「ん?」となりそうな箇所の後にはすかさず補足情報が入る。
t検定のようなちょっとした統計学を使うビジネスパーソンにはぴったりの一冊です!
検定の結果とあわせて信頼区間を提示すると、母平均の不確かさをより具体的に伝えられます。Excelでの計算手順は信頼区間の求め方|Excelで95%信頼区間を計算する手順で解説しています。
t検定でp値が有意になった場合、差の「大きさ」を示す効果量(Cohen’s d)も一緒に報告すると分析の説得力が増します。計算手順は効果量(Cohen’s d・η²)の求め方で解説しています。

