t検定とは？具体例でわかりやすくやり方を解説

品質管理や研究開発の現場で「2つの条件に差があるかどうか確かめたい」というシーンは多いです。そういうときに使うのがt検定です。ただ、t検定には3種類あって、使い方を間違えると結果の信頼性が下がります。この記事では3種類の違いと使い分けを、製造業の具体例で説明します。

t検定とは
t検定の3つの種類
t検定の手順（ウェルチのt検定で解説）
Excelでt検定を行う方法
PythonでのT検定
t検定の前提条件
t検定のやり方を具体例でわかりやすく解説
1. 2標本のt検定　対応ありの具体例
2. 2標本のt検定　対応なしの具体例
t検定の種類別・実践別の詳しい解説
まとめ
1. 📚 この記事の内容をもっと深く学ぶ

t検定とは

とあるチョコレートを製造している工場が2拠点あります。
2拠点とも同じメーカーの同じ商品です。

それぞれ製品検査のため無作為に製品を10個選び、重量を測定したところ平均値は、工場Aは100g、工場Bは102gでした。

平均値で見ると差があるように見えますが「ぐうぜん平均値に差があっただけ」ではなく、本当にちがいがあるといえるでしょうか？

t検定（t-test）は、このように2つのグループの平均値の差が統計的に意味のある差かどうかを判定する検定手法です。

統計的仮説検定の一種で、データのばらつき（分散）を考慮したうえで平均の差を評価します。

≫実践！Pythonでt検定｜2標本（対応ありなし）を例題つきで
 ≫Excelでt検定のやり方を種類ごとに解説
 ≫Excel関数を使って「対応のある2標本のt検定」を手動で計算するやり方

t検定の3つの種類

t検定には、データの性質に応じて3種類あります。どれを使うかは「データが対応しているか」と「分散が等しいか」で決まります。

種類	使う場面	前提条件
スチューデントのt検定	対応なし・等分散	2グループの分散が等しい
ウェルチのt検定	対応なし・不等分散	分散が異なってもよい（推奨）
対応のあるt検定	同一個体の前後比較	ペアになったデータがある

スチューデントのt検定

2グループのデータが独立していて、かつ分散が等しいと仮定できる場合に使います。ルーヴェン検定などで等分散性を確認してから適用します。計算の詳細はスチューデントのt検定を例題で解説にまとめています

【具体例】
「AクラスとBクラスで数学のテスト平均点に差があるかを調べたい。2つのクラスの点数のばらつきはほぼ同じと考えられる。このとき、スチューデントのt検定を使って平均点に有意な差があるかを調べる。」

ウェルチのt検定

2グループのデータが独立しているが、分散が異なる可能性がある場合に使います。等分散性の仮定が不要なため、迷ったらウェルチを選ぶのが実務上の定石です。手順はウェルチのt検定を例題で解説で確認できます。

【具体例】
「AクラスとBクラスで数学のテスト平均点に差があるかを調べたい。Aクラスは点数のばらつきが小さいが、Bクラスは点数のばらつきが大きかった。このように2つのグループで分散が同じとは言えない場合、ウェルチのt検定を使って平均点に有意な差があるかを調べる。」

対応のあるt検定

同じ測定対象（人・製品・機械など）に対して2条件で測定したデータのペアがある場合に使います。たとえば「同じ製品を処理前・処理後で計測した」「同じ作業者がA治具とB治具で加工時間を計測した」といったケースです。ペアデータの扱い方は対応のあるt検定を例題で解説で詳しくまとめています。

【具体例】
「ある人たちに勉強法を変える前と変えた後で、同じ数学テストを受けてもらい、平均点が上がったかを調べたい。このように同じ人を2回測定して比較する場合は、対応のあるt検定を使う。」

t検定の手順（ウェルチのt検定で解説）

実際の数値で確認します。

具体例：製品強度の比較

製造ラインAとラインBで製造した製品の引張強度（単位：MPa）を5個ずつ計測しました。2つのラインの平均強度に差があるかどうかを有意水準5%で検定します。

測定値	ラインA	ラインB
1	510	495
2	523	501
3	518	488
4	506	512
5	533	494
平均	518.0	498.0
標準偏差	10.54	8.70

Step 1：仮説を設定する

帰無仮説 H₀：ラインAとラインBの平均強度に差はない（μ_A = μ_B）
対立仮説 H₁：ラインAとラインBの平均強度に差がある（μ_A ≠ μ_B）

仮説検定の考え方について詳しくは仮説検定の考え方と手順をご覧ください。

Step 2：t統計量を計算する

t統計量はこの式で求めます。\[ t = \frac{\bar{x}_A – \bar{x}_B}{\sqrt{\dfrac{s_A^2}{n_A} + \dfrac{s_B^2}{n_B}}} \]

各記号の意味はこちら。

\(\bar{x}_A, \bar{x}_B\)：各グループの標本平均
\(s_A^2, s_B^2\)：各グループの不偏分散
\(n_A, n_B\)：各グループのサンプルサイズ

数値を代入すると：\[ t = \frac{518.0 – 498.0}{\sqrt{\dfrac{10.54^2}{5} + \dfrac{8.70^2}{5}}} = \frac{20.0}{\sqrt{\dfrac{111.1}{5} + \dfrac{75.7}{5}}} = \frac{20.0}{\sqrt{22.22 + 15.14}} = \frac{20.0}{\sqrt{37.36}} \approx \frac{20.0}{6.11} \approx 3.27 \]

Step 3：自由度を計算する（ウェルチ・サタースウェイト式）

ウェルチのt検定では、自由度を次の式（ウェルチ・サタースウェイト式）で求めます。\[ \nu = \frac{\left(\dfrac{s_A^2}{n_A} + \dfrac{s_B^2}{n_B}\right)^2}{\dfrac{\left(\dfrac{s_A^2}{n_A}\right)^2}{n_A – 1} + \dfrac{\left(\dfrac{s_B^2}{n_B}\right)^2}{n_B – 1}} \]

数値を代入すると：\[ \nu = \frac{(22.22 + 15.14)^2}{\dfrac{22.22^2}{4} + \dfrac{15.14^2}{4}} = \frac{37.36^2}{\dfrac{493.7}{4} + \dfrac{229.2}{4}} = \frac{1395.8}{123.4 + 57.3} = \frac{1395.8}{180.7} \approx 7.72 \]

自由度は小数点以下を切り捨てて \(\nu = 7\) とします。

Step 4：p値（または棄却域）を確認する

自由度7、有意水準5%（両側検定）のt臨界値は \(t_{0.025}(7) = 2.365\) です。

計算したt統計量は \(t = 3.27 > 2.365\) なので、帰無仮説を棄却します。

つまり「ラインAとラインBの平均強度には統計的に有意な差がある（有意水準5%）」と結論づけられます。

Excelでt検定を行う方法

同じ計算はExcelでも実行できます。「データ分析」ツールを使う方法とT.TEST関数を使う方法があります。操作手順はExcelでt検定のやり方を種類ごとに解説にまとめています。

PythonでのT検定

Pythonなら scipy.stats を使います。数行のコードで同じ結果が出ます。実装例はPythonでt検定（対応ありなし）で確認できます。

t検定の前提条件

t検定には前提条件が3つあります。

各グループのデータが正規分布に従っている（正規性）
データが独立して得られている（対応のあるt検定を除く）
両グループの分散が等しい（スチューデントのみ。ウェルチは不要）

データが正規分布に従っていない場合や、サンプルサイズが小さい場合はノンパラメトリック検定の利用を検討してください。対応がない2グループの比較ならウイルコクソンの順位和検定がt検定の代替手法になります。

「何サンプル集めればいいか」を事前に計算することも重要です。必要なサンプル数の求め方はサンプルサイズの決め方｜t検定・分散分析に必要なn数を参照してください。<

t検定のやり方を具体例でわかりやすく解説

「2標本のt検定（対応あり、なし）」の具体例を見ていきましょう。

2標本のt検定　対応ありの具体例

状況：ダイエットプログラム前後での体重の変化を検証する。

参加者数: 10人
体重の平均変化: -4kg
体重変化の標準偏差: 2kg
有意水準0.05（5%）

帰無仮説と対立仮説の設定
- 帰無仮説 (H0): 体重の変化の平均 = 0
- 対立仮説 (H1): 体重の変化の平均 ≠ 0
t統計量の計算
- 各参加者の体重変化（後 – 前）の平均と標準偏差を計算。
- t値 = (平均体重変化 – 0) / (標準偏差 / √標本サイズ)
  t値 = (-4 – 0) / (2 / √10) = -6.32
t分布から臨界値を求める
- 有意水準と自由度（標本サイズ – 1）を用いて臨界値を求める
  自由度 = 10 – 1 = 9
  臨界値：t分布表より自由度9の片側検定　1.8331　※体重が減ったかどうかなので「片側検定」
  棄却域：1.8331 < t
結論の導出
- t値－6.32 < 臨界値 1.8331　したがって帰無仮説を採用する。
  つまり、ダイエットプログラムの効果があり、体重が減ったことを示唆している。

≫対応のあるt検定を詳しく解説

2標本のt検定　対応なしの具体例

状況：あるチョコレートを製造している2拠点の工場間で同一製品が作られているか検証する

工場Aの標本平均: 100g
工場Bの標本平均: 102g
両工場の標本標準偏差: 5g
両工場の標本サイズ: 各10個
有意水準0.05（5%）

帰無仮説と対立仮説の設定
- 帰無仮説 (H0): ２つの工場で作られた製品（重量）は同じ　（μA = μB）
- 対立仮説 (H1): ２つの工場で作られた製品（重量）は異なる　（μA ≠ μB）
t統計量の計算
- 両工場の平均重量と標準偏差を計算
- t値 = (A工場平均の重量 – B工場の平均重量) / √((標準偏差A²/サイズA) + (標準偏差B²/サイズB))
  t値 = (100−102)/√(5²/10)+(5²/10) = -0.89
t分布から臨界値を求める
- 有意水準と自由度（標本サイズ – 1）を用いて臨界値を求める
  自由度 = 10 – 1 = 9
  臨界値：t分布表より自由度9の両側検定　2.2622
  棄却域：t < -2.2622, 2.2622 < t
結論の導出
- t値 -0.89 ＞ -2.2622　したがって帰無仮説を採用する。
  つまり、工場Aの製品の平均重量が工場Bのそれよりも統計的に有意に低いとは言えないことを示唆しています。

📚 合わせて読みたい書籍

完全独習統計学入門（小島寛之）— 数式を最小限に抑えた統計学の入門書。検定の考え方を基礎から学べます。

マンガでわかる統計学（高橋信）— マンガ形式でとにかくわかりやすい超入門書。統計学が初めての方に。

t検定の種類別・実践別の詳しい解説

t検定はデータの対応関係と等分散性によって使う手法が変わります。目的別に、それぞれの詳しい例題・計算手順を以下の記事で解説しています。

等分散を仮定する2群の比較 → スチューデントのt検定を例題で解説
分散が等しくない2群の比較 → ウェルチのt検定を例題で解説
同じ対象の前後比較（対応あり） → 対応のあるt検定を例題で解説
Excelの分析ツールでやる → Excelでt検定のやり方を種類ごとに解説
Excelで手計算して理解する（対応あり） → 対応のある2標本のt検定を手動で計算
Excelで手計算して理解する（対応なし） → 対応のない2標本のt検定を手動で計算
Pythonで実装する → Pythonでt検定（対応ありなし）
F検定との違いを知る → F検定とt検定の違いと使い分け

まとめ

要点をまとめます。

t検定は2グループの平均値の差を検定する手法
種類は「スチューデント（対応なし・等分散）」「ウェルチ（対応なし・不等分散）」「対応あり」の3種類
迷ったらウェルチのt検定を選ぶのが実務上の基本
手順は①仮説設定→②t統計量の計算→③自由度の計算→④p値との比較
ExcelやPythonで簡単に実装できる

迷ったらまずウェルチから始めてみてください。たいていのケースはそれで対応できます。各手法の詳しい計算例は以下の記事で確認できます。

📚 この記事の内容をもっと深く学ぶ

『完全独習統計学入門』小島寛之 t検定の背景にある確率・正規分布・仮説検定の考え方を、言葉で丁寧に解説した入門書。「なぜこの計算をするのか」がわからないまま使っている方に特におすすめです。 Amazonで確認する →

『入門統計学』栗原伸一 t検定・分散分析・実験計画法まで、理論と実践をバランスよくカバーした教科書。t検定の次のステップ（分散分析・多重比較）まで見据えて学びたい方に。 Amazonで確認する →

他のおすすめ書籍を見る →

統計学初学者におすすめ！「基礎から学ぶ統計学」

本書はフルカラーで図や写真がふんだんに使われていて、初学者にとっつきやすく、飽きが来ないように工夫されています。楽しく学べることは一番大事。

読者のつまづきポイントがだいたいわかっていて、本文中で「ん？」となりそうな箇所の後にはすかさず補足情報が入る。

t検定のようなちょっとした統計学を使うビジネスパーソンにはぴったりの一冊です！

検定の結果とあわせて信頼区間を提示すると、母平均の不確かさをより具体的に伝えられます。Excelでの計算手順は信頼区間の求め方｜Excelで95%信頼区間を計算する手順で解説しています。

t検定でp値が有意になった場合、差の「大きさ」を示す効果量（Cohen’s d）も一緒に報告すると分析の説得力が増します。計算手順は効果量（Cohen’s d・η²）の求め方で解説しています。

t検定の結果として出力されるp値の意味と有意水準との比較は、p値とは｜有意差の意味と0.05の根拠をわかりやすく解説で詳しく解説しています。

t検定が前提とする正規分布の意味と確率計算の手順は、正規分布とは｜確率密度関数とExcelで確率を計算する手順で詳しく解説しています。