平均検定(Excel)

”ウェルチのt検定”を例題でわかりやすく解説

記事内に広告が含まれています。

この記事でわかること

  • ウェルチのt検定を使う条件(分散が等しくない2群)
  • 仮説からt値・自由度・p値・信頼区間までの計算手順(例題つき)
  • Welch–Satterthwaiteの式による自由度の求め方
  • ExcelのT.TEST関数・分析ツールでの実行手順とスチューデントとの使い分け

📌 前提知識:t検定の全体像を読んでいると理解しやすくなります

t検定を使うことで「2つのデータに差があるかどうか」を統計学的に判断することができます。
t検定には以下の種類があり、この記事では”ウェルチのt検定”の実施手順について解説します。

  • 等分散を仮定した対応のないt検定(スチューデントのt検定
  • 等分散を仮定しない対応のないt検定(ウェルチのt検定)
  • 対応のあるt検定

ウェルチのt検定は、分散が等しくない2群を比較するt検定です。等分散を仮定するスチューデントのt検定や対応のあるt検定との使い分けを含む全体像はt検定とは?具体例でわかりやすくやり方を解説で確認できます。

ウェルチのt検定とは

ウェルチのt検定は、2つのグループ(2群)の平均値を比較し、その差が統計的に有意かどうかを判断するための手法です。ウェルチのt検定はp値による有意差判定と母平均差分の信頼区間から構成されます。スチューデントのt検定と似ていますが、2つのグループの分散が異なる場合に適用されます。

ウェルチのt検定は以下条件に当てはまる場合に適用します。それ以外の場合は他のt検定を適用します。

  • 2群のデータは対応のないデータであること
  • 2つの母集団は正規分布に従っていること
  • 2群のデータの分散が等しいとはいえないこと

ウェルチのt検定とスチューデントのt検定の違い
分散の仮定
・スチューデントのt検定:2つのグループの分散が等しいと仮定します。
・ウェルチのt検定:2つのグループの分散が異なることを許容します。
【自由度の計算】
・スチューデントのt検定:サンプルサイズに基づく固定の自由度を使用します。
ウェルチのt検定:ウェルチ・サッタースウェイトの式を使用して自由度を調整します。

逆に、2群の分散が等しいと仮定できるときはスチューデントのt検定を使います。分散が等しいかどうかはルビーン検定やF検定で確認できます。ただし、ウェルチのt検定は等分散を前提としないぶん適用範囲が広く、判断に迷うときはウェルチを選んでおけば大きな間違いにはなりません。

ウェルチのt検定の手順をわかりやすく解説

以下ウェルチのt検定の実施手順を解説します。以降記載の”t検定”は”ウェルチのt検定”のことを意味します。

t検定手順1.仮説を立てる

  1. 帰無仮説(H0):群1と群2の母平均値に”差がない”
  2. 対立仮説(H1):以下のいずれかの仮説を設定
    • 群1の母平均は群2の母平均より”大きい”
    • 群1の母平均は群2の母平均より”小さい”
    • 群1の母平均と群2の母平均は”異なる”

t検定手順2.検定方法(両側検定or片側検定)を決める

 対立仮説によって自動的に決まります。

  • 群1の母平均は群2の母平均より”大きい” ⇒ 片側検定(右側検定)
  • 群1の母平均は群2の母平均より”小さい” ⇒ 片側検定(左側検定)
  • 群1の母平均と群2の母平均は”異なる” ⇒ 両側検定

t検定手順3.統計量(t値)を算出する

2群の平均値、標準偏差、サンプルサイズからt検定の統計量(t値)を計算します。

t検定手順4.p値を算出、有意差判定

計算したt値と自由度を用いて、p値を算出します。
・片側検定のp値はt分布における検定統計量の上側確率
・両側検定のp値はt分布における検定統計量の上側確率の2倍。

ウェルチのt検定はスチューデントのt検定と異なり、自由度は以下の式で計算します。

p値が事前に設定した有意水準(例えば0.05)の場合、
p値<有意水準0.05 ⇒ 帰無仮説を棄却し対立仮説を採択 有意差がある
p値≧有意水準0.05 ⇒ 対立仮説を採択できず、有意差があるといえない

t検定手順5.信頼区間を算出する

信頼区間は以下の式で求められます。

信頼区間を適用しての有意差検定を行う
・信頼区間が0をまたがらない ⇒ 2群の母平均値は異なる
・信頼区間が0をまたがる ⇒ 2群の母平均値は異なるといえない

【例題】ウェルチのt検定をやってみよう!

では具体的な例題を使って、t検定を実際に行ってみましょう。

1.仮説を立てる
 ・帰無仮説:グループAとグループBの平均得点に差はない。
 ・対立仮説:グループAとグループBの平均得点に差がある。

2.検定方法
グループAとグループBの平均得点は”異なる”なので”両側検定

3.統計量を算出する
・各グループの平均値を計算

・各グループの標準偏差を計算

・t値を計算

4.p値を算出、有意差判定
自由度を以下の式で計算します。

自由度をWelch–Satterthwaiteの式で求めると約7.87になります(求め方は後述)。この自由度のt分布で t値2.51 に対応する両側p値を求めると、約0.037でした。これは有意水準0.05より小さいので、帰無仮説を棄却して対立仮説を採択し、有意差があるといえます。

5.信頼区間を算出
95%信頼区間を計算します。

95%信頼区間は 平均差 ± t0.025(自由度約7.87) × 標準誤差 で求めます。標準誤差は √(9.5/5 + 7.3/5) = 1.833、臨界値はExcelの =T.INV.2T(0.05, 8) で求まる約2.31なので、4.6 ± 2.31 × 1.833 = 約 (0.36, 8.84) です。0を含まないため、2つのグループの平均値には有意な差があるといえます。

ウェルチのt検定の自由度(Welch–Satterthwaiteの式)

ウェルチのt検定がスチューデントのt検定と大きく違うのは、自由度の求め方です。スチューデントでは自由度が n₁+n₂-2 とシンプルですが、ウェルチでは2群の分散とサンプル数から次のWelch–Satterthwaiteの式で計算します。

自由度 = (s₁²/n₁ + s₂²/n₂)² ÷ { (s₁²/n₁)²/(n₁-1) + (s₂²/n₂)²/(n₂-1) }

先ほどの例題(s₁²=9.5・s₂²=7.3・n₁=n₂=5)で計算してみます。s₁²/n₁=1.9、s₂²/n₂=1.46なので、分子は (1.9+1.46)² = 3.36² = 11.29、分母は 1.9²/4 + 1.46²/4 = 0.90+0.53 = 1.43。よって自由度は 11.29 ÷ 1.43 ≒ 7.87 となります。

このように自由度は整数になるとは限りません。手計算では扱いにくいため、実務ではExcelなどのソフトに任せるのが一般的です。Excelの分析ツールは自由度を最も近い整数(この例では8)に丸めて出力します。

Excelでウェルチのt検定を行う手順

自由度の計算が面倒なウェルチのt検定こそ、Excelの出番です。方法は2つあります。

方法1.T.TEST関数で両側p値を出す

書式は =T.TEST(配列1, 配列2, 尾部, 検定の種類) です。ウェルチのt検定では4つ目の「検定の種類」に 3(分散が等しくないと仮定した2標本)を指定します。

例題のデータをA2:A6・B2:B6に入力した場合、両側検定なら次の式です。

=T.TEST(A2:A6, B2:B6, 2, 3)

戻り値がp値です。自由度の計算を意識しなくても、関数が内部でWelch–Satterthwaiteの式を使って正しいp値を返してくれます。0.05より小さければ有意差ありです。

方法2.分析ツールでt値・自由度まで出す

「データ」タブ →「データ分析」→「t検定: 分散が等しくないと仮定した2標本による検定」を選びます。変数1・変数2にデータ範囲を指定して実行すると、t値・自由度(整数に丸め)・両側p値・t境界値が表で出力されます。t検定の準備(分析ツールの有効化)やほかの種類とまとめて確認したいときはExcelでt検定のやり方を種類ごとに解説をご覧ください。

まとめ

ウェルチのt検定について、要点を整理します。

  • ウェルチのt検定は、分散が等しくない対応のない2群の平均差を検定する手法
  • 適用条件は「対応なし」「正規分布」「分散が等しいとはいえない
  • 自由度はWelch–Satterthwaiteの式で求め、整数になるとは限らない
  • Excelでは =T.TEST(配列1, 配列2, 2, 3) でp値が出る
  • p値が有意水準(通常0.05)より小さければ「有意差あり」

使い分けはシンプルです。2群の分散が等しいと仮定できるならスチューデントのt検定、できないならウェルチを使います。迷ったらウェルチで問題ありません。t検定全体の選び方はt検定とは?具体例でわかりやすくやり方を解説で、Excelでの操作手順はExcelでt検定のやり方を種類ごとに解説で確認できます。

タイトルとURLをコピーしました