t検定を使うことで「2つのデータに差があるかどうか」を統計学的に判断することができます。
t検定には以下の種類があり、この記事では”対応のあるt検定”の実施手順について解説します。
- 等分散を仮定した対応のないt検定(スチューデントのt検定)
- 等分散を仮定しない対応のないt検定(ウェルチのt検定)
- 対応のあるt検定
対応のあるt検定とは?
対応のあるt検定は、同じ被験者が異なる条件で測定された2つの平均値を比較するための統計手法です。これは、例えば、治療前と治療後の同じ患者の血圧、講義受講前と講義受講後の同じ学生のテスト点数など、”ペアになったデータの差を評価する”ために使用されます。対応しない場合は他のt検定を適用します。
対応のあるt検定の手順をわかりやすく解説
以下対応のあるt検定の実施手順を解説します。以降記載の”t検定”は”対応のあるt検定”のことを意味します。
t検定手順1.仮説を立てる
- 帰無仮説(H0):群1と群2の母平均値に”差がない”
- 対立仮説(H1):以下のいずれかの仮説を設定
- 群1の母平均は群2の母平均より”大きい”
- 群1の母平均は群2の母平均より”小さい”
- 群1の母平均と群2の母平均は”異なる”
t検定手順2.検定方法(両側検定or片側検定)を決める
対立仮説によって自動的に決まります。
- 群1の母平均は群2の母平均より”大きい” ⇒ 片側検定(右側検定)
- 群1の母平均は群2の母平均より”小さい” ⇒ 片側検定(左側検定)
- 群1の母平均と群2の母平均は”異なる” ⇒ 両側検定
t検定手順3.統計量(t値)を算出する
対応のあるt検定の統計量(t値)を計算します。まず、各ペアの差を計算し、差の平均値、標準偏差を求めます。
計算した差の平均値、標準偏差とサンプルサイズを使用してt値を計算します。
t検定手順4.p値を算出、有意差判定
計算したt値と自由度(n-1)を用いて、p値を算出します。
・片側検定のp値はt分布における検定統計量の上側確率
・両側検定のp値はt分布における検定統計量の上側確率の2倍。
p値が事前に設定した有意水準(例えば0.05)の場合、
・p値<有意水準0.05 ⇒ 帰無仮説を棄却し対立仮説を採択 有意差がある
・p値≧有意水準0.05 ⇒ 対立仮説を採択できず、有意差があるといえない
t検定手順5.信頼区間を算出する
平均値の差の信頼区間を計算します。信頼区間は以下の式で求められます。
信頼区間を適用しての有意差検定を行う
・信頼区間が0をまたがらない ⇒ 2群の母平均値は異なる
・信頼区間が0をまたがる ⇒ 2群の母平均値は異なるといえない
【例題】対応のあるt検定をやってみよう!
それでは具体例を使って、t検定を実際に行ってみましょう。
例題:講義受講前後でのテスト点数比較
以下10人の学生の講義受講前と講義受講後のテスト得点を比較します
・講義受講前:60,72,78,65,70,80,68,74,62,75
・講義受講後:65,75,80,70,68,85,72,78,65,78
1.仮説を立てる
・帰無仮説:講義受講前後の平均得点に差はない。
・対立仮説:講義受講前後の平均得点に差がある。
2.検定方法
講義受講前後の平均得点は”異なる”なので”両側検定”
3.統計量を算出する
4.p値を算出、有意差判定
t分布表を使って、t値4.82に対応するp値を求めます。p値が”0.00094”でした。これは有意水準0.05より小さいので、帰無仮説を棄却し対立仮説を採択。受講前後の平均得点に有意差があるといえます。
5.信頼区間を算出
95%信頼区間を計算します。
t分布表から、t_{0.025, 9}の値は約2.262です。したがって、信頼区間は
信頼区間は (1.70, 4.70) となり、0を含まないため、受講前後の平均得点に有意な差があるといえます。
【関連記事】
≫ウェルチのt検定
≫スチューデントのt検定