母集団の分布が正規分布に従うことを仮定しない検定法であるノンパラメトリック検定にはいくつかの種類があります。この記事では、データが”3群以上の比較”かつ”対応のある”場合に使用する、フリードマン検定について解説します。
フリードマン検定とは
対応のある3群以上のデータ間の中央値に有意差があるかどうかを検定するノンパラメトリック手法です。データが等分散性の仮定が成り立たない場合、サンプルサイズが小さい場合に特に適しています。フリードマン検定は対応のある分散分析(ANOVA)のノンパラメトリック版でランクデータに基づいて計算されます。
”対応のない”3群以上のデータ間の中央値に有意差があるかどうかを検定する場合は、クルスカルワリス検定を使用します。
”対応あり”と”対応なし”とは?
対応あり:関連する2つのグループ(たとえば、同じ被験者の投薬前後の測定値を比較する場合)
対応なし:2つの独立したグループ(たとえば、異なるコーヒーの味を比較する場合)
フリードマン検定の計算手順
以下にフリードマン検定の計算手順を解説します。
【1】仮説を立てる
- 帰無仮説(H0):3群以上の母集団の順位平均値は”同じ”
- 対立仮説(H1):3群以上の母集団の順位平均値は”異なる”
【2】両側検定、片側検定を決める
フリードマン検定は”片側検定”のみです。
【3】検定統計量を算出
- データのランク付け:各ブロック内でデータを昇順に並べ、それぞれに順位を付けする(同じ値には平均の順位を割り当てる)。
- ランクの合計:各条件のランクの合計を計算する。
- 検定統計量の計算:以下の式を用いて検定統計量$Q$を計算する。
ここで、$n$はブロック数、$k$は条件の数、$Rj$は条件$j$のランクの合計です。
【4】p値を算出
カイ二乗分布を適用し、p値を算出する。
【5】有意差判定
- p値<有意水準0.05 ⇒ 帰無仮説を棄却し対立仮説を採択。3群以上の順位平均値に”有意差があるといえる”
- p値≧有意水準0.05 ⇒ 帰無仮説を棄却できず、3群以上の順位平均値に”有意差があるといえない”
【例題】フリードマン検定をやってみよう!
以下に示す例題でフリードマン検定を実際にやってみましょう。
例題:パンの新しいレシピの比較
あるパン屋さんが新しい3つのパンのレシピ(レシピA、レシピB、レシピC)を評価するために、5人のパン好きの猫にそれぞれのパンを試食してもらい、1から10のスコアで評価してもらいました。同じ猫が各パンを評価しているためデータは関連しています。フリードマン検定を使用して、3つのパンの間に有意な差があるかどうかを検定します。
猫 | レシピA | レシピB | レシピC |
ミケ | 8 | 7 | 9 |
タマ | 7 | 6 | 8 |
チビ | 9 | 7 | 8 |
ハナ | 6 | 6 | 7 |
クロ | 7 | 5 | 6 |
【1】仮説を立てる
・帰無仮説:レシピA,レシピB,レシピCの母集団の順位平均値は”同じ”
・対立仮説:レシピA,レシピB,レシピCの母集団の順位平均値は”異なる”
【2】検定方法
フリードマン検定なので”片側検定”
【3】統計量を算出
- データのランク付け:各ブロック内でデータを昇順に並べ、それぞれに順位を付け
- ランクの合計:各条件のランクの合計を計算
- 検定統計量の計算:以下の式を用いて検定統計量$Q$を計算
【4】p値を算出
自由度は $k−1=2$ です。カイ二乗分布を用いてp値を求めます。
今回は統計量が”3.9”なので、p値は0.146~0.100の間となります。
【5】有意差の判定
p値≧有意水準0.05なので、帰無仮説を棄却できずレシピA,レシピB,レシピCの母集団の順位平均値は”同じ”と結論付けます。