分散分析(ANOVA:analysis of variance)は、3群以上の平均値の有意差を調べる場合に使う分析手法です。
分散分析には”一元配置分散分析”と”二元配置分散分析(繰り返し有り、無し)”の2種類があり、この記事では”繰り返しのない二元配置分散分析”について解説します。
繰り返しのない二元配置分散分析とは
二元配置分散分析(Two-Way ANOVA)は、2つの独立変数(因子)が従属変数に与える影響を同時に評価するための統計手法です。この分析は、各因子が従属変数に与える個別の影響を調べることができます。
繰返しのない二元配置実験では、全データのばらつきを因子Aの平方和、因子Bの平方和、誤差平方和の3つに分けて計算し、計算を行うと以下のような分散分析表が作成できます。
繰返しのない二元配置分散分析では、誤差平方和を交互作用効果として計算しています。
繰り返しの”あり”と”なし”の違い
繰り返し”あり”の二元配置分散分析:同一条件下で”複数回の測定”を行います。同一条件のデータが増えるので、誤差の影響が減り、データの安定性と信頼性が向上します。
繰り返し”なし”の二元配置分散分析:各条件で”一回のみ測定”を行います。実験工数を削減できますが、誤差の影響を受けやすいため、結果の信頼性が低くなることがあります。また、交互作用効果を検出することができません。したがって、あらかじめ交互作用がないことがわかっている場合に使用することを推奨します。
繰り返しのない二元配置分散分析の手順をわかりやすく解説
”二元配置分散分析”手順1.仮説を立てる
- 帰無仮説(H0A):二つの要因の間に差がない。
- 対立仮説(H1A):二つの要因の間に差がある。
”二元配置分散分析”手順2.検定方法(両側検定or片側検定)を決める
一般的に二元配置分散分析では”両側検定”を使用します。
”二元配置分散分析”手順3.分散分析表を算出する
- 平均:各要因、全体の平均を計算
- 要因Ai平均 = 要因Aiデータ合計 / 要因Aiサンプル数
- 要因Bi平均 = 要因Biデータ合計 / 要因Biサンプル数
- 全体平均 = 全データ合計 / 全サンプル数
- 要因Aの変動(SA):要因Aによる変動を計算
- SA = 要因Aサンプル数×∑(要因Ai平均 – 全体平均)^2
- 要因Bの変動(SB):要因Bによる変動を計算
- SB = 要因Bサンプル数×∑(要因Bi平均 – 全体平均)^2
- 誤差変動(Se):誤差変動を計算
- Se = ∑(AiBi平均 – 全体平均)^2 – SA -SB
- 自由度(Φ):各変動の自由度を計算
- 要因Aの自由度(ΦA) = 要因Aのサンプル数 – 1
- 要因Bの自由度(ΦB) = 要因Bのサンプル数 – 1
- 誤差の自由度(Φe) = ΦA × ΦB
- 全体の自由度(ΦT) = 全サンプル数 – 1
- 分散(V):各変動を対応する自由度で割る
- 要因Aの分散(VA) = SA / ΦA
- 要因Bの分散(VB) = SB / ΦB
- 誤差の分散(Ve) = Se / Φe
- F値:各平均平方を誤差の平均平方で割る
- 要因AのF値(FA) = VA / Ve
- 要因BのF値(FB) = VB / Ve
”二元配置分散分析”手順4.p値を算出、有意差判定
F値と対応する自由度を用いてp値を算出します(p値はF分布における分散比の上側確率)。
p値が事前に設定した有意水準(一般的に0.05、0.01が使用されます)の場合、
・p値 < 有意水準0.05 ⇒ 帰無仮説を棄却し対立仮説を採択。各群の母平均は異なるといえる。
・p値 ≧ 有意水準0.05 ⇒ 対立仮説を採択できず、各群の母平均は異なるといえない。
【例題】繰り返しなしの二元配置分散分析をやってみよう!
繰り返しのなし二元配置分散分析の計算過程とその結果を示します。
例題:引張強度の評価比較
ある工場で、新しい材料(要因A)と異なる加工温度(要因B)が製品の引張強度に与える影響を検討します。材料は4種類(A1, A2, A3,A4)、加工温度は3種類(B1: 低温, B2: 中温, B3: 高温)とします。データは以下です。
B1(低温) | B2(中温) | B3(高温) | |
A1 | 50 | 55 | 52 |
A2 | 60 | 65 | 62 |
A3 | 55 | 60 | 58 |
A4 | 70 | 75 | 72 |
1.仮説を立てる
帰無仮説:
・要因A(材料)は製品の引張強度に影響を与えない。
・要因B(加工温度)は製品の引張強度に影響を与えない。
・要因Aと要因Bの交互作用はない。
対立仮説:要因A、要因B、またはその交互作用が製品の引張強度に影響を与える。
2.検定方法を決める
両側検定を使用する。
3.分散分析表を作成する
4.p値を算出、有意差判定
F値と対応する自由度を用いて、F分布表からp値を算出します。
要因Aのp値:9.98e-10、要因Bのp値:9.61e-7
・要因Aのp値<有意水準0.05 ⇒ 帰無仮説を棄却し対立仮説を採択。材料種は製品の引張強度に影響を与える。
・要因Bのp値<有意水準0.05 ⇒ 帰無仮説を棄却し対立仮説を採択。加工温度は製品の引張強度に影響を与える。
【関連記事】
≫繰り返しのある二元配置分散分析
≫多重比較法とは