エクセル分析ツール

相関係数の読み方|強弱の目安とr=0.7は強いか弱いかの判断基準

記事内に広告が含まれています。

相関係数は−1から+1の値をとりますが、「r = 0.7は強い関係か弱い関係か」という判断は意外と難しいものです。分野によって基準が異なり、同じr = 0.6でも「十分強い」と判断される場面と「まだ弱い」と扱われる場面があります。

この記事では、製造業データを例に相関係数の強さの目安と読み方を整理します。散布図との対応、注意すべき落とし穴(相関≠因果・外れ値の影響)まで合わせて解説します。

この記事でわかること

  • 相関係数の強弱を判断する目安(5段階の基準)
  • r = 0.3・0.5・0.7・0.9 の散布図パターンの違い
  • 製造データでの相関係数の解釈例
  • 「相関があっても因果関係ではない」ことの意味
  • 外れ値や非線形関係がr値を歪める仕組み

相関係数とは

相関係数(ピアソンの積率相関係数)は、2変数の線形な関係の強さと方向を−1〜+1の数値で表す指標です。Excelでは CORREL 関数一つで計算できます。

値の範囲 意味
r = +1 完全な正の線形関係(一方が増えると他方も必ず増える)
0 < r < 1 正の相関(傾向として一方が増えると他方も増える)
r = 0 線形関係なし
−1 < r < 0 負の相関(一方が増えると他方は減る傾向)
r = −1 完全な負の線形関係

相関係数の計算手順は相関分析のやり方と結果の見方で詳しく解説しています。

強さの目安(5段階)

相関係数の強さを判断する基準として、Evansの基準が実務でよく使われます。絶対値 |r| で判断します。

|r| の範囲 強さの判断 製造業での解釈例
0.00 〜 0.19 ほぼなし(very weak) ほぼ無関係。他の要因を探したほうがよい
0.20 〜 0.39 弱い(weak) 傾向はあるが説明力は低い。参考程度
0.40 〜 0.59 中程度(moderate) 一定の関係がある。追加検証が望ましい
0.60 〜 0.79 強い(strong) 管理パラメータとして注目に値する
0.80 〜 1.00 非常に強い(very strong) 因果関係の可能性が高い。要因解析を進める

ただしこの基準は絶対ではありません。社会科学では r = 0.3 でも「強い」とされる場合があり、製造工程の精密測定では r = 0.9 未満を「弱い」と扱う場面もあります。分野と目的に合わせて判断することが重要です。

製造データでの解釈例

同じ製造ラインで計測した4種類のデータペアとその相関係数を比較します。

変数ペア r値 強さ 解釈
加熱温度 × 収率 +0.88 非常に強い正 温度を上げると収率が上がる傾向が明確。温度は重要な管理パラメータ
品質スコア × 不良率 −0.74 強い負 品質スコアが高いほど不良率が下がる傾向。逆相関が強く確認される
休憩時間 × 作業効率 +0.45 中程度の正 関係はあるが他の要因(習熟度・作業難易度)も影響している可能性
作業者の年齢 × 1時間生産量 +0.18 ほぼなし 年齢と生産量には線形の関係がほとんど見られない

r = +0.88 と r = −0.74 はどちらも「強い相関」です。符号(正・負)は方向を示すだけで、強さは絶対値 |r| で比較します。

散布図との対応

散布図の見た目とr値には明確な対応があります。散布図を描くことで、r値の計算前に大まかな相関の強さを視覚的に確認できます。

r値の目安 散布図の見た目
|r| ≈ 0.1 点がランダムに広がっており、傾向が見えない
|r| ≈ 0.5 ぼんやりとした楕円形に広がり、方向性が少し見える
|r| ≈ 0.8 細長い楕円形。直線的な傾向がはっきり見える
|r| ≈ 0.95 ほぼ直線状に並んでいる。外れ値が数点あっても直線が明確

Excelでの散布図の作り方は散布図の作り方(Excel)で手順を解説しています。

解釈の注意点

相関関係は因果関係ではない

r = 0.9 の強い相関があっても、「AがBを引き起こす」とは言えません。第三の変数C(交絡変数)がAとBの両方に影響していることがあります。たとえば「アイスの販売量と溺死者数の相関が高い」のは、どちらも「気温」という共通因子に影響されているためです。

因果関係を確認するには、実験計画法による制御実験が必要です。

外れ値がr値を大きく歪める

外れ値が1点あるだけで、r値が0.6 → 0.93 に変化することがあります。相関係数を計算する前に必ず散布図で外れ値の有無を確認してください。外れ値が疑われる場合はピアソン相関ではなくスピアマン順位相関係数の使用を検討してください。

非線形関係はrで捉えられない

U字型や曲線的な関係(例:最適温度の前後で収率が下がる)は、ピアソン相関係数では r ≈ 0 と計算されることがあります。r = 0 だからといって「無関係」とは限りません。散布図で形状を確認することが不可欠です。

まとめ

相関係数の強さの読み方をまとめます。

  • 強さは絶対値 |r| で判断する。|r| < 0.2(ほぼなし)、0.4〜(中程度)、0.6〜(強い)、0.8〜(非常に強い)が目安
  • 符号(正・負)は方向を示すだけ。強さとは別に判断する
  • r値だけでなく必ず散布図もセットで確認する
  • 強い相関 ≠ 因果関係。交絡変数・外れ値・非線形関係に注意する
  • 外れ値が疑われる場合はスピアマン順位相関係数を使う

相関分析の実施手順全体は相関分析のやり方と結果の見方、相関係数の有意性の確認は相関係数の有意性検定で解説しています。

タイトルとURLをコピーしました