エクセル分析ツール

散布図の作り方(Excel)|相関の可視化と外れ値の見つけ方

記事内に広告が含まれています。

相関係数を計算する前に、まず散布図で2変数の関係を目で確認することが重要です。外れ値・非線形関係・クラスタリングなど、数値だけでは見えない構造が散布図には現れます。

この記事では、鋼材熱処理工程の温度と収率データを例に、Excelで散布図を作成する手順を解説します。近似曲線の追加・外れ値の視覚的確認・複数系列を重ねる方法まで、実務ですぐ使えるかたちで説明します。

この記事でわかること

  • Excelで散布図を作成する基本手順
  • 軸ラベル・タイトルの設定方法
  • 近似曲線(線形・多項式)とR²の追加
  • 散布図から外れ値を視覚的に見つける方法
  • 2グループのデータを色分けして重ねる方法

散布図を使う場面

散布図(XYグラフ)は2つの連続変数の関係を可視化するグラフです。次のような場面で活用します。

  • 相関分析の前処理:r値を計算する前に関係の形状(線形か曲線か)を確認する
  • 外れ値の検出:全体のパターンから外れた点を視覚的に発見する
  • 工程管理:加工条件と品質特性の関係をプロットして最適条件を探る
  • 回帰分析の結果確認:予測値と実測値のばらつき具合を確認する

例題データ

鋼材熱処理工程10バッチの加熱温度と収率のデータです。ロット4は設備トラブルによる異常値です。

ロット加熱温度 x(℃)収率 y(%)備考
ロット115062
ロット216065
ロット317068
ロット418020設備トラブル(外れ値)
ロット519074
ロット620077
ロット721080
ロット822083
ロット923086
ロット1024089

散布図の基本手順(Excel)

STEP 1:データを入力する

A1セルに「加熱温度」、B1セルに「収率」と入力し、A2:B11にデータを入力します。x軸にしたい変数を左列(A列)、y軸にしたい変数を右列(B列)に並べるのがポイントです。

STEP 2:データ範囲を選択する

A1:B11を選択します(ヘッダー行を含めて選択します)。

STEP 3:散布図を挿入する

「挿入」タブ → 「グラフ」グループ → 「散布図(X, Y)またはバブルチャートの挿入」 → 「散布図」(マーカーのみ)をクリックします。

STEP 4:軸ラベルとタイトルを追加する

グラフを選択した状態で「グラフのデザイン」タブ → 「グラフ要素を追加」から操作します。

  • 「軸ラベル」→「第1横軸」:「加熱温度(℃)」と入力
  • 「軸ラベル」→「第1縦軸」:「収率(%)」と入力
  • 「グラフタイトル」:「加熱温度と収率の関係」と入力

近似曲線とR²の追加

散布図に近似曲線を引くと、関係の傾向と当てはまりの良さ(R²)を視覚的に確認できます。

手順

グラフ内のデータポイントを右クリック → 「近似曲線の追加」 → 「線形近似」を選択 → 「グラフにR²の値を表示する」にチェックを入れて「閉じる」をクリックします。

R²(決定係数)の読み方

R²は近似直線がデータのばらつきをどれだけ説明できるかを0〜1で表します。R² = 0.85 なら「データの変動の85%を近似直線が説明できる」という意味です。

R²の目安当てはまりの評価
0.9以上非常に良い当てはまり
0.7〜0.9良い当てはまり
0.5〜0.7中程度の当てはまり
0.5未満当てはまりが弱い

R²は相関係数rの二乗(R² = r²)です。r = 0.9 なら R² = 0.81 になります。

外れ値の見つけ方

散布図は外れ値を発見する最も直感的な方法です。今回のロット4(加熱温度180℃、収率20%)は他のデータ点の直線パターンから大きく外れており、グラフを見るだけで異常が一目でわかります。

外れ値を見つけたら以下を確認します。

  • 記録ミス・入力ミスでないか
  • 設備トラブルや実験条件の異常がなかったか
  • 正当な理由がある場合のみ除外し、除外した旨を記録する

統計的に外れ値を検出する方法は外れ値の検出方法(Grubbs検定・IQR法)で解説しています。

複数系列を重ねる方法

2つのグループ(例:ラインAとラインB)を色分けして1枚の散布図に重ねる場合は、系列を別々に追加します。

手順

グラフを右クリック → 「データの選択」 → 「追加」で第2の系列を追加し、xとyの範囲を指定します。系列ごとにマーカーの色・形を変えることで、グループの違いが視覚的に伝わります。

まとめ

  • 散布図は相関分析・外れ値確認・回帰分析の前処理として必ず作成する
  • x軸に説明変数、y軸に目的変数を配置するのが基本
  • 近似曲線とR²を追加すると傾向と当てはまりが一目で確認できる
  • 外れ値はグラフを見るだけで発見できる。統計的な判定はGrubbs検定・IQR法を使う
  • 複数グループは色分けして同一グラフに重ねると比較が容易になる

散布図で傾向を確認した後は相関分析のやり方と結果の見方で相関係数を計算し、相関係数の強弱の目安で結果を解釈してください。

タイトルとURLをコピーしました