エクセル分析ツール

歪度・尖度の求め方と解釈|Excelで分布の形を数値化する

記事内に広告が含まれています。

この記事でわかること

  • 歪度・尖度の意味と計算式(Excel SKEW・KURT 関数の使い方)
  • 正の歪度・負の歪度・正の尖度・負の尖度の読み方と判断基準
  • 引張強度データ(n=10)を使った計算例と結果の解釈

📌 前提知識:正規分布の基礎標準偏差の求め方を読んでいると理解しやすくなります

引張強度の測定データが10点ある。ヒストグラムを描いたら、なんとなく右側に裾を引いた形に見える——でも「どのくらい歪んでいるか」を数字で表せない。上司への報告で「なんとなく正規分布から外れています」では説得力がない。

そんなとき使うのが歪度(わいど)と尖度(せんど)です。分布の形を2つの数値に圧縮する指標で、ヒストグラムの主観的な読み取りを客観的な数字に変換できます。Excelなら SKEW 関数と KURT 関数で一発。難しい計算は不要です。

この記事では、製造現場の引張強度データ(n=10)を例に、歪度・尖度の計算手順と結果の読み方を解説します。

歪度・尖度が役立つ3つの場面

①正規性の事前スクリーニング

工程能力指数 Cp・Cpk や正規性検定を使う前に、データが正規分布に近いかどうかを手早く確認する場面で役立ちます。歪度が ±1 を超えていたり、尖度が大きく外れていたりすれば「まず分布の形を精査する」という判断の根拠になります。

②ヒストグラムの数値的補完

ヒストグラムは分布の形を視覚化しますが、サンプル数が少ないと形が安定しません。歪度・尖度を並記すれば、グラフだけでは読み取れない非対称性や裾の重さを定量的に伝えられます。報告書やプレゼン資料での根拠として有効です。

③外れ値の影響を定量化する

標準偏差は外れ値の影響を受けますが、どちらの方向にどの程度引っ張られているかは教えてくれません。歪度が正の方向に大きければ、上側に外れた値がある証拠です。外れ値の除去前後で歪度を比較すると、その影響を数値で示せます。

歪度とは——分布の左右の傾きを数値化する

歪度(Skewness)は、分布が平均を中心に左右どちらに偏っているかを示す指標です。正規分布のような左右対称な分布では歪度は 0 になります。

歪度の計算式

Excelの SKEW 関数が使う標本歪度の計算式は次のとおりです。

$$g_1 = \frac{n}{(n-1)(n-2)} \sum_{i=1}^{n} \left(\frac{x_i – \bar{x}}{s}\right)^3$$

ここで $n$ はサンプル数、$\bar{x}$ は標本平均、$s$ は標本標準偏差です。各データを標準化($z$ スコア化)して 3 乗し、補正係数をかけた値です。3 乗することで符号(正負)が保持されるため、分布の傾きの方向が反映されます。

Excelでは =SKEW(データ範囲) の1行で計算できます。

歪度の読み方

歪度の値 分布の形 製造現場での意味
$g_1 = 0$ 左右対称 正規分布に近い。平均と中央値がほぼ一致
$g_1 > 0$(正の歪度) 右裾が長い 高い方向に外れた値がある(突発的な高強度品など)
$g_1 < 0$(負の歪度) 左裾が長い 低い方向に外れた値がある(不良ロットの混入など)

一般的な目安:$|g_1| < 0.5$ なら「ほぼ対称」、$0.5 \leq |g_1| < 1.0$ なら「やや歪んでいる」、$|g_1| \geq 1.0$ なら「明確な歪みあり」と判断します。

尖度とは——分布の頂点と裾の形状を数値化する

尖度(Kurtosis)は、分布の頂点の鋭さと裾の重さを示す指標です。注意点が一つあります。Excelの KURT 関数は「超過尖度(excess kurtosis)」を返します。正規分布の超過尖度は 0 です(通常の尖度は 3 ですが、Excelでは 3 を引いた値が出力されます)。

尖度の計算式

$$g_2 = \frac{n(n+1)}{(n-1)(n-2)(n-3)} \sum_{i=1}^{n} \left(\frac{x_i – \bar{x}}{s}\right)^4 – \frac{3(n-1)^2}{(n-2)(n-3)}$$

各データの標準化値を 4 乗して総和を取ります。4 乗するため符号は常に正になり、平均から遠いデータ(外れ値)の影響が大きく反映されます。Excelでは =KURT(データ範囲) で計算できます。

尖度の読み方

Excelの KURT 値 分布のタイプ 意味
$g_2 = 0$ 正規型(中尖) 正規分布と同等の頂点の鋭さと裾の重さ
$g_2 > 0$(正の尖度) 尖頭型(レプトカーティック) 頂点が鋭く裾が重い。外れ値が出やすい
$g_2 < 0$(負の尖度) 平頭型(プラティカーティック) 頂点が平らで裾が軽い。均一なばらつき

$g_2 > 1$ になるとデータの裾が正規分布より重く、外れ値の発生リスクが高い分布です。$g_2 < -1$ では逆に均一すぎる分布で、測定範囲が制限されている可能性があります。

引張強度データで実際に計算する

使用データ

ある部品の引張強度を10回測定したデータを使います。

No. 引張強度(MPa) 偏差($x_i – \bar{x}$)
1 490 −14.0
2 495 −9.0
3 498 −6.0
4 500 −4.0
5 500 −4.0
6 502 −2.0
7 503 −1.0
8 505 +1.0
9 512 +8.0
10 535 +31.0

基本統計量:標本平均 $\bar{x} = 504.0\,\text{MPa}$、標本標準偏差 $s = 12.37\,\text{MPa}$

10番目の 535 MPa が他の測定値から大きく離れています。この 1 点が歪度・尖度にどう影響するかを数値で確認します。

ExcelのSKEW関数で歪度を求める

  1. Excelの A 列(A1:A10)に引張強度データを入力する
  2. 空きセル(例:C2)に =SKEW(A1:A10) と入力する
  3. Enter を押すと歪度が表示される

結果:$g_1 = 1.94$

正の値なので右裾が長い分布です。535 MPa の $z$ スコアは $(535 – 504.0) / 12.37 = 2.51$ で、これを 3 乗すると $15.8$ になります。10 点の合計(Σz³ = 14.0)の大部分がこの 1 点から来ていることが確認できます。

ExcelのKURT関数で尖度を求める

  1. 空きセル(例:C3)に =KURT(A1:A10) と入力する
  2. Enter を押すと超過尖度が表示される

結果:$g_2 = 4.76$

正の値なので尖頭型分布です。外れ値を 4 乗して計算するため、歪度より尖度への影響が大きくなります。535 MPa の寄与($z^4 = 39.5$)が Σz⁴ = 41.7 のほぼ全体を占めています。

結果の解釈

今回のデータでは、歪度 1.94・尖度 4.76 という値から次のことが読み取れます。

  • 490〜512 MPa の範囲に 9 点が集中し、535 MPa の 1 点だけが大きく外れている
  • 歪度の「明確な歪みあり」($|g_1| \geq 1$)に相当し、正規分布の前提が成立しにくい
  • 尖度 4.76 は外れ値が強く尖頭型を作り出していることを示す

参考として、535 MPa を除いた 9 点で計算すると SKEW ≈ 0.16・KURT ≈ 1.02 となり、分布の形はほぼ正規分布に近くなります。このような比較が、外れ値の影響を定量的に示す際に有効です。

正規性検定・工程能力指数との使い分け

歪度・尖度はあくまで記述統計量であり、「正規分布かどうか」を統計的に判断するものではありません。正規性の確認には シャピロ–ウィルク検定Excelでの正規性チェック を併用します。

手法 用途 目安となる基準
歪度・尖度 分布の形を素早く数値確認 $|g_1| < 0.5$・$|g_2| < 1$ なら「ほぼ正規」
シャピロ–ウィルク検定 正規性の統計的検定(n=50以下で特に有効) p 値 > 0.05 で正規分布を棄却しない
Q–Q プロット 正規性の視覚的確認 点が対角線に沿っていれば正規分布に近い

実務での使い方は「歪度・尖度で粗い判断 → ヒストグラムで視覚確認 → 必要なら正規性検定」の順が効率的です。

また、工程能力指数 Cp・Cpk は正規分布を前提とした指標です。歪度が大きいデータにそのまま適用すると、Cp・Cpk が実態を過大評価するリスクがあります。歪度 $|g_1| \geq 1$ のデータでは、正規性の確認を先に行ってから Cpk を解釈してください。

まとめ

歪度・尖度のポイントを整理します。

  • 歪度(SKEW)は分布の左右の傾きを数値化。正の値 → 右裾が長い、負の値 → 左裾が長い
  • 尖度(KURT)はExcelでは超過尖度を返す。正の値 → 頂点が鋭く裾が重い、負の値 → 平らな分布
  • 引張強度データ(n=10)では SKEW = 1.94・KURT = 4.76。535 MPa の外れ値 1 点が分布の形を大きく歪めていることが数値で確認できた
  • 外れ値を除くと SKEW ≈ 0.16・KURT ≈ 1.02 まで下がり、外れ値の影響を定量的に比較できる

使い分けの一言:正規性の「事前スクリーニング」として使うのが最も実用的。工程能力指数や仮説検定に進む前の確認ステップとして、歪度 $|g_1| < 0.5$・尖度 $|g_2| < 1$ を目安に判断してください。

関連記事:

タイトルとURLをコピーしました