エクセル分析ツール

エクセル分析ツールでヒストグラムを作るやり方

記事内に広告が含まれています。

ヒストグラムは、データの分布を視覚的に表現するためのグラフです。データを一定の区間(ビン)に分け、それぞれのビンに含まれるデータの頻度を棒グラフの形で表示します。これにより、データの分布の形状や偏り、外れ値の有無を簡単に把握することができます。

この記事ではExcel分析ツールを使ってヒストグラムのグラフを作成する手順と関数を使ってヒストグラムを作成する方法ついて解説します。

ヒストグラムとは何か

ヒストグラムは、データをいくつかの区間(階級)に分けて各区間のデータ数(度数)を棒グラフで表したものです。横軸が測定値の範囲、縦軸が度数(または相対度数)になります。

散布図や管理図が「時系列のデータの動き」を見るのに対し、ヒストグラムは「データ全体がどのように分布しているか」を見ます。正規性確認・工程能力分析・異常の発見など、データ分析のあらゆる場面で最初に確認すべきグラフです。

階級数の目安

階級数(バーの数)はデータ数によって変わります。

データ数推奨階級数
〜505〜7
50〜1006〜10
100〜2507〜12
250〜10〜20

スタージェスの公式(階級数 ≈ 1 + log₂n)も使われますが、実務では「分布の形が読み取れる」程度の数であれば問題ありません。

例題:シャフト外径(n=25)のヒストグラム

シャフト外径(mm)の測定データ25点を使います。規格は 50.00 ± 0.50 mm(規格上限 50.50、規格下限 49.50)です。

測定データ(mm)
50.1249.9550.2350.0849.87
50.3150.0549.7850.1950.02
49.9150.1450.2749.9650.11
50.0349.8250.1850.3549.94
50.0750.2249.8950.1650.04

データの最小値は49.78、最大値は50.35。範囲は0.57 mmです。n=25なので、階級数は6〜7が適切です。

度数分布表の作成

階級幅を0.10 mmとして、度数分布表を作ります。

階級区間(mm)度数
149.70〜49.801
249.80〜49.903
349.90〜50.005
450.00〜50.107
550.10〜50.206
650.20〜50.302
750.30〜50.401

エクセル「分析ツール」を使ったヒストグラム作成のやり方と具体例

ヒストグラムは”クラスのテストの点数”、”商品の売上個数”、”顧客の年齢など、データの分布状況、データの性質や傾向を視覚的に把握するのに有効です。

今回のヒストグラム作成は”ある商品購入者の年齢”に関するデータを使用して説明します。データはchatGPTを使って生成した仮想データです。

まず、エクセルの分析ツールを使ってヒストグラムの作成を行う手順を解説します。

エクセル「分析ツール」の有効化

エクセルで回帰分析を行うためには、「分析ツール」を有効にする必要があります。このツールはデフォルトでは有効化されていないことが多いので、まずは「データ分析」ツールを有効化する必要があります。

データ分析ツールの有効化手順

  1. Excelを開き、上部にある「ファイル」タブをクリックします。
  2. メニューの一番下にある「オプション」を選択します。
  3. 左側のメニューから「アドイン」カテゴリを選択し、「分析ツール」を見つけます。
  4. 下部の「管理」ボックスで「Excelアドイン」を選択し、「設定」をクリックします。
  5. 表示されるリストから「分析ツール」にチェックを入れ、「OK」をクリックします。

これで、分析ツールが使用可能になります。

具体例でヒストグラム作成の手順を解説

次に、具体的なヒストグラム作成の手順を説明します。

ヒストグラム作成の手順

  1. データの区間を設定:セルに任意のデータ区間の上限値を作成します(例:20以下をカウントしたい場合は20)データ区間の数は”ビン”と呼ばれ、データの傾向を把握しやすいように適切に設定する必要があります。
  2. データ分析ツールを選択:Excelの「データ」タブに移動し、右端にある「データ分析」を選択
  3. ヒストグラムを選択:表示されるリストから「ヒストグラム」を選択
  4. 入力範囲の指定
    • 入力範囲:ヒストグラムを作成するデータの範囲を選択します。(例:$A$1:$C$13)
    • データ区間:データ範囲を指定しない場合、自動的にデータの範囲を決定します。ここで設定するのは手順1作成したデータ区間の上限値です。
    • 出力範囲:分析結果を表示するセル範囲を指定します。(例:$E$1)
  5. グラフ出力のチェック:グラフ出力にチェックを入れます。
  6. OKをクリック:設定が完了したら、「OK」ボタンをクリック。エクセルが相関分析を実行し、指定したセル範囲に結果を出力します。

例題のヒストグラムの結果

上記は例題の分析結果です。度数分布表(左表)とヒストグラムグラフ(グラフ作成に✓を入れた場合)が表示されます。例題では”20代以下、30代、40代、50代の年齢別ヒストグラム”を作成したかったのでデータ区間は上限値の”29、39、49、59”に設定しました。表の”次の級”とは今回の場合60以上のデータを指します。ヒストグラムグラフを作成することで年齢別の分布を一目で把握できるようになりました。

出力オプション:パレート図、累積分布表

エクセル分析ツールの出力オプションにあるパレート図、累積分布表についても簡単に説明しておきます。

出力オプションの累積分布表を選択すると頻度の隣に”累積%”とグラフにも第二軸に”累積%”が表示されます。これは頻度の比率を足し合わせた値で、例の表では、1~29までの値が35%、1~39までの値が75%、といった具合に各データ区間がデータ全体のどれくらいの比率を占めているかを把握することができます。

出力オプションの累積分布表を選択すると累積分布表が2つ表示されます。新しく表示された右表は頻度を降順に並べ替えたものです。頻度順に並べ替えることで頻度の大きい順にデータ全体への影響度が把握しやすくなります。

エクセルの関数を使ってヒストグラムを作成する場合

FREQUENCY 関数を使ったヒストグラム作成方法について説明します。

FREQUENCY関数を使ったヒストグラムの作成手順

  1. データの区間を設定:セルに任意のデータ区間の上限値を作成します(例:20以下をカウントしたい場合は20)
  2. 頻度を表示したいセルを全てを選択:例:D2:D5
  3. FREQUENCY関数を入力:上部の数式バーに関数を入力(例:=FREQUENCY(B2:B21,C2:C5))
  4. 配列数式として入力Ctrl + Shift + Enter を押して、配列数式として入力します。

関数使うとグラフの作成も手動でしないといけないので、個人的には分析ツールの使用をおすすめします。

ヒストグラムの読み方

グラフの形を見て工程の状態を判断します。

形の特徴工程の状態考えられる原因
釣り鐘型(左右対称)✅ 正常・安定
右に裾が長い(右歪み)⚠️ 右方向に外れ値加工量の上限なし・摩耗の蓄積
左に裾が長い(左歪み)⚠️ 左方向に外れ値全数選別の痕跡・限界値あり
山が2つ(二峰性)❌ 2つの工程・設備が混在2つのロット・機械・作業者の混在
規格限界でデータが急減❌ 選別後のデータ全数検査で不良を除去している
孤立した棒がある❌ 外れ値の存在測定ミス・特殊原因による異常品

この例では山が50.00〜50.10の中心付近にあり、左右ほぼ対称です。分布の形としては正常の範囲内で、データが規格内(49.50〜50.50)に収まっています。

正規性の確認との関係

ヒストグラムは正規性確認の第一歩ですが、「釣り鐘型だから正規分布」と断言するにはデータ数が少なすぎることが多いです。n=25程度では、正規分布していても歪んで見えることがあります。

ヒストグラムで大まかな形を確認したあとは、Q-Qプロットやシャピロウイルク検定で定量的に正規性を確認するのが確実です。詳しい手順はExcelで正規性を確認する方法を参照してください。

工程能力分析との連携

ヒストグラムに規格の上下限(USL・LSL)を重ねると、分布が規格内に収まっているかどうかをひと目で確認できます。分布の中心が規格中央からずれていないか、両端に規格外れがないかをチェックします。

ヒストグラムで分布の形と規格との位置関係を確認したあと、工程能力指数(Cp・Cpk)で定量評価するのが標準的な流れです。工程能力の計算手順は工程能力指数(Cp・Cpk)の計算とExcelでの求め方を参照してください。

まとめ

  • ヒストグラムはデータの分布の形を視覚化するグラフ。データ分析の第一歩として必ず描く
  • 階級数はデータ数に応じて5〜12程度が目安
  • Excelでは「データ分析 → ヒストグラム」または「挿入 → 統計グラフ」で作成できる
  • 釣り鐘型(正規)・右歪み・二峰性・孤立点など形の特徴から工程状態を読む
  • 規格線を重ねると工程能力の目視確認ができる
  • 正規性の厳密な確認はQ-Qプロットやシャピロウイルク検定も合わせて使う

ヒストグラムは「見るだけ」で終わりにするのではなく、「なぜこの形になっているか」を工程の知識から考えるのが大事です。二峰性が出たら原因を特定して層別する、外れ値が出たらデータを遡って確認する、という一歩先の行動につなげると分析の価値が上がります。

管理図で時系列の変動を確認する場合は管理図(X-R管理図)の作り方と見方も参照してください。

時系列データ(月別不良率・日別生産量など)のトレンドや季節性を把握したいときは、時系列分析の基礎|移動平均・指数平滑法をExcelで実践する手順が参考になります。

データの分布を複数グループで同時に比較したい場合は、Excelで箱ひげ図を作る方法|四分位数とデータ分布の読み方が参考になります。ヒストグラムより少ないスペースでグループ間の違いを伝えられます。

タイトルとURLをコピーしました