この記事でわかること
- 5つのサンプリング方法(単純ランダム・系統・層別・集落・2段)の仕組み
- 精度と手間で見る使い分けの基準
- ExcelのRAND関数で無作為抽出する手順
📌 前提知識:サンプルから母集団を推測する考え方はサンプルサイズの決め方が参考になります
受け入れ検査でロットから20個を抜き取ることになった。さて、どの20個を取るか——。箱の上のほうから取りやすいものだけ抜いていませんか。取りやすいサンプルには偏りが入り込みます。上のほうの製品だけでは、輸送中の振動や温度の影響が偏って評価されるかもしれません。
サンプルの抜き方(サンプリング)は、データ分析より前の工程です。ここで偏れば、後の検定や推定がどれだけ正確でも結論は歪みます。この記事では、代表的な5つのサンプリング方法と使い分けを、製造業のロット検査を例に解説します。QC検定2級・3級の「データの取り方」分野でも頻出のテーマです。
サンプリングが必要な場面と大前提
全数検査ができない(数が多い・破壊試験・コストが高い)とき、母集団の一部=サンプルを調べて全体を推測します。抜取検査はその代表例です。このとき守るべき大前提が1つあります。
サンプルは母集団から無作為(ランダム)に取ること。「無作為」とは、母集団のどの個体も同じ確率で選ばれる状態を指します。作為が入ると、サンプルが母集団を代表しなくなり、そこから計算した平均も不良率も信用できなくなります。検定・推定・管理図など、統計手法はすべて「サンプルが無作為に取られている」ことを前提に組み立てられています。
5つのサンプリング方法
1. 単純ランダムサンプリング
母集団の全個体に通し番号をつけ、乱数で選ぶ最も基本の方法です。理論どおりの無作為が実現でき、すべての統計手法の前提と一致します。そのかわり、全個体に番号をつけられること(リスト化できること)が条件で、母集団が大きいと手間がかかります。
2. 系統サンプリング
最初の1個だけ乱数で選び、あとは一定間隔で抜き取る方法です。たとえばロット500個から20個取るなら、間隔は k = 500 ÷ 20 = 25。スタートを1〜25の乱数で決め(仮に7番)、7・32・57…と25個おきに選びます。ラインを流れる製品から「25個ごとに1個」のように運用しやすいのが長所です。
注意点は周期性です。設備のクセなどで25個周期の変動がもしあると、特定の状態ばかり抜き取ってしまい偏ります。工程に周期的な変動がないか先に確認しておきます。
3. 層別サンプリング
母集団をあらかじめ性質の近いグループ(層)に分け、各層からサンプルを取る方法です。たとえば3つのラインの生産量比が 5:3:2 なら、30個のサンプルを 15個・9個・6個と比例配分します。各ラインの状態が必ずサンプルに反映されるため、層の間に差があるほど推定の精度が上がります。
「層内は均一に、層間の違いは層分けで拾う」という考え方は、QC七つ道具の層別や、実験計画法の乱塊法(ブロック化)と同じ発想です。
4. 集落(クラスター)サンプリング
母集団をいくつかの集落(かたまり)に分け、集落ごといくつか選んで、選んだ集落は全数調べる方法です。たとえば100箱のロットから3箱を無作為に選び、その3箱の中身は全部検査するイメージです。リスト化や個別アクセスの手間が大幅に減ります。
層別と条件が逆である点に注意してください。集落サンプリングは「集落の中に母集団の縮図が入っている(集落内は多様、集落間は似ている)」ほど有効です。箱ごとに製造時期が違うなど集落間に差があると、選んだ箱しだいで結果が振れて精度が落ちます。
5. 2段サンプリング
まず1次単位(箱・パレットなど)をいくつか無作為に選び、次に選んだ1次単位の中から2次単位(製品)を無作為に抜き取る、2段階の方法です。集落サンプリングの「選んだ集落は全数」を「さらに一部だけ」に緩めた形で、大きなロットの実務でよく使われます。段数を増やせば3段・多段にもなります。
使い分けの基準(精度と手間)
5つの方法を「どんなときに選ぶか」で整理します。
| 方法 | 向いている場面 | 注意点 |
|---|---|---|
| 単純ランダム | 母集団をリスト化できる・基本形 | 大きい母集団では手間 |
| 系統 | ライン上で等間隔に抜ける | 工程の周期変動と重なると偏る |
| 層別 | 層間に差がある(ライン・ロット・材料) | 層の分け方と配分の設計が必要 |
| 集落 | かたまり単位でしか扱えない・手間を減らしたい | 集落間に差があると精度低下 |
| 2段 | 大ロット(箱→製品の階層構造) | 段ごとに誤差が積み上がる |
精度の傾向はおおむね「層別 ≥ 単純ランダム ≥ 集落・2段」、手間はその逆です。精度を取るなら層別、手間を減らすなら集落・2段、迷ったら単純ランダムが目安です。なお、必要なサンプル数そのものの決め方はサンプルサイズの決め方で解説しています。
Excelで無作為抽出する手順
乱数表の代わりに、Excelで簡単に無作為抽出ができます。ロット500個から20個選ぶ例です。
- A列に通し番号1〜500を入力する
- B列に乱数を振る:=RAND()(0〜1の一様乱数)
- B列を基準にA〜B列を昇順で並べ替える
- 上から20行の通し番号がサンプル(これが単純ランダムサンプリング)
系統サンプリングのスタート位置は =RANDBETWEEN(1, 25) のように整数乱数で決められます。RAND関数は再計算のたびに値が変わるので、確定したら「値として貼り付け」で固定しておくと安全です。
まとめ
サンプリングの種類のポイントを整理します。
- 統計手法はすべて無作為なサンプリングが前提。抜き方が偏れば結論も偏る
- 基本は単純ランダム(乱数で選ぶ)。ExcelならRAND関数+並べ替えで実現できる
- 系統は等間隔で運用しやすいが周期変動に注意
- 層別は「層間に差」があるとき精度向上。集落は「集落内が縮図」のとき手間削減
- 2段サンプリングは箱→製品のような階層構造の大ロット向け
使い分けを一言でいえば、精度重視なら層別、手間重視なら集落・2段、基本形は単純ランダムです。抜き取ったサンプルでロットの合否を判定する仕組みは抜取検査とOC曲線で、QC検定2級の分野別の学習順はQC検定2級 手法編の攻略ロードマップで解説しています。

