エクセル分析ツール

信頼区間の求め方|Excelで95%信頼区間を計算する手順

記事内に広告が含まれています。

検査で10個測定して平均が52.4 MPaだったとき、「この製品の本当の強度は何MPaか」という問いに答えようとすると、点推定値だけでは不十分です。サンプルの平均は毎回変わりますし、10個では誤差が大きい。その不確かさを数値で示すのが信頼区間です。

この記事では、ExcelのCONFIDENCE.T関数とT.INV.2T関数を使って95%信頼区間を計算する手順を解説します。信頼区間の正しい解釈と、幅を狭くするための考え方まで確認できます。

信頼区間とは何か

母集団の平均 μ を推定するとき、「点推定」は x̄ という1つの値を答えとして出します。一方「区間推定」は、μ がある範囲に含まれると言える確率(信頼水準)を指定して、範囲(区間)を求めます。

95%信頼区間とは、「同じ手順でサンプリングと計算を100回繰り返したとき、95回はその区間の中に母平均が含まれる」という意味の区間です。「この区間に95%の確率でμが入っている」という意味ではない点には注意が必要です。

製造業では、製品の強度・寸法・純度などの「真の値(母平均)」がどの範囲にあるかを確認したいときに使います。

信頼区間の計算式

標本平均の信頼区間は、t分布を使って次のように求めます。\[ \bar{x} \pm t\left(\frac{\alpha}{2},\ n-1\right) \cdot \frac{s}{\sqrt{n}} \]

各記号の意味は次のとおりです。

  • \(\bar{x}\):標本平均
  • \(t(\alpha/2,\ n-1)\):自由度 n-1、有意水準α/2 の t値(95%信頼区間ならα=0.05、t(0.025, n-1))
  • \(s\):標本標準偏差(STDEV.S関数)
  • \(n\):サンプルサイズ

\(s/\sqrt{n}\) は標準誤差(SE)とも呼ばれ、サンプル平均のばらつきを表します。nが大きいほどSEが小さくなり、区間が狭まります。

例題:引張強度の95%信頼区間

ある鋼材から10本のサンプルを採取して引張強度(MPa)を測定しました。

サンプル引張強度(MPa)
152.3
251.8
353.1
452.6
551.9
653.0
752.4
851.7
953.2
1052.0

手順①:基本統計量を計算する

\[ \bar{x} = \frac{52.3 + 51.8 + \cdots + 52.0}{10} = 52.40 \text{ MPa} \] \[ s = \sqrt{\frac{\sum(x_i – \bar{x})^2}{n-1}} = 0.558 \text{ MPa} \] \[ SE = \frac{s}{\sqrt{n}} = \frac{0.558}{\sqrt{10}} = 0.176 \text{ MPa} \]

手順②:t値を求める

自由度 df = n-1 = 9、95%信頼区間(α=0.05)のt値です。Excelでは次の式で求めます。

=T.INV.2T(0.05, 9) → 2.262

手順③:信頼区間を計算する

\[ \text{誤差幅} = t \cdot SE = 2.262 \times 0.176 = 0.399 \text{ MPa} \] \[ \text{下限} = 52.40 – 0.399 = 52.00 \text{ MPa} \] \[ \text{上限} = 52.40 + 0.399 = 52.80 \text{ MPa} \]

95%信頼区間は [52.00, 52.80] MPa です。この鋼材の母平均引張強度がこの範囲に含まれると、95%の信頼水準で言えます。

Excelでの計算手順

方法①:CONFIDENCE.T関数を使う

  1. A列にデータを入力(A2:A11)
  2. 平均:=AVERAGE(A2:A11) → 52.40
  3. 標準偏差:=STDEV.S(A2:A11) → 0.558
  4. 誤差幅:=CONFIDENCE.T(0.05, STDEV.S(A2:A11), 10) → 0.399
  5. 下限:=平均セル - 誤差幅セル
  6. 上限:=平均セル + 誤差幅セル

CONFIDENCE.T関数の引数は(有意水準α, 標準偏差, サンプルサイズ)の順です。

方法②:T.INV.2T関数を使う(計算過程が見える)

  1. t値:=T.INV.2T(0.05, n-1) 例:=T.INV.2T(0.05, 9) → 2.262
  2. 標準誤差(SE):=STDEV.S(データ範囲)/SQRT(n)
  3. 誤差幅:=t値 × SE
  4. 下限・上限:=平均 ± 誤差幅

上司や同僚に計算過程を説明する必要がある場面では、T.INV.2T を使ったほうがどこで何を計算しているかが見えやすいです。

信頼区間の幅に影響する3つの要因

信頼区間の幅(誤差幅の2倍)は、以下の3つで変わります。

要因変化区間幅への影響
信頼水準95% → 99%広がる(より確実に言えるぶん、幅を取る)
標準偏差 s大きくなる広がる(ばらつきが大きいほど不確かさが増す)
サンプルサイズ n大きくなる狭まる(√n に反比例して誤差幅が縮む)

区間を狭くして「精度の高い推定」をしたい場合の手っ取り早い方法は、nを増やすことです。ただしnを4倍にしないと幅は半分になりません(√n の関係)。サンプルサイズの設計についてはサンプルサイズの決め方|t検定・分散分析に必要なn数の計算も参考にしてください。

信頼区間とt検定の関係

t検定の結果と信頼区間には直接的な対応関係があります。「母平均 μ₀ が95%信頼区間の外にある」ことは、「有意水準5%のt検定でμ = μ₀を棄却できる」ことと同値です。

信頼区間のほうが「どのくらいの値を否定できるか」が視覚的にわかりやすいため、検定結果を報告する際に信頼区間を添えるのが推奨されています(CONSORT声明など)。t検定の詳細はt検定とは?具体例でわかりやすくやり方を解説を参照してください。

よくある誤解

95%信頼区間 [52.00, 52.80] に対して「母平均がこの区間内にある確率が95%」と言うのは、厳密には誤りです。区間推定の手順では、区間そのものが「確率的に変動する」ものとして扱います。実際に母平均が何であるかは固定値です。

正確には「この手順で繰り返し計算すると、95%の割合で母平均を含む区間が得られる」という意味です。実務上は「95%の確信を持って母平均がこの範囲にある」という言い方で通ることがほとんどですが、報告書に書く際は注意が必要です。

まとめ

  • 信頼区間は母平均の不確かさを区間で表したもの。点推定よりも情報が多い
  • 計算式:x̄ ± t(α/2, n-1) × s/√n
  • Excelでは CONFIDENCE.T 関数または T.INV.2T × STDEV.S/SQRT(n) で求める
  • 区間を狭めたい場合はサンプルサイズを増やすのが最も効果的
  • t検定のp値と信頼区間は表裏一体の関係

分析結果を報告するとき、平均値だけでなく信頼区間を添えると「この値にどれだけ信頼性があるか」が伝わります。仮説検定の考え方全般は仮説検定の考え方と手順を、Excelでのt検定手順はExcelでt検定のやり方を種類ごとに解説を参照してください。

タイトルとURLをコピーしました