BellCurve 統計WEB

ブログ

母平均の区間推定における必要なサンプルサイズの計算フォーム

2017/12/19

カテゴリ:

これから集めるサンプルにおける何らかの測定値の平均値が、母集団のそれとあまり変わらないようにしたい場合、 サンプルの平均値がある程度の誤差範囲内で収まるために必要なサンプルサイズを、誤差、信頼度、標準偏差を指定することで求めることができます。

入力には半角数字を用いて、それぞれの範囲内の値で指定してください。入力した値によっては計算に時間がかかる場合があります。その場合はブラウザの「読み込み中止」を選択してください。ページ最下部にあるExcel ファイルでも同じ計算を実行することができますので、ダウンロードしてお試しください。 → ダウンロードへ移動する

誤差(0 < 範囲 < ∞)
信頼度(90 ≤ 範囲 < 100)
標準偏差(0 < 範囲 < ∞)
サンプルサイズ

誤差(\delta:デルタ)

母平均に対するサンプル平均が、上下にどの程度の範囲内に収まって欲しいかを表します。

信頼度(1- \alpha

例えば、誤差を5、信頼度を90%としたとき、これは100回中90回は サンプル平均と母平均との差が±5の範囲内に収まることを意味します。

標準偏差(\sigma:シグマ)

今、母集団の分散はわかりませんが、母集団の分散がわからないからと言ってその値を設定せずに サンプルサイズを設計することはできません。 標準偏差の値は、予備調査のデータや過去に行われた類似調査のデータ、 または何らかの情報に基づく予測値を用います。

サンプルサイズ

母分散がわからない場合の母平均の区間推定は以下の式で行われます。

 \displaystyle  \bar{x} - t_{(n-1, \alpha)} \sqrt{\frac{V}{n}} \leq \mu \leq \bar{x} + t_{(n-1, \alpha)} \sqrt{\frac{V}{n}}

ここで、\mu(ミュー)は母平均、\bar{x}はサンプル平均、 \alphaは1−信頼度、nはサンプルサイズ、V不偏分散t_{(n-1, P)}は自由度n-1t分布の両側100P%点を表します。

このとき区間幅は

 \displaystyle 2t_{(n-1, \alpha)} \sqrt{\frac{V}{n}}

であり、この式には確率変数 Vが含まれていることから、 区間幅の期待値が一定値2 \delta以下となるようにサンプルサイズを設計します。

(1)    \begin{equation*} \displaystyle 2t_{(n-1, \alpha)} \frac{E\left( \sqrt{V} \right)}{\sqrt{n}} \leq 2 \delta \end{equation*}

ここで、不偏分散の平方根の期待値は、

 \displaystyle E \left( \sqrt{V} \right) = c^{\ast} \sigma \hspace{5mm} \left( c^{\ast} = \frac{\sqrt{2} \Gamma \left( \frac{\phi +1}{2} \right)}{\sqrt{\phi} \Gamma \left( \frac{\phi}{2} \right)}  \right)

と変形することができます(参考文献を参照)。 \sigmaは母標準偏差、\Gamma ( \cdot )ガンマ関数で、このとき\phi(ファイ)は\phi = n-1です。

これを(1)式に戻し、さらにフォームに入力した標準偏差\sigma_0を用いて\sigma = \sigma_0とすると、

(2)    \setcounter{equation*}{1} \begin{equation*} \displaystyle t_{(n-1,\alpha)} \frac{c^{\ast} \sigma_0}{\sqrt{n}} \leq \delta \end{equation*}

となります。ここで

 \displaystyle t_{(n-1, \alpha)} \approx z_{\frac{\alpha}{2}} , \hspace{5mm} c^{\ast} \sigma_0 \approx \sigma_0

とおきます。z_pは標準正規分布の上側100P%点です。 これを用いて(2)式をnについて解くと、

 \displaystyle n \geq \left( z_\frac{\alpha}{2} \frac{\sigma_0}{\delta} \right)^2

となります。この式の右辺を初期値としてnを1ずつ大きくしていき、(2)式を満たす最小のnが必要なサンプルサイズとなります。

誤差を変化させたときのサンプルサイズの変化

誤差を変化させたときのサンプルサイズの変化

信頼度と標準偏差の値を固定して誤差の値を変化させてみると、上のグラフのように誤差を小さくするほど必要なサンプルサイズが増えることが見て取れます。

信頼度を変化させたときのサンプルサイズの変化

信頼度を変化させたときのサンプルサイズの変化

誤差と標準偏差の値を固定して信頼度の値を変化させてみると、 上のグラフのように信頼度を高くするほど必要なサンプルサイズが増えることが見て取れます。

標準偏差を変化させたときのサンプルサイズの変化

標準偏差を変化させたときのサンプルサイズの変化

誤差と信頼度の値を固定して標準偏差の値を変化させてみると、 上のグラフのように標準偏差を大きくするほど必要なサンプルサイズが増えることが見て取れます。

ダウンロード

この統計TipのExcelファイルのダウンロードはこちらから →  tips_16.xlsm

※ このファイルはサンプルサイズを計算するためのマクロを含んでいます。

参考文献

関連記事

エクセル統計