母平均の区間推定における必要なサンプルサイズの計算フォーム

2017/12/19

カテゴリ：Tips

これから集めるサンプルにおける何らかの測定値の平均値が、母集団のそれとあまり変わらないようにしたい場合、サンプルの平均値がある程度の誤差範囲内で収まるために必要なサンプルサイズを、誤差、信頼度、標準偏差を指定することで求めることができます。

入力には半角数字を用いて、それぞれの範囲内の値で指定してください。入力した値によっては計算に時間がかかる場合があります。その場合はブラウザの「読み込み中止」を選択してください。ページ最下部にあるExcel ファイルでも同じ計算を実行することができますので、ダウンロードしてお試しください。 → ダウンロードへ移動する

誤差（ $\delta$ ：デルタ）

母平均に対するサンプル平均が、上下にどの程度の範囲内に収まって欲しいかを表します。

信頼度（ $1- \alpha$ ）

例えば、誤差を5、信頼度を90％としたとき、これは100回中90回はサンプル平均と母平均との差が±5の範囲内に収まることを意味します。

標準偏差（ $\sigma$ ：シグマ）

今、母集団の分散はわかりませんが、母集団の分散がわからないからと言ってその値を設定せずにサンプルサイズを設計することはできません。標準偏差の値は、予備調査のデータや過去に行われた類似調査のデータ、または何らかの情報に基づく予測値を用います。

サンプルサイズ

母分散がわからない場合の母平均の区間推定は以下の式で行われます。

$\displaystyle \bar{x} - t_{(n-1, \alpha)} \sqrt{\frac{V}{n}} \leq \mu \leq \bar{x} + t_{(n-1, \alpha)} \sqrt{\frac{V}{n}}$

ここで、 $\mu$ （ミュー）は母平均、 $\bar{x}$ はサンプル平均、 $\alpha$ は1−信頼度、 $n$ はサンプルサイズ、 $V$ は不偏分散、 $t_{(n-1, P)}$ は自由度 $n-1$ のt分布の両側100P％点を表します。

このとき区間幅は

$\displaystyle 2t_{(n-1, \alpha)} \sqrt{\frac{V}{n}}$

であり、この式には確率変数 $V$ が含まれていることから、区間幅の期待値が一定値 $2 \delta$ 以下となるようにサンプルサイズを設計します。

(1) $\begin{equation*} \displaystyle 2t_{(n-1, \alpha)} \frac{E\left( \sqrt{V} \right)}{\sqrt{n}} \leq 2 \delta \end{equation*}$

ここで、不偏分散の平方根の期待値は、

$\displaystyle E \left( \sqrt{V} \right) = c^{\ast} \sigma \hspace{5mm} \left( c^{\ast} = \frac{\sqrt{2} \Gamma \left( \frac{\phi +1}{2} \right)}{\sqrt{\phi} \Gamma \left( \frac{\phi}{2} \right)} \right)$