BellCurve 統計WEB

最大55万円の給付金還付
未経験からデータ分析が学べる

ブログ


統計検定2級CBT公式問題集の解説(確率分布の分野)

2023/08/12

カテゴリ:

※統計検定2級 解説記事一覧はこちら


下記のリンクからそれぞれの問題の解説に飛ぶことができます。

問1

確率密度関数は、連続型確率変数 X に対して確率を得るための関数を f(X) で表したもので、次の式が成り立ちます。

 \displaystyle \int_{-{\infty}}^{\infty} f(x)dx = 1, \hspace{20px} f(x) \geq 0

また、Xa から b までの値を取るとき、その確率は次のように計算できます。

 \displaystyle P(a \leq x \leq b) = \int_a^b f(x)dx

問題文の確率密度関数に対して1つ目の式を用いると、

     \begin{eqnarray*} \displaystyle \int_{-{\infty}}^{\infty} f(x)dx &=& \int_{-{\infty}}^{0} 0dx + \int_{0}^{20} a\left(1-\frac{x}{20} \right)dx + \int_{20}^{\infty} 0dx \\ &=& \int_{0}^{20} a\left(1-\frac{x}{20} \right)dx \\ &=& 1 \end{eqnarray*}

となります。この式を整理すると

     \begin{eqnarray*} \displaystyle \int_{0}^{20} a\left(1-\frac{x}{20} \right)dx &=& a \left[x-\frac{1}{2} \times \frac{x^2}{20}\right]^{20}_0 \\ &=& a \left[x-\frac{x^2}{40}\right]^{20}_0 \\ &=& a(20-10) \\ &=& 10a \\ &=& 1 \end{eqnarray*}

となります。これを解くと、\displaystyle a=\frac{1}{10} となります。

問2

まず、-1と4を標準化します。ある確率変数 X が平均 \mu、分散 \sigma^2 の正規分布に従う時、X から平均 \mu を引いて \sqrt{\sigma^2} で割った値を z とおくと、この z は「平均が0、分散が1の標準正規分布」に従います。標準化を行うことにより、単位や平均値などが異なるデータ同士の大小を「標準正規分布表」を使って比較できるようになります。

−1を標準化すると

 \displaystyle \frac{-1-2}{\sqrt{9}} = -1

となります。4を標準化すると

 \displaystyle \frac{4-2}{\sqrt{9}} = \frac{2}{3} = 0.67

となります。これらの結果から、

 \displaystyle P(-1 < X \leq 4) = P(-1 < X \leq 0.67)

となります。

P(-1 < X) = 1 - P(X < -1) = 1 - P(X > 1) であることから、標準正規分布表より P(X > 1) となる確率は0.16であり、P(-1 < X) = 1 - 1.6 = 0.84 となります。

また、標準正規分布表より P(X > 0.67) となる確率は0.25です。

したがって、P(-1 < X \leq 0.67) = 0.84 - 0.25 = 0.59 となります。


データの標準化の詳細については「14-3. 標準化したデータの使い方」をご覧ください。

問3

確率密度関数 f(x) から期待値 E(X) を計算する場合には、次の式を使います。

 \displaystyle E(X) = \int_{-\infty}^{\infty} xf(x)dx

問題文の値を用いて計算すると

     \begin{eqnarray*} \displaystyle E(X) &=& \int_{-\infty}^{\infty} xf(x)dx \\ &=&\int_{0}^{10} 1000 \times \frac{1}{10}\left(1-\frac{x}{20} \right) dx + \int_{10}^{15} 1120 \times \frac{1}{10}\left(1-\frac{x}{20} \right) dx \\ &+& \int_{15}^{20} 1280 \times \frac{1}{10}\left(1-\frac{x}{20} \right) dx \\ &=&\int_{0}^{10} 100 \times \left(1-\frac{x}{20} \right) dx + \int_{10}^{15} 112 \times \left(1-\frac{x}{20} \right) dx \\ &+& \int_{15}^{20} 128 \times \left(1-\frac{x}{20} \right) dx \\ &=& \left[100 \times \left(x-\frac{x^2}{40} \right)\right]^{10}_{0} + \left[112 \times \left(x-\frac{x^2}{40}\right) \right]^{15}_{10} \\ &+& \left[128 \times \left(x-\frac{x^2}{40}\right) \right]^{20}_{15} \\ &=& 100 \times (10-2.5) + 112 \times (15-5.6-(10-2.5)) \\ &+& 128 \times (20-10-(15-5.6)) \\ &=& 750 + 212.8 + 76.8 \\ &=& 1040 \\ \end{eqnarray*}

となります。


確率密度関数の期待値の詳細については「12-3. 確率変数の期待値」をご覧ください。

問4

成功確率が p である試行を n 回行うときに成功する回数 X が従う確率分布である二項分布では、n が十分に大きい場合には、次の式から得られる Z が標準正規分布に従います。\hat{p} は標本比率を表します。

 \displaystyle Z=\frac{\hat{p}-p}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}}

問題文の値を使うと

 \displaystyle P(|\hat{p} - p| \leq 0.1)
 \displaystyle P(-0.1 \leq \hat{p} - p \leq 0.1)
 \displaystyle P\left( \frac{-0.1}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}} \leq \frac{\hat{p}-p}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}} \leq \frac{0.1}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}} \right)

となります。問題文より、

 \displaystyle \hat{p} = \frac{54}{100} = 0.54

であることから、

 \displaystyle \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} = \sqrt{\frac{0.54(1-0.54)}{100}} = 0.05

となります。この値を使うと、

 \displaystyle P\left( \frac{-0.1}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}} \leq \frac{\hat{p}-p}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}} \leq \frac{0.1}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}} \right)
 \displaystyle P\left( \frac{-0.1}{0.05} \leq \frac{\hat{p}-p}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}} \leq \frac{0.1}{0.05} \right)
 \displaystyle P\left( -2 \leq \frac{\hat{p}-p}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}} \leq 2 \right)

標準正規分布表より P(X > 2) となる確率は0.0228であることから、求める確率は1- 2 \times 0.0228 = 0.95 \fallingdotseq 0.96 となります。


二項分布の正規近似の詳細については「21-1. 母比率の信頼区間の求め方1」をご覧ください。

問5

n 回のベルヌーイ試行を行うときに成功する回数 X がちょうど x 回となる確率、すなわち X=x となる確率は次の式から計算することができます。

     \begin{eqnarray*} P(X=x) &=& {}_{n} \mathrm{C}_{x}  p^{x} (1-p)^{n-x}\\ &=& \frac{n!}{x!(n-x)!} p^{x} (1-p)^{n-x} \end{eqnarray*}

一方、 X=x+1 となる確率は次の式から計算することができます。

     \begin{eqnarray*} P(X=x+1) &=& {}_{n} \mathrm{C}_{x+1}  p^{x+1} (1-p)^{n-(x+1)} \\ &=& \frac{n!}{(x+1)!(n-(x+1))!} p^{x+1} (1-p)^{n-(x+1)} \end{eqnarray*}

したがって、

     \begin{eqnarray*} \displaystyle \frac{P(X=x+1)}{P(X=x)} &=& \frac{\frac{n!}{(x+1)!(n-(x+1))!} p^{x+1} (1-p)^{n-(x+1)}}{\frac{n!}{x!(n-x)!} p^{x} (1-p)^{n-x}} \\ &=& \frac{\frac{n!}{(x+1) \cdot x!(n-x-1)!} p \cdot p^{x} (1-p)^{n-x-1}}{\frac{n!}{x!(n-x)(n-x-1)!} p^{x} (1-p) \cdot (1-p)^{n-x-1}} \\ &=& \frac{\frac{1}{(x+1)} p}{\frac{1}{(n-x)} (1-p)} \\ &=& \frac{(n-x)p}{(x+1)(1-p)} \\ \end{eqnarray*}

問題文より、n=7\displaystyle p = \frac{2}{6} = \frac{1}{3} であることから

 \begin{eqnarray*} \displaystyle \frac{(n-x)p}{(x+1)(1-p)} &=& \frac{(7-x)\times \frac{1}{3}}{(x+1)(1-\frac{1}{3})} \\ &=& \frac{(7-x) \times \frac{1}{3}}{(x+1) \times \frac{2}{3}} \\ &=& \frac{(7-x)}{2(x+1)} \\  &=& \frac{(-x+7)}{2x+2}

となります。


二項分布の詳細については「13-1. 二項分布」をご覧ください。

問6

I:×
歪度は、「右裾が長い」もしくは「右に歪んだ」もしくは「左に偏った」分布のときには正の値を、「左裾が長い」もしくは「左に歪んだ」もしくは「右に偏った」分布のときには負の値をとります。

II:×
尖度は、正規分布より尖った分布(データが平均付近に集中し、分布の裾が重い)のときには正の値を、正規分布より扁平な分布(データが平均付近から散らばり、分布の裾が軽い)のときには負の値をとります。

III:×
t分布は自由度が大きくなるほど正規分布に近づきます。正規分布の場合には尖度0になることから、t分布の自由度が大きくなるほど尖度の絶対値は小さくなります。


歪度と尖度の詳細については「3-5. 歪度と尖度」をご覧ください。

問7

ある年の6月における電気料金 X と前年の6月における電気料金 Y との差を考えます。X および Y はそれぞれ独立で同一の正規分布で近似されます。したがって、

 \displaystyle E(X-Y) = E(X) - E(Y)
 \displaystyle V(X-Y) = V(X) + V(Y)

問題文より、

 \displaystyle E(X-Y) = E(X) - E(Y) = 4000 - 4000 = 0
 \displaystyle V(X-Y) = V(X) + V(Y) = 500^2 + 500^2 = 2\times 500^2

となります。求める確率は P(X-Y) \geq 800 です。標準化を行うと

 \displaystyle P(X-Y) \geq 800
 \displaystyle P \left( \frac{(X-Y)-0}{\sqrt{2\times 500^2}} \right) \geq \frac{800-0}{2\times 500^2}
 \displaystyle P \left( \frac{(X-Y)-0}{\sqrt{2\times 500^2}} \right) \geq \frac{800-0}{2\times 500^2} = 1.13

標準正規分布表を見ると、 \displaystyle P(Z \geq 1.13) となる確率は0.129です。したがって、P(X-Y) \geq 800 となる確率は0.129となります。


2変数の期待値と分散の詳細については「15-6. 2変数の期待値と分散」をご覧ください。

問8

2つの確率変数 XY の共分散 Cov(X,Y) と相関係数 r_{XY} は次の式から計算できます。

 \displaystyle Cov(X,Y) = E[XY] - E[X]E[Y]
 \displaystyle r_{XY} = \frac{Cov(X,Y)}{\sqrt{V[X]V[Y]}}

問題文の値を用いて計算すると

 \displaystyle Cov(X,Y) = 6.3 - 2.0 \times 3.0 = 0.3
 \displaystyle r_{XY} = \frac{Cov(X,Y)}{\sqrt{V[X]V[Y]}} = \frac{0.3}{\sqrt{1.0 \times 1.0}} = 0.3

となります。次に、UV について期待値、分散を計算します。

 \displaystyle E[U] = E[3X-2] = 3E[X] - E[2] = 3 \times 2.0 - 2 = 4
 \displaystyle E[V] = E[-2Y-4] = -2E[Y] - E[4] = -2 \times 3.0 - 4 = -10

     \begin{eqnarray*} \displaystyle E[UV] &=& E[(3X-2)(-2Y-4)] \\ &=& E[-6XY-12X+4Y+8] \\ &=& -6E[XY] -12E[X] + 4[Y] + E[8] \\ &=& -6 \times 6.3 -12 \times 2.0 + 4 \times 3.0 + 8 \\ &=& -41.8 \end{eqnarray*}

 \displaystyle V[U] = V[3X-2] = 3^2 \times V[X] - V[2] = 9 \times 1.0 - 0 = 9
 \displaystyle V[V] = V[-2Y-4] = (-2)^2 \times V[Y] - V[4] = 4 \times 1.0 - 0 = 4

したがってこれらの値を用いると、共分散 Cov(U,V)、相関係数 r_{UV}

 \displaystyle Cov(U,V) = E[UV] - E[U]E[V] = -41.8 - 4 \times (-10) = -1.8
 \displaystyle r_{UV} = \frac{Cov(U,V)}{\sqrt{V[U]V[V]}} = \frac{-1.8}{\sqrt{9 \times 4}} = \fraq{-1.8}{6} = -0.3

となります。


2変数の期待値と分散の詳細については「15-6. 2変数の期待値と分散」をご覧ください。



統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]


統計WEBを運営するBellCurveは、統計解析ソフト「エクセル統計」を開発・販売しています! 統計解析ソフト「エクセル統計」をインストール後のExcel上のタブとメニュー エクセル統計ジャケット画像


【BellCurve監修】統計検定®2級対策に最適な模擬問題集1~3を各500円(税込)にて販売中!

Kindleストアで配信中

統計検定®2級 模擬問題集1

500円(税込)

統計検定®2級 模擬問題集2

500円(税込)

統計検定®2級 模擬問題集3

500円(税込)