- Step1. 基礎編
- 26. 相関分析
26-4. 偏相関係数
次のデータは2015年12月末時点の各都道府県内にある映画館のスクリーンの合計数と可住地面積100当たりの薬局数を表したものです。このデータを用いて相関係数を算出すると、「0.82」でした。つまり、映画館のスクリーン数と薬局の数には強い相関があるという結果でした。
![図1](https://bellcurve.jp/statistics/wp-body/wp-content/uploads/2016/12/795316b92fc766b0181f6fef074f03fa-9.png)
出典:総務省統計局 社会生活統計指標-都道府県の指標-2015
しかし、一般的に考えて都道府県ごとの映画館のスクリーン数と可住地面積100当たりの薬局の数は直接的に関係がないような気がします。映画館のスクリーン数が多いから薬局の出店数が増えるわけでも、薬局の数が多いから映画館のスクリーン数が増えるわけでもないためです。このような場合には、「第3の因子」の存在を考慮する必要があります。
![図2](https://bellcurve.jp/statistics/wp-body/wp-content/uploads/2016/12/2b530e80c7d0de90885e285c5d798063-8.png)
上のデータに各都道府県の人口密度のデータを加えてみます。
![図3](https://bellcurve.jp/statistics/wp-body/wp-content/uploads/2016/12/c8856789ec11ab8b1013037cef6929f9-3.png)
出典:総務省統計局 社会生活統計指標-都道府県の指標-2015
人口密度と映画館のスクリーン数、及び人口密度と薬局の数の相関係数はそれぞれ「0.85」と「0.98」でした。つまり、人口密度がスクリーン数と薬局の数それぞれと強い相関を持っているため、これらの影響を除いた上で映画館のスクリーン数と薬局の数との相関関係を調べる必要があります。
![図4](https://bellcurve.jp/statistics/wp-body/wp-content/uploads/2016/12/3a4f695a458cb0ac0aceaa2eb13ac2dd-3.png)
映画館のスクリーン数と薬局の数のような相関関係のことを「見かけ上の相関」や「疑似相関」といいます。見かけ上の相関がある場合は、相関係数ではなく第3の因子の影響を除いた相関係数である「偏相関係数」を用いて相関関係を評価します。1つ目の因子をx、2つ目の因子をy、3つ目の因子をzとおき、xとyの相関係数を、yとzの相関係数を
、zとxの相関係数を
とします。これらを用いると、zの影響を除いたxとyの偏相関係数
を次の式から求められます。
![Rendered by QuickLaTeX.com \displaystyle r_{xy \cdot z}=\frac{r_{xy}-r_{xz}r_{yz}}{\sqrt{1-r_{xz}^{2}}\sqrt{1-r_{yz}^{2}}}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-c873abbbfbf1e960cb64139e47c7a8dc_l3.png)
上のデータの映画館のスクリーン数、薬局の数、人口密度をそれぞれx、y、zとおくと、相関係数はそれぞれ、
、
となるので、偏相関係数
は「-0.13」となります。
![Rendered by QuickLaTeX.com \displaystyle r_{xy \cdot z}=\frac{r_{xy}-r_{xz}r_{yz}}{\sqrt{1-r_{xz}^{2}}\sqrt{1-r_{yz}^{2}}}=\frac{0.82-0.85 \times 0.98}{\sqrt{1-0.85^{2}}\sqrt{1-0.98^{2}}}=-0.13](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-95bc7370a41d3d4ad5bde8240c2a4dbe_l3.png)
この結果から、映画館のスクリーン数と薬局の数との相関は、実はあまり強くないことが分かります。
26. 相関分析
事前に読むと理解が深まる- 学習内容が難しかった方に -
- ブログ
幾つデータが必要か? - 相関係数の有意性検定
- ブログ
相関係数を視覚化する
- ブログ
外れ値と相関係数
- ブログ
平均への回帰、相関係数
- ブログ
無相関の検定 - 相関係数の有意性を検定する