在留外国人の国別人口と日本までの距離に相関はあるのか?
2024/12/25
カテゴリ:エクセル統計
私の住む地域では外国からの移住者がおおく、駅前ではもはや日本語で話している人がいないこともしばしばです。日本に住む外国人の人数や国籍について気になったので、在留外国人の国別人口と各国の日本までの距離についてBellCurveの統計解析ソフト「エクセル統計」で分析してみました。
以下は、198か国の在留外国人の人数のデータに日本までの距離を加えたものです。Excel上のデータなので、このままエクセル統計で分析できます。
出典:
在留外国人統計(旧登録外国人統計)
りに帳(日本の東京から世界各国の首都までの距離一覧)
散布図
まず、エクセル統計の「散布図 - ラベル付き・層別」を使って散布図を作成してみました。
このようにほとんどの国の表示が重なってみえなくなってしまいました。この散布図はExcelのグラフ機能で出力されているので、出力後にカスタマイズできます。今回は、軸の書式設定において、チェックボックス[対数目盛を表示する]をオンにしてみます。
すると以下のとおり、データの重なりが軽減されて見やすくなると同時に、層別の動向も見えてきました。今回は上位30か国のみラベル付けしました。このグラフを見ると、ほとんどの国が在留人口1万人以下であることが一目でわかります。
相関係数
続いて、エクセル統計の「相関行列と偏相関行列」を使って、相関係数と無相関の検定を出力してみました。
出力された相関係数は「-0.3065」と決して高いとは言えなさそうです。それでもサンプルサイズが198あるので、無相関の検定ではP値が「P<0.001」と出力されました。もし有意水準を1%に設定していたとしたら、「母相関係数は0とは言えない」、すなわち「相関がないとは言えない」と言えます。
一元配置分散分析
次に、データを地域で分類してエクセル統計の「一元配置分散分析」を実行しました。
以下は出力された平均値グラフです。これを見ると、アジアのデータのばらつきが他と比べて大きいことがよくわかります。一方、オセアニア、アフリカ、ヨーロッパに関してはばらつきが小さくなっています。
さらに多重比較検定の結果も出力しました。
アジアと北アメリカ、アジアとヨーロッパ、アジアとアフリカの間では有意水準5%で人数の平均値に差が認められる結果になりました。
感想
在留外国人の人数は、日本に近いアジアが多いですが、その他の地域からではブラジルやペルー、米国も多いようです。そういった点ではある程度地域がばらけているようで、人数と距離との相関係数はあまり高くありませんでした。
今回は出力していませんが、ドットプロットや箱ひげ図で地域ごとの違いを確認することも考えられます。このデータをダウンロードして、エクセル統計の体験版で分析してみてください。
ダウンロード
このブログで使用したデータファイルのダウンロードはこちらから → ex_foreigners.xlsx