投稿

ラベル(650_==パソコン・携帯・ネット==)が付いた投稿を表示しています

都道府県別の男女人口比率、外国人人口を図化 総務省統計局データをPythonで加工 e-Stat with Python(3)

イメージ
   都道府県別に男女比率について整理・図化してみました。  まず最初に感じたことは「男性人口÷女性人口<1.0」であるという点です。昭和40年代生まれのわたし時代の教育では出生についていえば、「男の子>女の子」だったと記憶しているのですが、人口で整理すると、どの都道府県においても「男性<女性」であるということを知りました。平均寿命の関係があるのかなぁと想像しました。  どちらかというと大都市圏では、「男性人口≒女性人口」に近づくような傾向が見えますが、沖縄県はまあまあ男性人口と女性人口は近いような気がします。  北海道や青森、秋田、和歌山、高知、長崎、鹿児島などは男性人口≦女性人口×0.9で、年齢を忘れるとすれば、カップルを作るとすると男性が売り手市場になっているようです。分析ができていませんが、もしかすると平均寿命が男性に比べて、女性の方が高いのかもしれません。これは確認してみる必要がありそうです。  ちなみに一番「女性人口=男性人口」なのは、地図の色彩だけから見ると、福島県か愛知県?  次に外国人と思われる人口を図化してみます。数値的には、総人口-日本人人口で求めた数値を使っています。単位は千人なので、東京都だと500千人すなわち50万人の外国人がいるという計算です。こちらもやはり大都市圏が多くなる傾向を示しています。それはそうですよね。大都市圏の方が外国人のニーズも高いし、そもそも人口そのものも多いので、外国人も多くなりますよね。  ちなみに今回は人口一人当たりの数値はあまり意味がなさそうなので、図化しません。  今回はコードの掲載はなしにします。

都道府県別の人口密度を評価 総務省統計局データをPythonで加工 e-Stat with Python(2)

イメージ
  e-Stat APIの都道府県別、男女別、総人口・日本人別の人口データ("statsDataId": "0003448232")と国土数値情報の行政区域データを活用して、各都道府県の人口密度について図化・分析してみます。 必要なLibraryは以下のとおりです。 # Import the required libralies ! pip install geopandas import geopandas as gpd import pathlib import requests import pandas as pd import matplotlib.pyplot as plt ! pip install mapclassify import mapclassify #matplotlibで日本語を表示するためのおまじない ! pip install japanize_matplotlib import japanize_matplotlib  様々なデータを都道府県別で分析評価していく上で、日本地図を色分け表示するのがわかりやすいので、国土数値情報から都道府県地図データを読み込んで、かつ、各都道府県の概算面積を求めるために、座標系を日本測地系JGD2011のUTM(ユニバーサル横メルカトル)座標系の中日本(東経132-138)を表すzone53、すなわちEPSG6690に変換する関数を定義します。 # Import the required libralies #!pip install geopandas #import geopandas as gpd #import pathlib #都道府県別日本地図のGeoDataFrameを作成する関数japan_pref_map()を定義 # Define the function  'japana_pref_map()' which create the Japanese map including each prefecture Geo data def creat_jp_pref_map () : # Create the data saving directory #    NOTEBOOK_PATH = pathlib.P

総務省統計局データをPythonで加工 e-Stat with Python(1)

イメージ
   政府統計の総合窓口e-StatのデータをAPI(Aplication Programing Interface)を利用して、DownLoad and Plotに挑戦します。冒頭の日本地図は全人口に占める各都道府県の人口の比率(割合)を示したグラフです。  参考にさせていただいたWEBPageは以下のとおりです。   URL:https://note.com/kiyo_ai_note/n/nac8c77768c07   (Kiyo-noteさんのPythonでやってみた12:APIで統計情報取得(e-Stat))  こうしてみると、東京都に日本人口の10%程度が集中し、関東圏の都道府県と大阪は5から7%程度、北海道も比較的高め、同等程度で愛知、神戸、福岡が並び、その他の都道府県は軒並み4%程度以下というか、大部分が2%程度以下であるという印象です。  グラフ化までのPythonコードを掲載します。 1.e-StatAPIから統計データを入手  e-StatAPIの使用には事前のユーザー登録と、ユーザー登録したらいただけるAPP_IDが必要になります。詳細は参考URLで親切に説明してくれています。  まず、e-Stat_APIから人口推計-総務省-都道府県別人口の割合(総人口)を読み込みます。当該データのe-StatDataIDは0003448233です。言語は日本語、最新データである2021年をcdTimeで指定します。  API_URLはe-Stat_APIの統計データが格納されているURLをネットで調べました。  request.get()メソッドを利用して、responseにデータを格納し、さらにresponseを.json()メソッドでjson形式にして変数dataに格納します。そして、このjson形式のdataにdictionary形式で格納されている ['GET_STATS_DATA' ][ 'STATISTICAL_DATA' ][ 'DATA_INF' ][ 'VALUE' ] のデータをpandasのDataFrameに変換して変数dfに格納します。  次に、rename()を使用してDataFrame'df'のColumn_nameを識別しやすい名称に置き換えます