総務省統計局データをPythonで加工 e-Stat with Python(1)
政府統計の総合窓口e-StatのデータをAPI(Aplication Programing Interface)を利用して、DownLoad and Plotに挑戦します。冒頭の日本地図は全人口に占める各都道府県の人口の比率(割合)を示したグラフです。 参考にさせていただいたWEBPageは以下のとおりです。 URL:https://note.com/kiyo_ai_note/n/nac8c77768c07 (Kiyo-noteさんのPythonでやってみた12:APIで統計情報取得(e-Stat)) こうしてみると、東京都に日本人口の10%程度が集中し、関東圏の都道府県と大阪は5から7%程度、北海道も比較的高め、同等程度で愛知、神戸、福岡が並び、その他の都道府県は軒並み4%程度以下というか、大部分が2%程度以下であるという印象です。 グラフ化までのPythonコードを掲載します。 1.e-StatAPIから統計データを入手 e-StatAPIの使用には事前のユーザー登録と、ユーザー登録したらいただけるAPP_IDが必要になります。詳細は参考URLで親切に説明してくれています。 まず、e-Stat_APIから人口推計-総務省-都道府県別人口の割合(総人口)を読み込みます。当該データのe-StatDataIDは0003448233です。言語は日本語、最新データである2021年をcdTimeで指定します。 API_URLはe-Stat_APIの統計データが格納されているURLをネットで調べました。 request.get()メソッドを利用して、responseにデータを格納し、さらにresponseを.json()メソッドでjson形式にして変数dataに格納します。そして、このjson形式のdataにdictionary形式で格納されている ['GET_STATS_DATA' ][ 'STATISTICAL_DATA' ][ 'DATA_INF' ][ 'VALUE' ] のデータをpandasのDataFrameに変換して変数dfに格納します。 次に、rename()を使用してDataFrame'df'のColumn_nameを識別しやすい名称に置き換えます