前処理無しに経済データを使えるPythonパッケージ econ_jp をリリースしました
前処理無しに経済データを使えるPythonパッケージ econ_jp をリリースしました

前処理無しに経済データを使えるPythonパッケージ econ_jp をリリースしました

econ_jp

データは世の中にたくさんありますが、そのまま調査・分析に活用できるデータはほとんどありません。多くの人がもっと多くの時間を割くのが、データの前処理です。

長目では、簡単にオープンデータを使えるPythonパッケージ、econ_jpをリリースしました。Pythonを使えるという条件がありますが、次の3つのデータをpandasのDataFrameで返すものとなります。

  • 家計調査 2人以上家計、2000年からの支出額(小分類)
  • 貿易収支: 1979年からの月次推移
  • 日銀 マネタリーベース 1970年からの月次推移

econ_jpは、MITライセンスでどなたでも使っていただけます。

使い方

使い方は簡単です。サンプルコードのコラボはリンク先にあります。まずは、pipでインストールします。

$ pip install econ_jp

家計調査

家計調査のデータを使いたい場合は、次のようにすると前処理した後のデータが取得できます。

from econ_jp import econ_jp
kakei_chosa = econ_jp.kakei_chosa()

家計調査のデータは、インデックスが5行のマルチ・インデックスになっています。シングル・インデックが良い場合、kakei_chosa関数の引数multi_indexにFalseを渡すと、シングル・インデックスのデータが返されます。

single_kakei = econ_jp.kakei_chosa(multi_index=False)

返されるデータは次のようになります。(左: マルチ・インデックス 右:シングル・インデックス)

マルチ・インデックス
シングル・インデックス

貿易収支

貿易収支は次のようにデータが取得できます。

boueki = econ_jp.boueki_total_monthly()

データ項目のtrade_balance(貿易収支)は、長目が輸出額から輸入額を引いた額から計算しています。

マネタリーベース

マネタリーベースは次のようにデータが取得できます。

mb = econ_jp.boj_monetary_base()

保存や可視化も容易

データを保存してローカルで使いたい場合は、pandasのデータフレームなので、to_csvなどを使って容易に利用できます。

plotly.expressでの可視化も下のような感じで容易です。下はマネタリーベースです。

mb.to_csv('mb.csv')
df = pd.read_csv('mb.csv', index_col=0)
px.line(mb, x=mb.index, y='マネタリーベース', title='マネタリーベース')

まとめ

以上のように、前処理無しで経済データを使える econ_jp パッケージを取り上げました。

オープンデータを使いたいけど、前処理が必要だったり、APIだとIDやパスワード、また指標IDまでもが必要になって使えないということを聞き、誰でもデータを簡単に使えるものを作成してみました。

今後は使えるデータを増やしていこうと思ってますので、使いたいデータがございましたら、是非「お問い合わせ」より教えてください。また、OSSとして開発していますので、開発のご協力も大歓迎です。

github econ_jp

2 Comments

  1. malo21st

    econ_jp便利に使わせて頂いています。
    一つ質問があるのですが、データの更新タイミングを教えて頂けないでしょうか。

    1. hideyuki ogawa

      ご質問ありがとうございます。

      データの更新ですが、各データごとのタイミングというのが、解答になります。
      というわけで、把握できていないというのが現状です。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です