
データは世の中にたくさんありますが、そのまま調査・分析に活用できるデータはほとんどありません。多くの人がもっと多くの時間を割くのが、データの前処理です。
長目では、簡単にオープンデータを使えるPythonパッケージ、econ_jpをリリースしました。Pythonを使えるという条件がありますが、次の3つのデータをpandasのDataFrameで返すものとなります。
- 家計調査 2人以上家計、2000年からの支出額(小分類)
- 貿易収支: 1979年からの月次推移
- 日銀 マネタリーベース 1970年からの月次推移
econ_jpは、MITライセンスでどなたでも使っていただけます。
使い方
使い方は簡単です。サンプルコードのコラボはリンク先にあります。まずは、pipでインストールします。
$ pip install econ_jp
家計調査
家計調査のデータを使いたい場合は、次のようにすると前処理した後のデータが取得できます。
from econ_jp import econ_jp
kakei_chosa = econ_jp.kakei_chosa()
家計調査のデータは、インデックスが5行のマルチ・インデックスになっています。シングル・インデックが良い場合、kakei_chosa関数の引数multi_indexにFalseを渡すと、シングル・インデックスのデータが返されます。
single_kakei = econ_jp.kakei_chosa(multi_index=False)
返されるデータは次のようになります。(左: マルチ・インデックス 右:シングル・インデックス)


貿易収支
貿易収支は次のようにデータが取得できます。
boueki = econ_jp.boueki_total_monthly()
データ項目のtrade_balance(貿易収支)は、長目が輸出額から輸入額を引いた額から計算しています。
マネタリーベース
マネタリーベースは次のようにデータが取得できます。
mb = econ_jp.boj_monetary_base()
保存や可視化も容易
データを保存してローカルで使いたい場合は、pandasのデータフレームなので、to_csvなどを使って容易に利用できます。
plotly.expressでの可視化も下のような感じで容易です。下はマネタリーベースです。
mb.to_csv('mb.csv')
df = pd.read_csv('mb.csv', index_col=0)
px.line(mb, x=mb.index, y='マネタリーベース', title='マネタリーベース')
まとめ
以上のように、前処理無しで経済データを使える econ_jp パッケージを取り上げました。
オープンデータを使いたいけど、前処理が必要だったり、APIだとIDやパスワード、また指標IDまでもが必要になって使えないということを聞き、誰でもデータを簡単に使えるものを作成してみました。
今後は使えるデータを増やしていこうと思ってますので、使いたいデータがございましたら、是非「お問い合わせ」より教えてください。また、OSSとして開発していますので、開発のご協力も大歓迎です。