前回リリースしたecon_jpのなかに、econ_kyotoを作成しました。econ_kyotoは京都府と京都市のオープンデータサイトにあるデータを、pandasのデータフレームで呼び出してくれるPythonパッケージです。

ソースはいつも通り github のリポジトリにございます。
利用方法
インストールは前回と同じで、呼び出し方がちょっと変わります。「ちょっとよさそ」と思ったら、スターをぽちっとしていただけると嬉しいです!
$ pip install econ_jp
$ from econ_jp import econ_kyoto
$ df = econ_kyoto.kyotofu_jinko()
データの内容と呼び出し方
今回のリリースには次の8個のデータが含まれます。
- 京都府の人口データ econ_kyoto.kyotofu_jinko()
- 京都府の人口動態 econ_kyoto.kyoto_jinko_doutai()
- 京都市の利用施設データ econ_kyoto.koytoshi_riyosho_ichiran()
- 京都市の美容施設データ econ_kyoto.kyotoshi_biyosho_ichiran()
- 京都市のクリーニング施設データ econ_kyoto.kyotoshi_cleaning_ichiran()
- 京都市の食品営業許可データ econ_kyoto.kyotoshi_shokuhin_eigyo_ichiran()
- 京都市の旅館データ econ_kyoto.kyotoshi_hotels()
- 京都市の避難所データ econ_kyoto.hinanjo()
今回のデータは3万件超のデータもあるので、読み込みに時間がかかることがあります(食品営業許可データがそれ)。
利用事例
たとえば、避難所データを地図上にプロットしたい場合、次のようなコードでできます。
from econ_jp import econ_kyoto
import plotly.express as px
df = econ_kyoto.kyotoshi_hinanjo()
fig = px.scatter_mapbox(
df, lat='北緯', lon='東経', hover_name='施設名', size='収容\n人員', color='収容\n人員',
zoom=10, mapbox_style= 'satellite-streets', title='京都市避難所マップ', height=800
)
fig.show()
まとめ
京都のオープンデータを簡単に使えるPythonパッケージ econ_kyotoを作成しました。
このパッケージを使って、6月の長目のセミナーはデータ可視化のイベントを開催します。データ可視化の重要性は、データを扱いだすとわかるのですが、案外軽視されがちです。例えば、データにミスがありそうかは、折れ線グラフで可視化するだけで分かります。次のチャートのデータは2008年あたりで集計ミスがありそうですね。
オープンデータを使う際、あれってどこにあったかな?と考えたり検索する時間が多いなぁと思っていました。その辺りをこのツールで埋められると感じています。あと、オープンデータはエクセルファイルも多かったりします。私のマックにはエクセルが入っていないので、見るのが面倒だったりします。その辺りもこのツールで解決できるのがうれしいなと思っています。あと、若干ですが前処理とかも行っているので、そのまま扱うよりも扱いやすくなっているように思います。
今後は、ドキュメントを書くのを頑張る!!!その前に、コード設計の見直しを考えています。今はシンプルに一指標、一関数となっているのですが、メンテナンスがやり難い感じがします。
エクセルのリンクは毎月変更されたりするので、その辺りの修正が現状だとミスがおこりそうでこわい。これをクラスにしてもうちょっとうまくできたらなぁとも思ったり、色々しています。
というわけで、その辺りの設計も含めていろいろ工夫していきたい次第です。