
毎月第3水曜日は「長目のイベントデー」です。今回はPythonを使って家計調査のデータを整形し、ちょっくら中身を調べてみるというイベントでした。
概要
「データを活用する」ことを考えると、社内データと社外データを使う必要が出てきます。
社内データがDXなどで整い「これで勝てる」と思った瞬間、外部環境が変化してそれまでのビジネスモデルがうまく立ち行かなくなる。しかし、変化に気付けずそのまま倒れてしまう・・・。
なんてことは、社内データが変化しているのであり得ないと思いがちですが、その前に外部環境に目を向けておいたほうがよい。
ということで、長目では外部環境の観察にオープンデータの利用をお薦めしています。
今回は、その中でもイチオシの家計調査の支出データを扱いました。
家計調査の支出データのよさ
家計調査の支出データの良さは次の2点です。
- 最終消費者の動向の変化が掴める
- それが具体的な品目までわかる
POSデータの分析などを行なっている企業であれば、その辺りリアルタイムに取れるわけですが、購入していない企業でもさまざまな項目について動向が掴める、また人々のお小遣いの動向などまで追えるというのも面白い点です。
多くの品目分類があるから多くのアイデアを生み出せる
当日ご確認いただいたように、多くの品目があるため、さまざまなアイデアが出せます。企業の場合、アイリスオオヤマでない限り、対象としている業界や商品は少なく、ゆえに視野が狭くなりがちです。
家計調査のデータを使うことにより視野を広げ、新たなアイデアを生み出すこともできます。
しかし、データが取りにくい
そのような素晴らしいデータがあるのですが、取得しづらい面があります。というのは、ESTATはAPIのIDとパスワードが必要で、一般の方にはハードルが高い。このデータは親切にもサイトにCSVファイルで置かれているのですが、日付がぐちゃぐちゃだったりして使いにくい。
ということで、今回のイベントではそのような使いにくいデータをPythonでどのように処理するかを扱いました。
当日は次のようなステップを実践しました。
- pandasでデータを使いやすい形に整形
- plotly.expressでグラフ作成
- statsmodelsで季節調整
これだけでも結構データを見て状況を掴めるということをご理解いただけたかと思います。当日の資料は、長目のセミナーページにてご覧いただけます。
econ_jp
というわけで、Pythonを使ってどのように、データを使いやすくして、状況を掴むかということをハンズオンさせていただきました。
でも、整形面倒だよね。ということで、長目では、データを簡単に使えるPythonライブラリ、econ_jpを作成いたしました。pipを使って簡単にインストールできます。使い方は次のブログ記事を参照ください。
https://chomoku.com/2022/05/13/econ_jp/
econ_jpですが、コロナの感染者数のデータも取れるようになりました。コロナと業績のデータを作るとかいう課題もこれで簡単に解決できますね!
まとめ
以上、5月の長目のセミナーをまとめました。
6月は、グラフを作る部分を扱うハンズオンを行います。よろしければご参加ください。
4月はTwitterデータの分析でした。