Tableau-id Press編集部 / About Author
Tableau-ID AlteryxPODBの市区町村基礎データと気象データを紐づけてみた
こんにちは。インターン生として勤務しているk.ogawaraです。
先日株式会社TRUESTARがSnowflake データマーケットプレイスにてPrepper Open Data Bank(詳細はこちら)として新たに気象データが共有されました!ですので今回以前から共有している市区町村基礎データを気象データと紐づけて、東京都の市区町村ごとの気象データをアウトプットしていきたいと思います。前回のブログ(詳細はこちら)では市区町村ごとの人口統計量などに着目していましたが、今回は市区町村ごとの気象データがアウトプットになります。気象情報は気象庁がこちらで更新していますが、更新される度にデータの抽出・加工を行うことは相当な負担になります。しかし、PODBを利用することで一気にその負担がなくなります!では早速解説に入っていきます。
AlteryxのWFの最終形は以下のようになります。
まずはじめにデータがどのような内容なのか確認します。上から順に
①市区町村基礎データ:市区町村名・市区町村コード・市区町村ポリゴンなどに加えて、市区町村の代表点が含まれています。市区町村基礎データに関して詳しく知りたい方はこちらを参照ください。
②気象観測所データ:観測所名・所在地域名・緯度経度などが含まれています。
③月次更新気象データ:観測所名・所在地域名・測定した気象データなどが含まれています。
となります。
WFの大まかな流れは
1.データの下準備
2.市区町村基礎データと気象観測所データをマッチング
3.月次更新気象データとマッチング
になります。ではWFの解説をしていきます。
まずは下準備です。市区町村基礎データから下準備していきます。今回は東京都の気象データに限定するためにフィルターツールを使用します。
続いて、観測所データを下準備します。観測所データには、現在は観測をしていない観測所データも含まれているため、それらを排除する必要があります。こちらもフィルターツールを使用して、観測終了時期の有無で判断します。
続いて、市区町村基礎データとマッチングするための下準備をします。観測所データは緯度経度データを含んでいますが、オブジェクトデータが含まれていないため、このままではマッチングができません。そのため、オブジェクトデータを生成する必要があります。ポイント作成ツールを使用して、緯度経度データを基にポイントデータを生成します。
ポイント作成ツールとは
「数値座標フィールドを使用して、ポイントデータを作成する」ツールです。
最後に月次更新気象データの下準備です。最新月の気象データに限定するためにフィルターツールを使用を使用します。月次更新気象データを日付順でソートしたところ直近月は2021年8月でしたので、図のようにフィルタリングします。
以上で下準備は終わりです。
次に市区町村基礎データと気象観測所データをマッチングします。「市区町村ごとにどの観測所の気象データを参考にすればよいか」を決めるためです。市区町村基礎データには市区町村ごとに代表点を示すポイントデータが含まれているので、今回は市区町村の代表点から最も近い観測所の気象データを参照することにします。最寄り地点検索ツールを使用して、市区町村の代表点と最も近い観測所をマッチングします。
最寄り地点検索ツールは
「ある空間オブジェクトに対して別の空間オブジェクトから最も距離が近いレコードを取得する」ツールです。
最後に月次更新気象データとマッチングします。こちらは結合ツールを使用することで簡単に紐づけることができます。
しっかりと市区町村ごとにアメダスと観測結果が紐づいています。中野区の気象情報は練馬のアメダスで観測されており、雨量や気温などが一覧できます。
いかがでしたでしょうか。新しいツールを使用することで、私自身Alteryxのスキルがまた一歩前進した気がします(笑)株式会社TRUESTARでは今後も新たにPrepper Open Data Bankにてデータを追加していきます。少しでも興味を持っていただけたら幸いです!
最後までお読みいただき、ありがとうございました!