Snowflake上のPODB空間データをTableau Publicでも活用しよう!

Snowflake上のPODB空間データをTableau Publicでも活用しよう! | Tableau-id Press -タブロイド-
Snowflke_to_Tableau_Public

お久しぶりです。truestarchinenです。

気軽に使えて便利なTableau Publictruestarが提供するPrepper Open Data Bank(以下、PODB)も活用して、ぜひ色んなViz作成にTryして欲しいです。

今回は、Tableau Public×PODBTryする際のちょっとしたTipsをご紹介したいと思います。

空間データの取り込みに困っていませんか?

PODBのデータはSnowflake上にありますので、TableauやAlteryxから直接アクセスできます!・・・が、Tableau Publicでは、仕様上外部データへのライブ接続ができません。このため、PODBのデータも、一度データをSnowflakeからダウンロード(抽出)してからTableau Publicにアップロードする必要があります。

Snowflakeにはデータをcsvtsvなどのテキストデータでダウンロードできる機能があるので、基本的にはあまり悩むことはないのですが、空間データや容量の重いデータをダウンロードする際にはちょっとした工夫が必要です。

2つの関門を突破しよう!

つ関門があります。

【関門1】空間データなどの容量の重いデータをダウンロードしようとすると、容量制限でファイルに落とせないことがある。

【関門2】空間データについては、ダウンロードできても、いったんテキストファイルに変換されたデータをうまく読み込めない。

PODBでは、日本の駅人流データなど、空間データを活用したデータも多く提供していますので、ぜひここは突破したいところです。

2つ方法があるのでご紹介します。

【方法1】最初から使用したいデータが絞れる場合

  1. Snowflake上でSQLをかける際にダウンロード可能な容量までデータを絞る。
  2. データをcsvでダウンロードする。

  3. ダウンロードしたcsvファイルをExcelファイルに変換する。
  4. Tableau PublicExcelファイルをアップロードする。
  5. カラムの型を文字列→空間に変更する。

ただし、この方法だと、Snowflakeからダウンロードできるデータの容量やcsvの容量により、ダウンロード制限がかかる場合があります。

その場合は以下の【方法2】を試してみてください。

【方法2】ダウンロードしたいデータの容量が大きい場合

利用者の皆様、PODBはExcelからも直接データ取得できるのをご存知でしたか?

弊社代表の藤が方法を分かりやすくブログ化しているので、ぜひご一読ください。

Snowflake 上の Prepper Open Data Bank に Excel から接続する | Tableau-id Press -タブロイド- (truestar.co.jp)

実は、この方法を使ってPODBデータへアクセスすると、ほぼ全てのPODBのデータセット()がダウンロードできます。

あとは、方法1と同様にTableau Publicにアップロードして使用するだけです。

ただし、どうしてもクエリやTableauでの読み込みなどに時間を要す点はご留意ください。

※一部データはExcelで保存できる行数制限を超えているなどの理由から、下図のようにSQLをかけてからダウンロードする必要があります。Snowflakeから直接SQLをかけるよりはダウンロードできる容量が大きいです。

ちなみに

実は本件、とあるユーザーさんから質問を受けて、悩みに悩んで解決しました・・・が、解決してみたら、「なんだ、そんな簡単なことか。」という感じでした()

最初は複雑に考えて、「どうにか気の利いたSQLを書く方法があるか?」「GeoJSONファイルでのダウンロードはできないのか?」など考えても分からず調べに調べ、しまいにはAIに聞いてもうまく聞けずによく分からない回答が返ってくる始末…。

「申し訳ないけど諦めてもらうしかないのかな?」なんて思っていったん頭をクリアにした矢先、ふと思い浮かんだのがこの解決策でした。

弊社の5Valueの1つであるSpeed Upに「Keep it Simple」という行動指針があるのですが、なんだか改めてこの重要性を認識させられた一件でした。

 

いよいよ夏本番!夏休み!暑過ぎてお家で楽しいことしたいな~なんてときは、気分転換に気軽にTableau Public×PODBで遊んでみてください!

素敵なVizができたら、ぜひTableau Publicでも共有お願いします~。

PODBHP活用事例も載っているので、ぜひご参考になさってくださいね。

ではまた次回!