お久しぶりです。truestarのchinenです。
気軽に使えて便利なTableau Public!truestarが提供するPrepper Open Data Bank(以下、PODB)も活用して、ぜひ色んなViz作成にTryして欲しいです。
今回は、Tableau Public×PODBにTryする際のちょっとしたTipsをご紹介したいと思います。
空間データの取り込みに困っていませんか?
PODBのデータはSnowflake上にありますので、TableauやAlteryxから直接アクセスできます!・・・が、Tableau Publicでは、仕様上外部データへのライブ接続ができません。このため、PODBのデータも、一度データをSnowflakeからダウンロード(抽出)してからTableau Publicにアップロードする必要があります。
Snowflakeにはデータをcsvやtsvなどのテキストデータでダウンロードできる機能があるので、基本的にはあまり悩むことはないのですが、空間データや容量の重いデータをダウンロードする際にはちょっとした工夫が必要です。
2つの関門を突破しよう!
2つ関門があります。
【関門1】空間データなどの容量の重いデータをダウンロードしようとすると、容量制限でファイルに落とせないことがある。
【関門2】空間データについては、ダウンロードできても、いったんテキストファイルに変換されたデータをうまく読み込めない。
PODBでは、日本の駅や人流データなど、空間データを活用したデータも多く提供していますので、ぜひここは突破したいところです。
2つ方法があるのでご紹介します。
【方法1】最初から使用したいデータが絞れる場合
- Snowflake上でSQLをかける際にダウンロード可能な容量までデータを絞る。
- データをcsvでダウンロードする。
- ダウンロードしたcsvファイルをExcelファイルに変換する。
- Tableau PublicにExcelファイルをアップロードする。
- カラムの型を文字列→空間に変更する。
ただし、この方法だと、Snowflakeからダウンロードできるデータの容量やcsvの容量により、ダウンロード制限がかかる場合があります。
その場合は以下の【方法2】を試してみてください。
【方法2】ダウンロードしたいデータの容量が大きい場合
利用者の皆様、PODBはExcelからも直接データ取得できるのをご存知でしたか?
弊社代表の藤が方法を分かりやすくブログ化しているので、ぜひご一読ください。
Snowflake 上の Prepper Open Data Bank に Excel から接続する | Tableau-id Press -タブロイド- (truestar.co.jp)
実は、この方法を使ってPODBデータへアクセスすると、ほぼ全てのPODBのデータセット(※)がダウンロードできます。
あとは、方法1と同様にTableau Publicにアップロードして使用するだけです。
ただし、どうしてもクエリやTableauでの読み込みなどに時間を要す点はご留意ください。
※一部データはExcelで保存できる行数制限を超えているなどの理由から、下図のようにSQLをかけてからダウンロードする必要があります。Snowflakeから直接SQLをかけるよりはダウンロードできる容量が大きいです。
ちなみに
実は本件、とあるユーザーさんから質問を受けて、悩みに悩んで解決しました・・・が、解決してみたら、「なんだ、そんな簡単なことか。」という感じでした(汗)
最初は複雑に考えて、「どうにか気の利いたSQLを書く方法があるか?」「GeoJSONファイルでのダウンロードはできないのか?」など考えても分からず調べに調べ、しまいにはAIに聞いてもうまく聞けずによく分からない回答が返ってくる始末…。
「申し訳ないけど諦めてもらうしかないのかな?」なんて思っていったん頭をクリアにした矢先、ふと思い浮かんだのがこの解決策でした。
弊社の5Valueの1つであるSpeed Upに「Keep it Simple」という行動指針があるのですが、なんだか改めてこの重要性を認識させられた一件でした。
いよいよ夏本番!夏休み!暑過ぎてお家で楽しいことしたいな~なんてときは、気分転換に気軽にTableau Public×PODBで遊んでみてください!
素敵なVizができたら、ぜひTableau Publicでも共有お願いします~。
PODBのHPに活用事例も載っているので、ぜひご参考になさってくださいね。
ではまた次回!