【Snowflake】truestarでの活用方法をご紹介

【Snowflake】truestarでの活用方法をご紹介 | Tableau-id Press -タブロイド-
snowflake_logo

やしろです。

先日開催されたSnowdayJapan2023にオフラインで参加してきました!
朝イチから参加したのですが到着したときには既にすごい人の数…Snowflakeの注目度の高さをまざまざと感じました。

それだけ今注目を浴びているSnowflakeですが、せっかくなのでtruestarではどのように利用しているのか、改めてご紹介したいと思います。

 

PODBについて

truestarは、Snowflake上でPrepper Open Data Bank、通称PODBというサービスを展開しています。e-statや国土数値情報などのオープンデータを分析しやすいようにプレップして提供している無料のサービスでして、2021年の夏から展開しています。お陰様で知名度もかなり上がってきて、大変光栄なことにSnowdayでも各所でご紹介いただいたりしましたー!

このPODBですが、AlteryxとSnowflakeを連携して運用しています。

 

Alteryxでデータを加工

まずデータのプレップ作業ですが、こちらはAlteryxで行っています。

Alteryxのいいところは何と言ってもノーコードでフローが組めるところですよね!
PODBを担当しているのは主にインターンの方たちなのですが、皆さん入社し2~3ヶ月も経つと、こんな一見複雑なフローもがしがし組めるくらいに使いこなしてます。頼もしい!

 

Snowflakeへデータをロード

次に、Alteryxで加工したデータをSnowflakeにロードします。

AlteryxからSnowflakeへ接続するには、事前にODBCの設定をする必要があります。設定方法については、こちらのブログの”事前準備”をご確認ください。
ODBCを設定したらアウトプットツールで Snowflake → バルク を選択します。

ODBCの設定を確認して、テーブル名を設定したらOKです。
ここまで設定してAlteryxを実行すると、Snowflakeの”指定したデータベース”の”指定したスキーマ”内にテーブルが作成されます。

 

データの共有

Snowflakeにロードしたデータのチェックが終わったらデータの共有です。(データチェックのフローは割愛します)

PODBはSnowflake Marketplaceで無料で公開しているので、Snowflakeアカウントさえあれば誰でも無料で使うことができます!
Market Placeでの共有方法はざっとこんな↓感じです。

①リストの作成
Snowsight の Provider Studioからリストを作成します。

公開にあたり、いくつか設定する項目があります。

1.リストの検索方法
・設定したリージョンやクラウドからであれば、Marketplace上で誰でも検索可能
・特定のアカウントのコンシューマーのみ検索可能

2.データへのアクセス方法
・フリー:申請後すぐに使用可能(無料)
・パーソナライズド:コンシューマーは利用にリクエストが必要(無料)
・有料:一部サンプルデータは無料だが、フルデータを使うには有料

PODBはこれまでパーソナライズドリスティングで共有していましたが、順次フリーリスティングに切替中です。
フリーリスティングになることで、より気軽に皆さんに利用していただけるようになる予定です!

3.データリスト詳細
雑にまとめてしまいましたが、共有したいデータベースの登録やその詳細な説明、サンプルクエリ、また公開対象リージョンの設定などです。
フリーリスティングの場合は、ここで共有するテーブルの設定までが必須です。

すべて設定したら、 Submit for Approval で申請して、Approval されればOKです!

②リクエスト承認(パーソナライズドリスティングの場合)
リストが承認されると、Marketplaceにリストが公開され、コンシューマーが選択可能な状態になります。
コンシューマーからリクエストが届いたら、 Provider Studio の Consumer Requests から承認すれば共有完了です!
この承認の際に、共有するデータベース内のスキーマやテーブルなど細かい設定ができます。
また、既存の共有を割り当てることも可能です。

③共有の設定(フリーリスティングの場合)
フリーリスティングの場合は、 Approval されたら自動的に共有オブジェクトが作成されます。(確か…)
なので、Approval後特に設定する必要はないのですが、共有したいテーブルやビューの追加変更は、Provider Sharing → Shared With you から可能です。
ここでは共有オブジェクトの一覧が確認できます。

これで共有完了です!

 

おわりに

truestarではこんな感じでAlteryxとSnowflakeを使ってPODBを提供しています。
ここからさらに、tableauからアクセスして可視化~なんて形で活用していただけたら嬉しいです!

tableau、Alteryxに続きSnowflakeに関する知見も蓄積中なので、もっとSnowflakeに関する情報も定期的にお届けしたいなーと思ってます!

これまでのSnowflakeに関する記事はこちら