こんにちは。t.ozawaです。
今回は、Snowflake上のPrepper Open Data BankにPower BIから接続していきます。
実際にPower BIからSnowflakeに接続する方法や、Snowflakeからインプットしたデータを可視化するところまで、順序を追って説明したいと思います。
『Snowflakeと○○を接続する』シリーズは今回で4回目です。過去のブログはこちら。
1. 事前準備
Power BI DesktopでSnowflake上のテーブルを読み込むためには、Snowflake ODBCドライバーのインストールと設定が必要になります。
まずはODBCドライバーをインストールし、次にSnowflake用のODBC設定をしていきましょう。
STEP1. ODBCドライバーのインストール
Alteryxには通常 ODBC 接続をすることになりますので、事前準備が必要になります。
Snowflake の公式サイトから ODBC ドライバーはダウンロード可能です。
https://docs.snowflake.com/en/user-guide/odbc-download.html
リンク先は英語ですがブラウザの翻訳機能で日本語にすれば全く問題ないと思います。
※今回は Windows 64-bit版で説明します。
① Windows 用の URL をクリック。
② [snowflake64_odbc-.msi] をダウンロード。
インストールは [Next] -> [Next] -> [Finish] で通常は問題ありません。
STEP2. ODBC設定を行う
インストールしたODBC データソースを用いて、SnowflakeのODBC設定を行います。
① Windows の検索窓で “odbc” と入力すれば[ODBC データソース(64ビット)]が出てくるのでこれを選択。
② [ユーザーDSN]で[追加]をクリック。
③ セットアップするデータソースのドライバーとして、『SnowflakeDSIIDriver』を選択し、完了をクリック。
このとき、インストールしたSnowflake ODBCドライバーと、ODBC データソースのビット数が異なると、SnowflakeDSIIDriverが表示されないので注意してください。
④ ODBC の設定画面に必要情報を入力。
ユーザー名やパスワードは後でも求められますので、画像の内容のみでも問題ありませんでした。
[Server:] には Snowflake 環境のURL を入力しますが、最初の『https://』は不要なのが要注意ポイントです。
この部分のURLを入力します。
【Twitterユーザーの入力例】
〇 User : Twitterアカウント名の”@”以降
※Twitterユーザー以外はSnowflakeのアカウント名
〇 Password : ご自身で設定したSnowflakeパスワード
※Twitterユーザー以外はSnowflakeのパスワード
〇 Server : tn02567.ap-northeast-1.aws.snowflakecomputing.com
※Twitterユーザー以外は、赤字部分を自社の環境に要変更
〇 Warehouse : PODB_TRIAL_XS
※Twitterユーザー以外は、自社環境で使えるウェアハウスを指定
〇Role : PODB_TEST
※Twitterユーザー以外は、自社環境で使えるロールを指定
これで準備は完了です。
2. Snowflake上のテーブルをPower BI Desktopで可視化してみる
Power BIからSnowflake上のテーブルデータに接続し、実際にPower BIで可視化するところまでの流れを行っていきます。
STEP1. Snowflakeに接続する
まずは、Power BIからSnowflakeにサインインしましょう。
[データを取得] -> [その他] -> [ODBC] -> [接続]
こうすることで、ODBCの選択画面が表示されます。
SnowflakeのODBCを選択して、[OK]をクリック。
すると、Snowflake上のテーブルデータの一覧が表示されます。
① 任意のテーブルを選択 。すると、右側にテーブルのプレビューが表示されます。
② [読み込み]をクリック。
こうすることで、Snowflake上のテーブルデータがPower BIに読み込まれました。
STEP2. インプットしたデータを可視化してみる
インプットしたデータを可視化してみましょう。
① 塗分け地図を選択
② [場所]や[色の彩度]に任意のカラムを選択
図では、都道府県ごとの人口数の塗分け地図を表示できました。
しかし、東京都のポリゴンなどが一部欠損しています。
STEPおまけ. ポリゴン精度を高めたい
STEP2で作成した地図では、東京都のポリゴンなどが一部欠損していました。
これを解決する方法として、[塗分け地図] -> [場所] 内のカラム名を”都道府県”にすることで、ポリゴンの精度を良くすることができます。
① [フィールド]内で右クリック -> [新しい列]
② “列”カラムが追加されるので、クリック -> 都道府県 = [PREF_NAME] と入力
③ [場所]を”都道府県”に置き換える。
そうすることで、先ほどよりも綺麗なポリゴンを表示させることができました。
今回は扱いませんでしたが、Prepper Open Data Bank上のGeography型ポリゴンを使いたい場合、TopoJSON型に変換することで、Power BI Desktopで扱うことができるようです。
Prepper で貴重な人材の時間を解放!
今回は Power BI Desktop から Snowflake 上の Prepper Open Data Bank に接続する方法をご紹介させていただきました。
弊社サービス『Prepper』では、データ分析者のデータプレップ(分析の下準備)の時間を削減するサービスをご用意しています。
Prepper Open Data Bank で無料共有しているデータは、国勢調査の人口統計データ、国土数値情報のポリゴンデータ、気象庁の気象データなど様々です。
利用には Snowflake のアカウントが必要になりますが、30日間の無料トライアルが可能です。
ご興味のある方は是非こちらのページ最下部のお問い合わせ欄からお声掛けください!
それでは、最後までお読みいただきありがとうございました。