【Snowflake】SnowPro Coreの学習ガイドと公式ドキュメントを整理してみた

【Snowflake】SnowPro Coreの学習ガイドと公式ドキュメントを整理してみた | Tableau-id Press -タブロイド-
snowflake-logo-1200x630-960x504

やしろです。

ちょっと前の話になりますが、Snowflakeの認定資格である”SnowPro Core”を取得しました。
その時の話はこちら

試験対策の方法について

SnowPro Coreの試験対策として、演習問題やらUdemyの講座やらSnowflake Universityやら色々手を出してみました。
ですが、このときに身に沁みたのが、とにかく”公式ドキュメントを読み込む”ことの重要性でした。
他にも受験された方のブログなんかにもよく書かれているのですが、公式ドキュメントをとにかく隅から隅まで読むこと、結局はこれに尽きます。

いざ、ドキュメントを読み込もう!

なのですが、いざドキュメントを読もうと思って学習ガイドで試験範囲を確認しようとするのですがなんだかちょっと分かりづらい。
というのも、試験範囲とその該当するドキュメントのページ、というのが直接リンクしてないんですよね…。
こんな感じです。

学習ガイド

ドキュメントへのリンク

 

抜粋なのでうまく伝わらないかもしれないですが、上の試験範囲に対して下のどのドキュメントがリンクするのか、ちょっとわかりにくい感じです。

というわけで今回、ここを全部整理してみました!

SnowPro Core試験範囲一覧

分野1.0:Snowflake Cloud Data Platformの機能とアーキテクチャ

1.1 Snowflake Cloud Data Platformの主要機能の概要
柔軟なストレージ
柔軟なコンピュート
Snowflakeの3つの異なるレイヤー
・データクラウド/Data Exchange/パートナーネットワーク
クラウドパートナーのカテゴリ

1.2 主要なSnowflakeのツールとユーザーインターフェイスの概要
Snowflakeユーザーインターフェイス(UI)
Snowsight
Snowflakeコネクタ
Snowflakeドライバー
SQLスクリプト
Snowpark

1.3 Snowflakeのカタログとオブジェクトの概要
データベース
スキーマ
テーブルタイプ(外部リンクがわかりやすい)
ビュータイプ
データ型
ユーザー定義関数(UDF)とユーザー定義テーブル関数(UDTF)
ストアドプロシージャ
ストリーム
タスク
パイプ
共有
シーケンス

1.4 Snowflakeのストレージ概念の概要を説明
マイクロパーティション
列指向メタデータクラスタリングのタイプ
データストレージの監視
検索最適化サービス

分野2.0:アカウントのアクセスとセキュリティ

2.1 セキュリティ原則の概要を説明
ネットワークセキュリティとポリシー
多要素認証(MFA)
フェデレーション認証
シングル サインオン(SSO)

2.2 Snowflakeで使用されるエンティティとロールを定義
権限の付与方法取り消し方法の概要について説明する
ロールの階層と権限の継承について説明する

2.3 Snowflakeのデータガバナンス機能の概要を説明
アカウント
組織
データベース
セキュアビュー
Information Schema
アクセス履歴と読み取りの対応

分野3.0:パフォーマンスの概念

3.1 クエリプロファイルの使い方を説明
Exaplain plan
Data spilling
データキャッシュの使用
マイクロパーティションプルーニング
クエリ履歴

3.2 仮想ウェアハウスの構成を説明
マルチクラスタリング
ウェアハウスのサイジング
ウェアハウスの設定とアクセス

3.3 仮想ウェアハウスのパフォーマンスツールの概要を説明
ウェアハウス負荷の監視
クエリパフォーマンス
スケールアップとスケールアウトの比較
リソースモニター

3.4 クエリパフォーマンスを最適化
マテリアライズドビューの使い方について説明する
・特定のSELECTコマンドの使い方

分野4.0:データのロードとアンロード

4.1 データのロード時に考慮すべき概念とベストプラクティスを定義
ステージとステージタイプ
ファイルサイズ
ファイル形式
フォルダ構造
Snowflake UIを使ったアドホック/バルクロード
SnowsightでUIからのステージングも可能になってます

4.2 データのロードに使うさまざまなコマンドと使うべきタイミングの概要を説明
CREATE PIPE
COPY INTO<場所>/<テーブル>
GET
INSERT/INSERT OVERWRITE
PUT
STREAM
TASK
VALIDATE

4.3 データのアンロード時に考慮すべき概念とベストプラクティスを定義
ファイル形式
空の文字列とNULL値
単一ファイルへのアンロード
リレーショナルテーブルのアンロード

4.4 データのアンロードに使うさまざまなコマンドと使うべきタイミングの概要を説明
LIST
COPY INTO<場所>/<テーブル>
CREATE FILE FORMAT
CREATE FILE FORMAT … CLONE
ALTER FILE FORMAT
DROP FILE FORMAT
DESCRIBE FILE FORMAT
SHOW FILE FORMATS

分野5.0:データ変換

5.1 標準データの操作方法を説明
・推定関数(類似度推定頻度推定パーセンタイル値の推定
サンプリング
サポートする関数の種類
ユーザー定義関数(UDF)とストアドプロシージャ

5.2 半構造化データの操作方法を説明
サポートしているファイル形式データ型サイズ
VARIANT列
ネストされた構造のフラット化

5.3 非構造化データの操作方法を説明
ディレクトリテーブル
SQLファイル関数
REST API
データ分析用ユーザー定義関数(UDF)の作成

分野6.0:データ保護とデータシェアリング

6.1 Snowflakeによる継続的なデータ保護の概要を説明
Time Travel
Fail-safe
データ暗号化
クローニング
複製 (レプリケーション)

6.2 Snowflakeデータシェアリング機能の概要を説明
アカウントタイプ
Data MarketplaceData Exchange
・ プライベート Data Exchange (プライベート共有)
アクセス制御オプション
共有

100%ではないですが学習ガイドに出てくる公式ドキュメントリンクを概ねカバーできているかと思います。
SnowPro Coreの受験を考えている方、受験勉強真っ最中の方のお役に立てたら嬉しいです。

おわりに

truestarではSnowflakeの検討、導入支援や環境構築からアプリ開発まで幅広くサポート可能です。
Snowflakeに゙興味がある、導入済みだけどもっとうまく活用したい等々ありましたら、ぜひこちらから相談ください!

これまでのSnowflakeに関する記事はこちら