やしろです。
ちょっと前の話になりますが、Snowflakeの認定資格である”SnowPro Core”を取得しました。
その時の話はこちら
試験対策の方法について
SnowPro Coreの試験対策として、演習問題やらUdemyの講座やらSnowflake Universityやら色々手を出してみました。
ですが、このときに身に沁みたのが、とにかく”公式ドキュメントを読み込む”ことの重要性でした。
他にも受験された方のブログなんかにもよく書かれているのですが、公式ドキュメントをとにかく隅から隅まで読むこと、結局はこれに尽きます。
いざ、ドキュメントを読み込もう!
なのですが、いざドキュメントを読もうと思って学習ガイドで試験範囲を確認しようとするのですがなんだかちょっと分かりづらい。
というのも、試験範囲とその該当するドキュメントのページ、というのが直接リンクしてないんですよね…。
こんな感じです。
学習ガイド
ドキュメントへのリンク
抜粋なのでうまく伝わらないかもしれないですが、上の試験範囲に対して下のどのドキュメントがリンクするのか、ちょっとわかりにくい感じです。
というわけで今回、ここを全部整理してみました!
SnowPro Core試験範囲一覧
分野1.0:Snowflake Cloud Data Platformの機能とアーキテクチャ
1.1 Snowflake Cloud Data Platformの主要機能の概要
・柔軟なストレージ
・柔軟なコンピュート
・Snowflakeの3つの異なるレイヤー
・データクラウド/Data Exchange/パートナーネットワーク
・クラウドパートナーのカテゴリ
1.2 主要なSnowflakeのツールとユーザーインターフェイスの概要
・Snowflakeユーザーインターフェイス(UI)
・Snowsight
・Snowflakeコネクタ
・Snowflakeドライバー
・SQLスクリプト
・Snowpark
1.3 Snowflakeのカタログとオブジェクトの概要
・データベース
・スキーマ
・テーブルタイプ(外部リンクがわかりやすい)
・ビュータイプ
・データ型
・ユーザー定義関数(UDF)とユーザー定義テーブル関数(UDTF)
・ストアドプロシージャ
・ストリーム
・タスク
・パイプ
・共有
・シーケンス
1.4 Snowflakeのストレージ概念の概要を説明
・マイクロパーティション
・列指向メタデータクラスタリングのタイプ
・データストレージの監視
・検索最適化サービス
分野2.0:アカウントのアクセスとセキュリティ
2.1 セキュリティ原則の概要を説明
・ネットワークセキュリティとポリシー
・多要素認証(MFA)
・フェデレーション認証
・シングル サインオン(SSO)
2.2 Snowflakeで使用されるエンティティとロールを定義
・権限の付与方法と取り消し方法の概要について説明する
・ロールの階層と権限の継承について説明する
2.3 Snowflakeのデータガバナンス機能の概要を説明
・アカウント
・組織
・データベース
・セキュアビュー
・Information Schema
・アクセス履歴と読み取りの対応
分野3.0:パフォーマンスの概念
3.1 クエリプロファイルの使い方を説明
・Exaplain plan
・Data spilling
・データキャッシュの使用
・マイクロパーティションプルーニング
・クエリ履歴
3.2 仮想ウェアハウスの構成を説明
・マルチクラスタリング
・ウェアハウスのサイジング
・ウェアハウスの設定とアクセス
3.3 仮想ウェアハウスのパフォーマンスツールの概要を説明
・ウェアハウス負荷の監視
・クエリパフォーマンス
・スケールアップとスケールアウトの比較
・リソースモニター
3.4 クエリパフォーマンスを最適化
・マテリアライズドビューの使い方について説明する
・特定のSELECTコマンドの使い方
分野4.0:データのロードとアンロード
4.1 データのロード時に考慮すべき概念とベストプラクティスを定義
・ステージとステージタイプ
・ファイルサイズ
・ファイル形式
・フォルダ構造
・Snowflake UIを使ったアドホック/バルクロード
※SnowsightでUIからのステージングも可能になってます
4.2 データのロードに使うさまざまなコマンドと使うべきタイミングの概要を説明
・CREATE PIPE
・COPY INTO<場所>/<テーブル>
・GET
・INSERT/INSERT OVERWRITE
・PUT
・STREAM
・TASK
・VALIDATE
4.3 データのアンロード時に考慮すべき概念とベストプラクティスを定義
・ファイル形式
・空の文字列とNULL値
・単一ファイルへのアンロード
・リレーショナルテーブルのアンロード
4.4 データのアンロードに使うさまざまなコマンドと使うべきタイミングの概要を説明
・LIST
・COPY INTO<場所>/<テーブル>
・CREATE FILE FORMAT
・CREATE FILE FORMAT … CLONE
・ALTER FILE FORMAT
・DROP FILE FORMAT
・DESCRIBE FILE FORMAT
・SHOW FILE FORMATS
分野5.0:データ変換
5.1 標準データの操作方法を説明
・推定関数(類似度推定・頻度推定・パーセンタイル値の推定)
・サンプリング
・サポートする関数の種類
・ユーザー定義関数(UDF)とストアドプロシージャ
5.2 半構造化データの操作方法を説明
・サポートしているファイル形式、データ型、サイズ
・VARIANT列
・ネストされた構造のフラット化
5.3 非構造化データの操作方法を説明
・ディレクトリテーブル
・SQLファイル関数
・REST API
・データ分析用ユーザー定義関数(UDF)の作成
分野6.0:データ保護とデータシェアリング
6.1 Snowflakeによる継続的なデータ保護の概要を説明
・Time Travel
・Fail-safe
・データ暗号化
・クローニング
・複製 (レプリケーション)
6.2 Snowflakeデータシェアリング機能の概要を説明
・アカウントタイプ
・Data MarketplaceとData Exchange
・ プライベート Data Exchange (プライベート共有)
・アクセス制御オプション
・共有
100%ではないですが学習ガイドに出てくる公式ドキュメントリンクを概ねカバーできているかと思います。
SnowPro Coreの受験を考えている方、受験勉強真っ最中の方のお役に立てたら嬉しいです。
おわりに
truestarではSnowflakeの検討、導入支援や環境構築からアプリ開発まで幅広くサポート可能です。
Snowflakeに゙興味がある、導入済みだけどもっとうまく活用したい等々ありましたら、ぜひこちらから相談ください!
これまでのSnowflakeに関する記事はこちら