こんにちは、taharaです。truestar では入社された方がプロジェクトでスムーズに力を発揮していただけるよう、新人研修を実施しています。研修内容は日々アップデートされていて、最近ではより実践に近い形でSnowflakeについて学べるようになりました。
こちらでは、turestarの新人研修でどこまでsnowflakeをキャッチアップできるようになるのか、ご紹介したいと思います。
truestarのSnowflake研修
本記事では、研修の中でも特に下記の項目についてご紹介します!
・Snowflake の概要理解
・snowflakeの主要機能ハンズオン
・構成図に沿ったパイプライン構築
Snowflake の概要理解
研修では、動画やPDFの資料を用いながらSnowflakeの全体像を掴んでいきます。Snowflake がクラウドネイティブなデータウェアハウスであることや、アーキテクチャなどの特徴、Time Travel や Fail-safe といった Snowflake 特有の機能、そして他製品と比べた際のSnowflakeの立ち位置などを確認します。
Snowflake主要機能のハンズオン
Snowflakeを実際に操作しながら、把握しておくべき主要な機能をハンズオン形式で学んでいきます。いくつかの演習を通して、Snowflakeを利用する上で基本となる機能や考え方を確認していきます。
扱う主な内容:
・Internal Stage、External Stage の利用
・File Format の設定
・COPY INTO コマンドによるデータロード
・Role-Based Access Control に基づく権限管理
・Task を用いたスケジュール実行
・Stored Procedure を用いた処理ロジックの自動化
・Tag および Masking Policy を利用したデータの分類および保護
・Semi-Structured Data の展開 etc
構成図に従ったパイプライン構築
研修の最後には、総仕上げとして構成図に従ってパイプラインを構築していきます。実際にパイプラインを構築することで、単にsnowflakeを触ったことがあるだけではなく、実務でどんなことをしていくのかのイメージをつけられるようにしています。
まずはサンプルデータをSnowflakeに取り込み、データ構造を確認しながら、パイプライン全体の流れを設計するところから始まります。
PKの確認を行い、ER図を作成するとともに、型変換や名寄せといったデータクレンジングの方針についても整理していきます。あわせて、データレイク・データウェアハウス・データマートに対応する各レイヤーや、そこで行う処理内容をガイドに沿って決定します。
設計後は、外部ステージへのデータロードを起点として、実際にパイプラインを構築していきます。
扱う主な内容:
・PK確認、ER図作成
・型変換・名寄せなどのクレンジング方針整理
・パイプライン構築
truestarの研修で身につくこと
これまでご紹介してきたように、truestarの研修で身につくsnowflakeの技術は下記の通り。
・Snowflakeの主要な機能や基本操作を押さえられる
・データクレンジングやモデリングの基礎を理解できる
・データロードから加工までの基本的な流れを把握できる
主要機能の操作を押さえ、パイプライン構築を一度行ってみることで、研修後にプロジェクトへ参加するための基礎知識とイメージを身につける研修となっています。
研修後の学習
研修が終わった後も、truestarでは技術のキャッチアップを続けていく文化があります。例えば、Cortex Analyst や Cortex Agent を使ってチャットボットづくりに挑戦するメンバーも居れば、SnowPro Associateを取得後 他社員も資格取得できるよう勉強会を開催してくれるメンバーも居ます。
Snowflake Intelligenceでおばちゃんチャットボットを作ってみる
・https://zenn.dev/mfujita2023/articles/5c1dfc6a85dc60
Cortex Searchの使い方
・https://zenn.dev/truestar/articles/90f10caa62df87
SnowPro Associateの合格体験記
・https://blog.truestar.co.jp/snowflake/20250602/63045/
truestarでは、日々の業務や学びを通じて得た知識をメンバー同士で共有し合いながら、個人としても組織としても成長し続けています。




