はじめに
こんにちは。池田です。
Alteryx Inspireで視聴したセッションから「Supercharge Alteryx workflows with the Snowflake Data Cloud」を紹介します。
今回のAlteryx Inspireでは、SnowflakeとAlteryxを使ってデータの収集から加工・分析まで行うことの
メリットを謳ったセッションが多く、ご紹介するセッションもその1つです。
Snowflakeの基本的な部分にフォーカスをあてつつ、セッションの内容をご紹介したいと思います。
現代におけるデータの利活用に関する問題点
①データの入手ではなく、データへのアクセス
セッションでは、組織がデータソースにアクセスしやすくなることが必要だと訴求していました。
というのも、約63%の組織が様々なデータの種類を活用できていないという問題を抱えているそうです。
現在生成されている新しいデータの多くが非構造データですが、それらの活用ができていないという課題があり、
92%の組織が外部データソースの使用を増やす必要があると回答しているとのこと。
非構造化データとは、画像データやテキストデータ、音声データ、センサデータなどがあげられますが、
ネイティブなまま幅広い形式で保存することができる一方で、膨大な量(容量)であることが特徴として挙げられます。
大容量であるため、非構造データはクラウドストレージやクラウドのデータレイクを活用し、保存するケースが多いです。
このような日々生成され蓄積されるデータへのアクセスを改善することが、
データ活用を進めるうえで重要だと述べておりました。
②組織の持つ分析スキルを活かせていない
また、セッションでは、93%の組織が分析スキルを十分に活かすことができていないことを引用し、
以下の3つの事が原因だと述べておりました。
1つ目が、技術的な専門家がデータを完全に活用する領域に関する知見をもっていないこと
2つ目が、ビジネスの専門家が思いついたビジネスアイデアを実行するためのツールやスキルを持っていないこと
3つ目が、データへのアクセスがIT部門やデータエンジニアなど特定の役職に制限されているか、
もしくはサイロ化されていることです。
3つの主張を総合的に考えると、これらを改善するには、データへのアクセス性がよく(誰でもアクセスでき)、
専門的な知見がなくても簡単にデータ分析ができるようなプラットフォームが必要だという主張だと思います。
Snowflake × Alteryxの組み合わせでデータ活用を促進しよう!
上記で述べた課題を解決するために、以下の図で示すように、
Snowflakeデータクラウドとデータ加工・分析ツールであるAlteryxを
組み合わせて使用することが有効であることを述べておりました。
Snowflakeのデータへのアクセス性の良さとAlteryxのデータ加工/データ分析の使いやすいインターフェースにより、
全てのデータと分析スキルを活かして、データ量を価値に変えることができるようになります。
データ量を価値に変えるところがビジネス組織において非常に重要だと考えます。
「データを集めたのはよいけど、全然活用できていないな」と思い当たる組織も多いのではないでしょうか?
そのような場合に、Snowflake × Alteryxの組み合わせで、組織のデータ利活用を促進する手立てを考えてみてはいかがでしょうか。
Snowflakeについて
Snowflakeデータクラウドとは
一般的に、組織のビッグデータ活用においては、
「データレイク」、「データウェアハウス」、「データマート」の3点で構成されますが、
Snowflakeはこれらすべてをカバーすることができるというメリットがあります。
データレイク・データウェアハウス・データマートについては下記の説明の通りです。
データレイク:収集した生のデータを加工することなく格納し、保管しておく場所
データウェアハウス:指定した形式で必要なデータを一括保存し、すぐに分析できるようにデータベース化しておく場所
データマート:目的に応じた必要なデータを、例えば、部門ごとに利用しやすい形にデータベース化しておく場所
イメージ的には下図のような感じですね。
通常であれば、これら3つをそれぞれ購入をしないといけないのが、
Snowflakeは3つを兼ね備えている為、Snowflakeのみを導入することで解決できます。
そのため、導入の手間やコストを抑えることができるというメリットがあります。
また、以下でSnowflakeの特長を3つほどご紹介したいと思います。
Snowflakeの特長①:処理面
Snowflakeでは、データを保管するストレージ層と、クエリを実行するコンピュート層が完全に分離しています。
(このコンピュート層を仮想ウェアハウスと呼びます。)
これにより、複数のワークロードを大規模な並列処理ができ、高速な処理を実現しています。
※上の画像は、Snowflake Documentationから引用しました。
Snowflakeの特長②:運用負荷の面
Snowflakeには運用負荷を下げる2つの特徴的な機能が存在します。
1. タイムトラベル
タイムトラベル機能を簡単に説明すると、
定義された期間内の任意の時点で履歴データ(つまり、変更または削除されたデータ)にアクセスすることができます。
例えば、以下のようなことをしたいときに強力に機能します。
・誤ってまたは意図的に削除された可能性のあるデータ関連オブジェクト(テーブル、スキーマ、データベース)の復元
・過去の重要なポイントからのデータの複製とバックアップ
万が一にも誤って削除してしまったテーブルなどを簡単に復元できるのはとても魅力的ですよね。
2. ゼロコピークローン
以前、弊社でもブログ化されておりますが、Snowflake内のデータベース、スキーマ、テーブルをコピーする機能です。
物理的なコピーを行わず、メタデータのコピーのみを行うため、
データ量が膨大であっても短い時間でクローンの作成ができるというメリットがあります。
詳細は上記のブログに記載がありますが、扱うデータ量が大きくてもすぐにコピーを作成できるのは、
ストレスがなくて魅力的な機能ですね。
Snowflakeの特長③:コスト
Snowflakeは従量課金制であるため、ストレージ量やウェアハウスのサイズ、使用時間により料金が変わってきます。
実際に使用した分に応じた課金体系なので、組織にとっては余分なお金がかからないというメリットがあります。
まとめ
上述したこと以外にも、Snowflakeにはデータへのアクセス、セキュリティ、共有などの面で優れた部分が多く、
データ管理の観点で多くのメリットがあるため、興味をもったり、導入する企業が増えている印象です。
Snowflake × Alteryx Analytics Cloud Platform
データのスタックからデータ加工、分析/予測までエンドツーエンドでクラウド上で処理できます。
別の記事でも紹介させていただきましたが、
Alteryx Analytics Cloud Platoformには、データ加工/処理ができるAlteryx Designer Cloud、
空間分析ができるLocation Intelligence、
自動でインサイトを得たり、分析結果をレポートしてくれるAuto Insights、
機械学習ができるAlteryx Machine Learningなど様々な機能をもつ製品が揃っており、
やりたいことに合わせてカスタムできるようになっております。
Alteryxのクラウド製品は、従来からのデスクトップ版に比べて、まだやれることは限られておりますが、
将来的にはデスクトップ版と同じくらいの機能が実装されることが考えられます。今後に期待ですね!
さいごに
いかがでしたでしょうか。
Snowflakeのデータへのアクセスの良さとAlteryxのユーザに優しいインターフェースを活かして
データ活用を促進するイメージが湧きましたでしょうか?
truestarでは、元々得意な領域であったAlteryxに加えて、Snowflakeに詳しいものも社内に多くおります。
データ周りでお困りのことがございましたら、ぜひご相談ください。