
こんにちは!DataikuMonth3週目、初心者投稿の3日目、4日目を担当するs.sumiです!
今日は普段TableauPrep、Tableau、Snowflakeをメインで使用している私が、Dataikuでデータクレンジングしてみてすごいと思ったことをつらつらと書いていこうと思います
準備するデータと接続方法
今回接続するデータソースはTableau界隈ではおなじみのサンプルスーパーストア。
実は最近アップデートがかかって、今まで手動で作っていた利益率の計算フィールドや得意客のパラメータが最初から入っているみたいです。
接続方法については、こちらのブログを参照ください
すごいと思ったこと
■とてもよしなにDateparseしてくれる(SmartDate機能)
MM/DD/YYで入っているデータも、カラムを右クリック>Parse dateから読み解いて2ステップほどでYYYY/MM/DDの形にしてくれた!
しかも検知した形式じゃない場合の選択肢もくれるので、とても簡単にクリーニングできました。
たぶんTableauPrepだとカスタム分割して、再度くっつけて、みたいな作業が発生しそう
■実行ボタンがあることでスムーズにクリーニングできる
TableauPrepだとクリーニングステップや集計など、別のレシピをクリックするたびにデータ読み込みが走るので、重めのデータを操作してるときに待ちの時間が発生することがまちまちです。
Dataikuはデータセットごとにクリーニングのステップを追加>すべて終わったら実行ができるので、クイックにクリーニングできるなと思いました。
あとはTableauPrepもそうですが、クリーニング内のステップの順番を入れ替えたり可視化されてるのはやっぱりいいですよね
■Processors Libraryが充実している
STEPを追加すると、下記のような一覧を提案してくれるので、どれを使うかぱっと出てこない時はポチポチしてたらいい案が浮かびそうだなと思いました。
まとめ
いかがでしょうか?
TableauPrepはシンプルな分析にはもってこいのツールですが、より機械学習よりの分析にはDataikuはぴったりだなと思いました。
今回はデータクレンジングの視点でのみDataikuの魅力を書いてしまいましたが、社内でもこんな「Dataikuが好きな理由」が上がっています!
https://x.com/truesta99494134/status/1887773296818582004
みなさんもぜひ、Dataikuを触ってみてください!