[Dataiku v12] Data Catalogが便利!

[Dataiku v12] Data Catalogが便利! | Tableau-id Press -タブロイド-
dataiku_logo

Deepblueのひめのです。

つい先日Dataikuのv12にアップグレードして新機能をいろいろ試しています。
今回はData Catalogについての記事です。

データを追加しよう

右上のメニューボタン(と私は呼んでます。丸が9つあるボタンです)をクリックして、Data Catalogに移動します。

早速「+ New Collection」で新しいデータコレクションを作成してみます。

適当にhimeno_testという名前にし、色の指定と説明も適当に追加しました。
次に「+Add Dataset」をクリックします。

前回の記事で使用したSuperstoreのデータセットを指定してみます。

権限も変更できるみたいですが、今回はデフォルトの内容で問題無さそうなのでそのままADDを押します。

データを2つ追加してみました。#Columnsが出てるのはNameに加えてどんなデータだったか思い出すのにありがたいです。

データを活用しよう

追加したデータをクリックすると右側に詳細が表示されます。
個人的にいいな、と思うのが「USE」の機能です。
これを使うともともとのプロジェクト以外にも転送されて、使えるようになります。
赤枠の#Projectsで1となっているのは今のところ1つのプロジェクトでしか使ってない、という意味みたいです。
「USE」してみましょう。

Target projectsに転送先のプロジェクトを指定します。
今回は1つにしましたが、複数を1度に指定することもできます。

 

Projectsが2に増えてUsed in DSS projectsにも表示されました。
AlteryxやTableauでもどのデータセット使ってたのかわからなくなってしまったり、バージョン管理が煩雑になってしまうことがあったので、どこで使ってるデータと同じものを使っている、というように管理できるのは嬉しいです!

上のタブのDatasetsでDSS内のすべてのデータセットを一覧表示もできますが、名前が似てしまうこととかもあるのでカタログで整理するのがいいな、と思いました。

 

v12の新機能の内、すぐにでも使い始めたいData Catalogの紹介でした。
引き続きいろいろ新しいことを試していきたいと思います!