Truestarたまるです。
桜舞うこの季節、気温もすっかり暖かくなり、新元号も発表され、
気分一新「いちょタブローでもやってみっか!」という方も多いのではないでしょうか。
そんな”Tableau一年生”の方向けに今日は、
そもそもTableau Desktop用のデータはどういう形式で用意しておけばいい?
というデータ準備の疑問に焦点を当てたいと思います。
※更に前ステップで
汚いデータをクレンジング(いわゆる「前処理」)の必要がある場合については
Tableau Desktopの範疇外になってしまうので
その場合はTableau PrepやAlteryxの記事を参照下さい 。
分析用データは大きく2種類の形式がある
下のデータのように、最初の数列でいくつかの項目を示し、途中の列(例ではD列)から
項目1 項目2 項目3
——– ——- ——-
数値 数値 数値
というようなデータを見かける事は多いのではないでしょうか。
このようなデータをアンスタックデータ(いわゆる"横もち"データ)と呼び、
人間が見たときにぱっと理解しやすい形式です。
一方、上でヘッダとなっている年項目(2012~2015)も1列、値(売上)も1列、
にまとまったデータ形式もありま
このようなデータはスタックデータ(いわゆる"縦もち"データ)と呼びます。
Tableau(BI)的にいいのはどちらか
縦持ちも横持ちも、Tableauに読み込ませる事はできるのですが、
Tableauで扱いやすいのは後者のスタックデータ(縦持ち)です。
比較するとレコード数は多くなるのですが、
Tableauは列指向のデータベースを持っているので
「特定列を縦方向に見にいく」のは得意です
( 参考: 列指向データベース管理システム https://ja.wikipedia.org/wiki/%E5%88%97%E6%8C%87%E5%90%91%E3%83%87%E3%83%BC%E3%82%BF%E3%83%99%E3%83%BC%E3%82%B9%E7%AE%A1%E7%90%86%E3%82%B7%E3%82%B9%E3%83%86%E3%83%A0 )
こちらの形式だとすべての属性項目がディメンションとして扱えるため
・表計算
・項目のグループ化
・Tableau計算式での扱い…
などなどの点で頭を悩ませずスムーズに分析が行えます。
横持ちデータしか用意できません…
人生色々な事情がありますよね。データの世界も同じです。しかしご心配無く。
単純な横持ちデータであれば、TableauDesktopの「ピボット」機能を使って縦持ちへの変換ができます。
※直接この操作ができるのは Microsoft Excel、テキスト ファイル、Google スプレッドシート、.pdf のデータ ソース に限るようです。くわしくはこちら
計算式で(擬似的に)復元もできます
もちろん縦持ちが万能というわけでもなく「差」や「割合」を出したい時は横にもっていた方が便利なパターンもあります。そんな時は
もしくは
のような計算式で、独立したメジャーとする事も可能です。
結論: 縦持ちデータの方が望ましいが、横持ちでもTableauでピボットできるので心配なし
Tableauツールそのものの使い方ではなかったですが、データ準備も分析には肝心な初めの一歩です。
こちらを参考にTableauの第一歩も一緒に踏み出しましょう!