Alteryx Weekly Challenge初投稿!

Alteryx Weekly Challenge初投稿! | Tableau-id Press -タブロイド-
答えblog1

はじめに

初めまして、r.itoです!今年1月よりtruestarでインターン生として勤務している大学2年生です。よろしくお願いします!
 

truestarではTableauとAlteryxというデータ分析ソフトを用いて、商圏分析ツールであるHawkeye Viewerの開発に携わっていますが、まだまだ初心者です… このブログでは、文系学部生である私がデータ分析ツールについてわかりやすく解説していきたいと思っています!

その第一弾として、Alteryx Weekly Challengeに毎週挑戦していきたいと思います!このWeekly Challengeは、Alteryx学習者が利用する毎週出題の問題集のようなもので、その中から私が問題をピックアップして解き、自身の感想とともに解説をしていこうと思っています。問題の解答は1通りとは限らないので、この記事を読んだ後もぜひ挑戦してみてください!

Weekly Challenge#81 -下準備編-

さて、今回挑戦するのは「チャレンジ#81:ソーイングチャレンジ2020」です。まずは問題概要と解答例を紹介します。

問題概要-

大山町とサクラという2つのコミュニティで作成された、大・中・小の3種類のマスクについて、「各コミュニティの作成数」と「そのサイズごとの合計」を求めるというものです。解答に用いる入力データは以下2つの表です。(左:大山町コミュニティ、右:サクラコミュニティ)

解答例-

 

 

-解答の筋道-

データ分析に限らず何かを始める際には、「何がしたいのか」(ゴール、仮説など)を明確にすることが大切だと思います。今回求めたいものは「各コミュニティが作ったマスクの総数」と「各コミュニティが作ったマスクのサイズごとの総数」です。これらを一目でわかるようにするには、どのような行・列を持った表が適切か、事前にイメージしておくといいと思います。紙などに書いてみると、より明確になると思います。

シンプルな問題ですが、解答の筋道を立てていきましょう。手元にある入力データから考えると、

  1. 大山町の表を「名前」でなく「サイズ」ごとに合計してまとめ、
  2. 2つの表を縦方向にユニオンしたうえでマスクのサイズ別に合計を求め、
  3. 各コミュニティごとのマスク作成数を合計する

この手順を踏めば答えが求まりそうです。

Weekly Challenge#81 -解説編-

では先の手順を踏まえて解いていきましょう。

1.

問題概要にある通り、今回使えるデータは「大山町」と「サクラ」で分かれており、サクラでは既にサイズごとに作成数が集計されています。そのため、「集計ツール」を用いて大山町の作成数をサイズ別に集計します。

  

次に、どのコミュニティが作成したかわかるよう、「フォーミュラ」で新しい列を出力します。(個人的にはフォーミュラのこの活用法が思いつかず少し悩みました..)フォーミュラは式を使用して列を作成・更新するツールなので、このように「出力列」の欄で「作成元」という新しい列を追加することもできます。サクラコミュニティでも同様に作成元を追加し、ステップ1は完了です。


2.

ステップ1でできた2つの表を「ユニオンツール」で1つにまとめます。その後、「両コミュニティのマスク作成数をサイズ別に集計」します。つまり、縦方向に合計します。集計ツールを用いるだけでは解答のようにサイズ合計が表示されず、表が崩れてしまったため、フローを枝分かれさせて「セレクトツール」でフィールドを並び替えつつ(以下の1枚目)「集計ツール」で合計を求めました(以下の2枚目)。結果をもう一度ユニオンすればステップ2もクリアです。

3.

最後は横方向に合計し、各コミュニティごとのマスク作成数を求めるだけです。「フォーミュラ」を用いて下の図のように式を作成し、新しい列を出力すれば完成です。(xから既存のフィールド名を挿入できます。)個人的に[Null]が気になったため「クレンジングツール」で削除してみましたが、どちらでも問題ないと思います。

おわりに

以上解説でしたがいかがだったでしょうか?初めてのブログなため、読みにくいい部分もあったと思いますが、Weekly Challengeを通して文章・Alteryxともにレベルアップしていきたいと思いますので、これからもよろしくお願いします!

最後まで読んでいただきありがとうございました、来週からも投稿していくのでぜひお楽しみに…!