ブログ記事のトラッカー(パート1)

ブログ記事のトラッカー(パート1) | Tableau-id Press -タブロイド-
Blog_tracker

初めまして、コーです。

ブログ記事のトラッカー(パート1)

もっとブログを書こうと思っても、なかなかモチベーションが上がらないということはありませんか?
心配しなくても、やる気が出ないことは誰にでもあることです。実は私にとっては、ブログを始めるモチベーションを見つけることです。(笑)

Githubを使っていたら、最近1年間の貢献をカウントするコーナーを見つけました。
ユーザーがその日に活動をすると、ボックスは緑になります。何もしていないときはグレーになっています。

つまり、ユーザーがその日のために貢献すれば、草を育てることができるのです。

このアイデアをtruestarでも試してみたいと思いました。
緑の箱が見えることで、筆者さんが草を育てたという達成感を得て、もっと草を育てようという気持ちになることを期待しています。

今回のブログでは、データの取得とクリーニングの方法についてご紹介します。

1. データの取得

ここでは、wordpressを使ったブログの場合の手順を説明します。wordpressをお持ちでない方は、2.Alteryxに進んでください。

データを取得するためには、ブログサイトのwp-adminにログインする必要があります。
メニューの「ツール」から「エクスポート」を選択します。

すべての投稿をエクスポートし、ステータスを公開にするかどうかを選択します。状況に応じて必要なものを自由に選択してください。

下部の "download export file "を選択すると、xmlファイルのダウンロードが始まります。
おめでとうございま!。これでブログトラッカーを作るために必要なデータがダウンロードできました。

2. Alteryxでデータをクリーニングしましょう

使うツールは8つだけと非常にシンプルな流れなので、初心者でもできます。
目標は、著者、日付、最大日付時間、投稿ID、タイトル、最新タイトル、カテゴリー、最新カテゴリー、ブログへのリンクのカラムを取得することです。
著者、投稿ID、タイトル、カテゴリー、ブログへのリンクのカラムは、すでにデータセットにあります。
日付、最大日付時間、最新タイトル、最新カテゴリー、のカラムを作成またはフォーマットする必要があります。

  1. xmlファイルをAlteryxにドラッグ&ドロップして入力してみましょう。入力ファイルが自動的に生成されます。
  2. 不要なフィールドを削除しましょう。
  3. 数式(Formula)ツールの関数「Todate」を使って、日付をフォーマットしてみましょう。また、月/年の日付列を作ってみましょう。
  4. 以下の列のタイプが正しいことを確認しましょう。

  5. サマリーツールを使って、筆者、月/年でグループ化し、Maxを使って最新の日付時間の列を作ってみましょう。

  6. 筆者と月/年ごとに行を結合してみましょう。結合ツールで右の筆者と月/年の列を選択解除することを忘れないでください。

  7. 次のような条件の数式を使って、最新のタイトルとカテゴリーの列を新たに作ってみましょう。
    日付時間の行が、各著者の最新ブログ記事の日付時間の行と一致した場合、数式(Formula)ツールはその行のタイトルまたはカテゴリを入力し、そうでない場合はNULLを入力します。

  8. 最後に出力ツールを使って、Tableauで使用するハイパーファイルに結果を出力します。

3.最後に

このシンプルなチュートリアルを楽しんでいただき、何かお役に立てれば幸いです。

このチュートリアルのAlteryxフローから出力されたデータを使ってTableauのダッシュボードを作る方法は、別のブログ記事「ブログ記事のトラッカー(パート2)」で説明します。
ティーザーとして、Tableauダッシュボードは以下のようになります。ご期待ください。