Exploratoryのブートキャンプに参加しました

4

こんにちは、truestar吉村です。
先日、Exploratoryのブートキャンプに参加して参りました。
その感想と、そこで学んだ内容の一部を紹介しようと思います。

1.Exploratoryのブートキャンプとは?

Exploratory社が開催している有償セミナーです。
データ分析の手法をExploratoryを通して学ぶことができます。
3日間のセミナーなのでボリュームがありますが、統計・分析を体系的に学べます。

私が参加した際の内容は以下になります。

  • Day1
    • データの基礎
    • 統計の基礎
    • 統計推論
    • 仮説検定
    • カイ二乗検定
    • エクササイズ
  • Day2
    • 相関
    • 線形回帰
    • 機械学習-決定木とランダムフォレスト
    • エクササイズ
    • ロジスティック回帰
    • 機械学習-予測と検証
  • Day3
    • 分析手法のまとめ
    • データラングリング
    • 生存分析 -生存曲線、コホート分析
    • クラスタリング
    • 時系列予測
    • エクササイズ
こちらのセミナーは定期的に開催されており、次回セミナーの受付は既に始まっております。
次回開催は04/13(火)からとなってます。
興味ある方はExploratory社の案内をご覧ください。
 

2.感想

私は本やネットで統計分析に関して勉強をしていたのですが、独学なので知識や理解に偏りがあったり、間違っていたりする部分がありました。
セミナーは非常に分かりやすく、統計・分析に関して体系的に学び直せたのが非常に良かったです。

また、講義だけではなく演習の時間も設けられていたもの良かったです。
(上記の内容の『エクササイズ』となっている部分です)
セミナー参加者4人程度 + Exploratory社の社員1名で1チームを作り、演習問題を解きました。
小人数なので、質問しやすい上、手厚く見て頂けるでの理解が深まりました。

3.Exploratoryの使い方

小ネタではございますが、セミナーを受けていて参考になったのはExploratoryの使い方です。

私はセミナーを受ける前からExploratoryを使っていたのですが、
『データをラングリングである程度キレイにしてから、分析を行う必要がある』
と思っていました。

セミナーでは、最低限のラングリングをしてExploratoryの機能であるチャートやアナリティクスで可視化・分析を行っていました。
ラングリングが完璧でなくても、可視化・分析を行って試行錯誤しながら進める点が参考になりました。

例えば、KaggleがOpen Databaseとして公開している「従業員の離職(Attrition)についてのフィクションデータ」を使用して説明します。
https://www.kaggle.com/pavansubhasht/ibm-hr-analytics-attrition-dataset/data

Attrition(=従業員の離職)のデータ型を変えただけのほぼローデータですが、例えば以下の関係が簡単に見れます。
・チャート:JoblevelとAttritionの関係
・アナリティクス:
Attritionを目的変数とした際のロジスティック回帰

可視化⇒データラングリング⇒分析を簡単に切り替えながら作業できる点がExploratoryの強みだと思うので、上手く使えるようにこれからもツールを使っていこうと思います。

4.最後に

truestarでは、Exploratoryで様々な分析・予測などを行っています。
これからも、紹介記事を更新予定です。
Exploratoryの機能や、社内事例などを紹介できればと考えております。