こんにちは
Data Engineering Study #8でExploratoryを紹介しました
先日Data Engineering Study #8「BIツール特集-OSS・商用の上手い使い分け」でExploratoryの事例紹介をさせていただきました!
様々なBIツールの比較、紹介が行われたとても興味深い勉強会でした。アーカイブ動画もありますのでご興味ある方はこちらよりどうぞ⇒https://youtu.be/RUtCXmjTYbM
その中で話に挙がった「多重共線性の確認」についてこの記事で補足説明いたします!
多重共線性とは・・・
変数同士が強く相関しあっている(変数Aの値が分かれば、変数Bの値も分かってしまう)状態です。
回帰分析を行う際に多重共線性のある変数が説明変数に入っていると、解釈不可能な結果が出るなどうまくいきません。
Exploratoryで多重共線性をチェック
Exploratoryでは「多重共線性」という画面から確認できます!以下はtruestarの顧客満足度を目的変数に回帰分析を行った例です。「VIF値」という数字が多重共線性の程度を表しています(高いほど多重共線性がある)
たとえば以下のような結果が出てしまった場合、「技術力がある」という変数と「提案力がある」という変数は多重共線性があるので、どちらか1つの変数を削除する必要があります。
・どのくらいのVIF値があったら変数を調整した方がいいのか?
・多重共線性のある変数を発見した場合、どの変数を残してどの変数をなくすか?
などは分析者がドメイン知識や分析目的を踏まえて決めていきます。
truestarでは様々なデータ分析業務に関するご相談も承っております。こちらからぜひご相談ください。