相関関係と因果関係の違いとは?



今回、相関関係と因果関係の違いについて、説明します。
相関関係とは、AとBという事象が数字の関連性があることを指します。Aが増えるとBが一緒に増えたり、Aが増えるとBが減ったりするという関係です。相関関係の測り方は様々あるのですが、それはまた次回お話させて頂きます。例えば、①アイスクリームの売上は気温が上がると増えること、②家賃は駅から距離が離れると低くなる、以上ようなことが相関関係で、上記の例は因果関係でもあります。因果関係がある際は必ず相関関係が成り立っていて、因果関係は相関関係の下位概念です。上記の2例は因果関係がありますが、下記の2例は相関関係ですが、因果関係でありません。
①「因果関係が逆」⇒交番が多い地域は犯罪数が多い(犯罪数が多いから多くの交番ができていると考えられる)、②「偶然の一致」⇒地球温暖化が進むと、海賊が減る、など










相関関係は、2つの因子に数値の関係性があるだけしか言えなくて、どちらが影響を与えているのか、間に他の因子がある可能性をあまり考慮していません









因果関係は、関係性があることに加え、影響の方向性も決められ、間の因子に関しても一部考慮されています。









ただ、因果関係は数値だけでなく、データの意味も考慮する必要があるため、データから因果関係を導くことは非常に難しいことです。統計的に因果関係を一部証明することもできますが、完全に証明することはできません。そのため、多くのデータ分析で出されている関係性は相関関係である可能性が非常に高いと言えます。

もっと知りたい方は以下の本がおススメです。




いかがでしょうか。データ分析を行うとき、相関関係か・因果関係かどちらを証明しているか意識することが重要だと思います。相関関係まで求めるだけでも十分な場合も多いので、場合に応じて使い分けましょう。

よろしければシェアお願いします。
このエントリーをはてなブックマークに追加
 



コメント

このブログの人気の投稿

統計と、機械学習・深層学習(マシーンラーニング・ディープラーニング)の違いとは?

定量分析と定性分析の使い分け

データベースの意味と、構築する際の留意点