統計基礎①(記述統計と推測統計の違い)



今回、統計学の基礎について学んでいきます。
統計学は、普段何気ない行動の意思決定に役立っています。どこのスーパー、家電量販店が安い商品が多いのか?平均偏差値の高い大学はどこか?など、これらは全て統計学的思考に基づいており、多くの方が無意識のうちに使っています。これを意図的に使えるようになると、人生がより豊かになります。初めての方でもわかるように、今回は数式を一切使わずに統計学の基本について説明していきます。

まず、統計学は大きく分けると、
 ①記述統計学
 ②推測統計学
以上に分かれています。


①記述統計
記述統計は、今ある複数のデータから事実のまとめた数値を出す統計です。
どういうことか例を出すと、
「土日のキャベツ1玉の価格が、A店はそれぞれ180円・170円の平均175円で、B店はそれぞれ160円・170円の平均165円だったので、B店の方が2日間トータルでお得だった。」
ということです。
つまり、すでにある複数の数値で、過去の事実を述べているだけにすぎません。ただ、記述統計のメリットとして、事実の数値を出すことができるということが挙げられます。しかしながら、データの事実を知りたい際に、記述統計をいつも使えるわけではありません。データを集める調査など、全ての対象に増やすのは無理があるケースが多いです。キャベツの価格に関して、日本全国のスーパーの価格を調べるのは無理があります。そこで、一部のデータから結果を推測する推測統計が活躍します。

②推測統計
推測統計は、今ある複数のデータから、「全体の傾向」もしくは「未来」を推測する統計です。
どういうことか例に出すと、
「土日のキャベツ1玉の価格が、A店はそれぞれ180円・170円と推移し、B店はそれぞれ160円・170円と推移したので、月曜のキャベツの価格はA店160円、B店が180円になると予想したので、月曜はA店に行くべきではないか。」
ということです。(上記の例はわかりやすくするため、かなり無理やりです。)
つまり、すでにある複数の数値から、「未来」か「全体の傾向」を予測いて、事実を伝えているわけではありません。事実を知ることを目的とせず、推測することを目的としているので、全体の傾向を知りたいときに、全てのデータを知る必要がないことが最大のメリットです。(例えば、日本人全体の消費行動を知りたいときに、いちいち全員を調べていては埒が明きません。標本といって、一部の人々を抜き出して推測統計にて調べることが一般的です。)また、未来のことは誰も知らないので、推測統計を使って予測する他ありません。

統計学の入門書としては以下の本がおススメです。


いかがでしたでしょうか。統計学は2種類あり、それぞれが使い分けられています。それぞれの統計に関して、今後詳しく触れていきます。

よろしければシェアお願いします。
このエントリーをはてなブックマークに追加
 



コメント

このブログの人気の投稿

統計と、機械学習・深層学習(マシーンラーニング・ディープラーニング)の違いとは?

定量分析と定性分析の使い分け

データベースの意味と、構築する際の留意点