Najinの日記

理系の大学2年生が日々思ったことをただ単に書いていきます。

統計解析入門第2版 2/11

 大学でもともと興味のあった統計学を学んでいるわけですが、やはり面白いですねぇ。数学と世の中のデータとかが好きな人にとってはめちゃくちゃ面白い。得られたデータは95%の確率で真の値から誤差3%以内に収まる、といったようなことが分かります。

 

 統計学の目的は何なのでしょうか?結論から言うと、母集団の性質を標本から推定するということです。母集団とはある事柄について調べたい対象、(日本国民全体)で標本とはその中から選ばれたサンプル(無作為に選んだ1800人の日本国民)です。本来であれば母集団全てを調査したいのですが、ほぼ不可能なので、一部のサンプルを用いて調査します。世論調査や視聴率調査、品質検査など。標本から得られた統計量(平均値、分散、中央値など)が母集団のそれとどれくらい正確に一致するのか、といったような確率的なふるまいによって理論づけられたのが統計学の基礎であると学びました。どれくらい信頼できるデータなのか、常に考える習慣がつくと物事の見方が変わるかもしれません。

 

 ところでYahooで"統計学"でと検索すると、候補に"統計学が最強の学問だ"というものが出てきます。とある本のタイトルらしいです。僕はそうは思いません。統計学はあくまで、脇役、縁の下の力持ち的な存在だからです。企業が何らかの意思決定をする場合、経営陣の経験と勘によってする場合と、データに基づいてする場合があると思います。データとは"数字"で表された値(多くは統計量)で、最も客観的なものです。数字はうそをつかないとよく言いますが、肝心なのは、それが確率関数であるということを認識する必要があるということです。およそ80%くらいの確率でこの商品は一日に500個くらい売れるだろう、ということしか言えません。意思決定の判断基準に統計的なデータを用いる、ということが、経験と勘のみによる意思決定よりも優れているという根拠なんて何もありません。統計学を妄信するのではなく、あくまで意思決定の手段の一つに用いるといったようなことが統計学の立ち位置なのです。

 

 統計学は客観的で確率的な振る舞いをみせる根拠を示す、ということだけでデータ自身は一義的な意味や解釈を持つとは言えないと思うかもしれません。実は学問の世界などにおいては、データ自身に意味を持たせるとをします。基準をあらかじめ設けて、それと比較することで例えば"差があるといえる"のように結論付けてしまうのです。(新薬の効果、男女による政党支持の違いなど)。統計学はデータ自身に意味を持たせることもあるということは、僕にとってはすごく意外な発見でした。