実は確率は1つじゃない

世の中には様々な場合、事象が存在し、我々はそれらがどれくらい起こるのか?その頻度を知ることで行動を考えることができる。

 

その中で特に頻出する考え方が「確率」である。

 

確率とは、対象の事象が起こる頻度を数字で表すもので1に近づけば近づくほど起こりやすいと考えられる。

統計学における確率には、理論的確率と経験的確率が存在する。

 

理論上確率とは理論として起こる頻度である。

 

例えばくじ引きである。アタリとハズレのあるくじを引いてアタリが出る確率を理論上で考える。くじの中にハズレが2本、アタリが1本存在すれば、合計3本の内アタリが1本なので、アタリを引く理論上確率は1/3である。

 これを理論的確率という。

 このようにアタリを引く確率はくじを引く前から理論上で算出できるため、我々が行動の選択を迷った際、確率からよりよい選択を選ぶことができることがある。

 

しかし、世の中には理論上で算出できない確率が無限に存在する。

例えば、アタリくじの数が分かっていないくじ引きを考える。くじ引きのアタリがある確率が1/3だとしても、実際くじを引いてみて、3回引いても1回も出ないことがある。(ハズレ、ハズレ、ハズレ)もし、4回目を引いたところアタリが出たとする。その時経験から算出できるアタリの出る確率は1/4である。

これを経験的確率という。

実際、このくじ引きの回数を無限に増やした場合、くじ引きの経験的確率は1/3に収束する。これを統計学では大数の法則と呼ぶ。データサイエンスでは、理論的確率が出せない事象の確率を求める際、試行回数を増やすことで、大数の法則から確率を求める。