2017年11月07日

誰でも統計備忘録

様々な確率分布

皆さんこんにちは。
アシスタントエージェントの中内です!

今回は、前回の記事の最後に書いていたように様々な確率分布の形を紹介していきたいと思います。
簡単な事例も含めて紹介していくので、気軽に読んでみて下さいね。


まず、そもそも"確率分布"って何かと言いますと
「確率変数(データ)がとる値とその値をとる確率」
が分かる分布図のことを言います。

また、確率分布は【離散型】【連続型】とに分けられます。
これは、確率変数(データ)のとる値がすべての実数をとり得るかどうかで分類します。


それでは、早速【離散型】の確率分布の代表的なものから紹介していきますね。

・二項分布

これは、反復試行の確率に関する分布として用いられます。
例:「コインを投げた時に表が出るか裏が出るか」という試行を20回行った時の確率分布

・ポアソン分布

これは、ランダムな現象に関して発生回数で捉える時の分布として用いられます。
例:「30分に平均3台の車が通る橋において、1時間に9台車が通る確率」の分布

・超幾何分布

これは、母集団の要素の中に、ある属性の要素が含まれているとした時に、任意数の標本を抽出した際にある属性を持つ要素がいくつ抽出されるか、という分布として用いられます。
例:「合計1000本のくじの中に当たりが50本入っている。この1000本のくじから30本引いた時に当たりが何本あるか」の確率分布


次に、【連続型】の確率分布の代表的なものを紹介していきます。

・正規分布

これは、全ての分布の基本形となっています。母数を極限まで増やした時に平均値と中央値と最大値がすべて等しくなるという特徴があります。
例:「全国の18歳の男性の身長分布」

・対数正規分布

これは、対数を取ると正規分布になる分布のことを言います。
例:「1000人の新入社員がいるとする。一定期間ごとにランダムに社員を選び、昇給させるとしたときの社員の月給の分布」

・指数分布

これは、ランダムな現象に関して発生間隔で捉える時の分布として用いられます。
例:「30分に平均3台の車が通る橋において、車が通る時間の間隔の分布」


もちろん、今回紹介した確率分布以外にもたくさんの確率分布が存在します。
できるだけ多くの確率分布を知り、その時に合った確率分布を推定して、分析していくとより信頼性のある解釈を持つことができます。

この記事を機に、様々な確率分布を見てみてはいかがでしょうか?


【参考サイト】
[1] さまざまな確率分布 probability distributions - 数理的思考 - 中川雅央 【知と情報の科学】
  https://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/statdist.html (2017/11/7 アクセス)