2018年08月10日

誰でも統計備忘録

アンケートの必要サンプル数をご存知ですか?

皆さんこんにちは!
エージェントの中内です。


今回は調査の定番であり、多くの人が活用したことがあるであろう
「アンケート」に関するお話をしようと思います。

皆さんは次のような疑問や不安を抱いたことはありませんか?

「50人にアンケートを回答してもらったけどこれって多いのか?少ないのか?」
「一体、どれくらいのアンケートを集めたら十分に調査したと言えるのだろう……?」



勿論、回答者数が多いほど精度は高くなるので、たくさんの回答を集めるに越したことは
ないのですが、やはりコスト的にも労力的にも負担が大きくなってしまいます。
そのため、アンケートを行う際には「これだけの数を集めれば十分と言えるライン」を知ることは
とても大事になってきます。


さて、その「これだけの数を集めれば十分と言えるライン」ですが、
設定するには「許容誤差」「信頼レベル」という2つの指標を決める必要があります。


「許容誤差」→ 回答にどれくらいの誤差が含まれるのか
例えば、「朝食にお米を食べる日本人の比率は80%」という結果に対し許容誤差が5%であれば、
「朝食にお米を食べる日本人の比率は75%~85%」ということになります。
一般的に、許容誤差は1~10%の範囲で設定されます。

「信頼レベル」→ 結果に対してどれくらいの信頼度があるのか
例えば、信頼レベル95%であれば、
「100人中95人は許容誤差内の回答をしている」ということになります。
一般的に、信頼レベルは90%~99%の範囲で設定されます。


では、「母集団が10,000人であり、許容誤差を5%、信頼レベルを95%」
と設定した場合、必要な回答者数は何人ほどになるでしょうか。

許容誤差5%、信頼レベル95%は結果としては十分精度の高いものに見えます。
そのため、結構な人数(それこそ1,000人や2,000人ほど)の回答者数が
必要なのでは、と思いますよね。


ですが、実は 370人 でよいのです。
「あれ、思ったより少ないな?」と感じた人が多いのではないでしょうか。


今回のアンケートの話のように、「統計ではこういった考え方がある」ということを
知っているだけでも、無駄な労力をかけずに効率的に欲しい情報を得られることがあります。

統計学というと難しそうに感じる方もいるかもしれませんが、気軽に色々調べてみることを
オススメします!実は身の回りには、たくさんの統計や確率に基づいたものが溢れていますよ!

ここまで読んでいただきありがとうございました!
それではまた次回お会いしましょう!