実現したいこと
ある部品についてアンケートをとり、どこの製品を使用しているか調査したいと考えています。
Ex.A社製 40%、B社製 30%、C社製 20%・・・
発生している問題・分からないこと
どのくらいのサンプルサイズが必要なのかわかりませんでした。
必要なサンプルサイズを計算する手法及びその理論について知りたいです。
該当のソースコード
ソースコードはなし。
試したこと・調べたこと
- teratailやGoogle等で検索した
- ソースコードを自分なりに変更した
- 知人に聞いた
- その他
上記の詳細・結果
調査したところ、約400ほどのサンプルをとれば良いとの記事がいくつかでてきましたが、どういった計算で400という数値がでているのかわかりませんでした。(アンケートの場合は回収率を考慮する必要があるのも知りました。)
母比率の推定についてまとまった記事がありましたが、内容を確認すると2項分布の話なので今回の件では使用できないと考えています。(結果が2つしかない試行ではないため)
https://bellcurve.jp/statistics/course/9129.html
補足
teratail内に存在しないタグの質問とのご指摘をいただきました。
統計というタグが存在します。
ですので、この質問は問題ないかと思いますがいかがでしょうか?
(回答できるだけの知識はないですが)
母集団のサイズと許容誤差が明確でないと答えはでないかと思います。
大雑把に言って、誤差はサンプル数の自乗に反比例します。
母集団のサイズの関係は知見がないので回答ができないわけ。
なるほど、母集団のサイズと許容誤差を設定する必要があるのですね。
今回は部品の利用者が母集団になりますので、明確な数値はわかりません。
許容誤差については調べてみます。
ありがとうございます。
> 母比率の推定についてまとまった記事がありましたが、内容を確認すると2項分布の話なので今回の件では使用できないと考えています。(結果が2つしかない試行ではないため)
> https://bellcurve.jp/statistics/course/9129.html
質問にも記載のこちらのサイトが簡潔にまとめられていてわかりやすいと思いました。
今回のケースでも、分けて考えると「A社を選ぶ/選ばない」「B社を選ぶ/選ばない」・・・といった結果が2つの試行を組み合わせているだけと考えればいいです。
あと、上のコメントに関する部分では上記サイトでは無限母集団(十分におおきいサイズの母集団)を想定していることになると思います。
全くこれ系の知識がない人の戯言ですが,アンケートのサンプル数っていうのはそういう小難しそうな理屈から決めなきゃならないものなのだろうか? というのが疑問.
例えば「最終的に1票を何%として提示したいか」みたいなところからざっくりと決めちゃうのではダメなのかな?
* サンプル数2なら1票が「50%」になる.← とりあえずこれだと不十分に思える
* サンプル数100なら1票が「1%」になる.← どうかなー?
* サンプル数が10000なら… ← やりすぎ or Not?
あと,選択肢の中に「X社のはコレほとんど選ばれてねぇだろうな… せいぜい0.1%くらいかな?」みたいな,なんとなく事前に雰囲気が見積れるようなのがあるとしたら,少なくともこの推測値 0.1% よりも十分に小さい刻みになるように選ばないとダメな気もする.
アンケートの結果を使ってなにかする 場合で、結果が不正確であったために正しくない決断をしてしまった場合の被害の大きさ
によって変わりますね。
例えば 選挙の当確予想 だと、外したときに「NHKってだめだな」って不利益。
ご回答いただき、ありがとうございます。
→bsdfan
2つの試行を組み合わせているだけと考えた場合、どのような計算になるのかがわかりませんでした。
ご教授いただけないでしょうか?
また、母集団があまり多くない場合についてはどのような手法があるかご存知でしょうか?
→fana
アンケート費用の見積もりであったり、他者に説明するための根拠が必要なので、具体的なサンプルサイズを求めた次第です。
→winterboum
アンケートの結果でなにをするかで、許容誤差が変わってくるということですかね。
> アンケートの結果でなにをするかで、許容誤差が変わってくるということですかね。
ですね
> 2つの試行を組み合わせているだけと考えた場合、どのような計算になるのかがわかりませんでした。
計算式はリンク先のそのままです。
> また、母集団があまり多くない場合についてはどのような手法があるかご存知でしょうか?
標本誤差に sqrt((N - n) / (N - 1)) の係数(N: 母集団サイズ、n: サンプルサイズ)がかかるので、解析的には式が出ないと思います。「サンプルサイズ 計算ツール」などで検索すると値を出してくれるサイトが見つかります。
ご回答ありがとうございます。
今回の場合ですと、「A社を選ぶ、選ばない」という2項分布で考えて計算すればサンプルサイズが求まるという認識であっていますでしょうか?
リンク先では事前調査で大まかな母比率の予測がてきている状態の計算例が載っていました。
今回の場合母比率は全くわからないため、p^(推定値)=0.5とすれば最も安全なサンプルサイズを求めることができるという認識であっていますでしょうか?
母集団があまり多くない場合については、ご連携頂いた内容を調査してみます。
はい。母比率がわからない場合は 0.5 でサンプルサイズが最大になるので、それを使います。
母比率不明で0.5を使うなら、「A社を選ぶ、選ばない」で考えても「B社を選ぶ、選ばない」で考えても「C社を選ぶ、選ばない」で考えても同じ必要サンプルサイズになるので、そういう認識でいいんじゃないでしょうか。
ありがとうございます。解決しそうです。
ベストアンサーに選びたいので同じ内容を回答欄に投稿いただけますでしょうか?
解決おめでとうございます!
解決方法をまとめて、「自己解決」として回答してください!
同じように困っている人の貴重な情報になると思います。
回答1件
あなたの回答
tips
プレビュー