質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.39%
統計

統計は、集団現象を数量で把握することです。また、調査で得られた性質や傾向を数量的に表したデータのことをいいます。

Q&A

解決済

1回答

613閲覧

必要なサンプルサイズについて

gardsb

総合スコア14

統計

統計は、集団現象を数量で把握することです。また、調査で得られた性質や傾向を数量的に表したデータのことをいいます。

0グッド

1クリップ

投稿2024/06/04 01:37

編集2024/06/04 04:22

実現したいこと

ある部品についてアンケートをとり、どこの製品を使用しているか調査したいと考えています。

Ex.A社製 40%、B社製 30%、C社製 20%・・・

発生している問題・分からないこと

どのくらいのサンプルサイズが必要なのかわかりませんでした。

必要なサンプルサイズを計算する手法及びその理論について知りたいです。

該当のソースコード

ソースコードはなし。

試したこと・調べたこと

  • teratailやGoogle等で検索した
  • ソースコードを自分なりに変更した
  • 知人に聞いた
  • その他
上記の詳細・結果

調査したところ、約400ほどのサンプルをとれば良いとの記事がいくつかでてきましたが、どういった計算で400という数値がでているのかわかりませんでした。(アンケートの場合は回収率を考慮する必要があるのも知りました。)

母比率の推定についてまとまった記事がありましたが、内容を確認すると2項分布の話なので今回の件では使用できないと考えています。(結果が2つしかない試行ではないため)
https://bellcurve.jp/statistics/course/9129.html

補足

teratail内に存在しないタグの質問とのご指摘をいただきました。
統計というタグが存在します。
ですので、この質問は問題ないかと思いますがいかがでしょうか?

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

winterboum

2024/06/04 05:34

(回答できるだけの知識はないですが) 母集団のサイズと許容誤差が明確でないと答えはでないかと思います。 大雑把に言って、誤差はサンプル数の自乗に反比例します。 母集団のサイズの関係は知見がないので回答ができないわけ。
gardsb

2024/06/04 07:07

なるほど、母集団のサイズと許容誤差を設定する必要があるのですね。 今回は部品の利用者が母集団になりますので、明確な数値はわかりません。 許容誤差については調べてみます。 ありがとうございます。
bsdfan

2024/06/05 00:40

> 母比率の推定についてまとまった記事がありましたが、内容を確認すると2項分布の話なので今回の件では使用できないと考えています。(結果が2つしかない試行ではないため) > https://bellcurve.jp/statistics/course/9129.html 質問にも記載のこちらのサイトが簡潔にまとめられていてわかりやすいと思いました。 今回のケースでも、分けて考えると「A社を選ぶ/選ばない」「B社を選ぶ/選ばない」・・・といった結果が2つの試行を組み合わせているだけと考えればいいです。 あと、上のコメントに関する部分では上記サイトでは無限母集団(十分におおきいサイズの母集団)を想定していることになると思います。
fana

2024/06/05 01:50

全くこれ系の知識がない人の戯言ですが,アンケートのサンプル数っていうのはそういう小難しそうな理屈から決めなきゃならないものなのだろうか? というのが疑問. 例えば「最終的に1票を何%として提示したいか」みたいなところからざっくりと決めちゃうのではダメなのかな? * サンプル数2なら1票が「50%」になる.← とりあえずこれだと不十分に思える * サンプル数100なら1票が「1%」になる.← どうかなー? * サンプル数が10000なら… ← やりすぎ or Not? あと,選択肢の中に「X社のはコレほとんど選ばれてねぇだろうな… せいぜい0.1%くらいかな?」みたいな,なんとなく事前に雰囲気が見積れるようなのがあるとしたら,少なくともこの推測値 0.1% よりも十分に小さい刻みになるように選ばないとダメな気もする.
winterboum

2024/06/05 03:19

アンケートの結果を使ってなにかする 場合で、結果が不正確であったために正しくない決断をしてしまった場合の被害の大きさ によって変わりますね。 例えば 選挙の当確予想 だと、外したときに「NHKってだめだな」って不利益。
gardsb

2024/06/05 08:42

ご回答いただき、ありがとうございます。 →bsdfan 2つの試行を組み合わせているだけと考えた場合、どのような計算になるのかがわかりませんでした。 ご教授いただけないでしょうか? また、母集団があまり多くない場合についてはどのような手法があるかご存知でしょうか? →fana アンケート費用の見積もりであったり、他者に説明するための根拠が必要なので、具体的なサンプルサイズを求めた次第です。 →winterboum アンケートの結果でなにをするかで、許容誤差が変わってくるということですかね。
winterboum

2024/06/05 08:45

> アンケートの結果でなにをするかで、許容誤差が変わってくるということですかね。 ですね
bsdfan

2024/06/05 10:18

> 2つの試行を組み合わせているだけと考えた場合、どのような計算になるのかがわかりませんでした。 計算式はリンク先のそのままです。 > また、母集団があまり多くない場合についてはどのような手法があるかご存知でしょうか? 標本誤差に sqrt((N - n) / (N - 1)) の係数(N: 母集団サイズ、n: サンプルサイズ)がかかるので、解析的には式が出ないと思います。「サンプルサイズ 計算ツール」などで検索すると値を出してくれるサイトが見つかります。
gardsb

2024/06/06 07:19

ご回答ありがとうございます。 今回の場合ですと、「A社を選ぶ、選ばない」という2項分布で考えて計算すればサンプルサイズが求まるという認識であっていますでしょうか? リンク先では事前調査で大まかな母比率の予測がてきている状態の計算例が載っていました。 今回の場合母比率は全くわからないため、p^(推定値)=0.5とすれば最も安全なサンプルサイズを求めることができるという認識であっていますでしょうか? 母集団があまり多くない場合については、ご連携頂いた内容を調査してみます。
bsdfan

2024/06/06 07:40

はい。母比率がわからない場合は 0.5 でサンプルサイズが最大になるので、それを使います。 母比率不明で0.5を使うなら、「A社を選ぶ、選ばない」で考えても「B社を選ぶ、選ばない」で考えても「C社を選ぶ、選ばない」で考えても同じ必要サンプルサイズになるので、そういう認識でいいんじゃないでしょうか。
gardsb

2024/06/06 08:16

ありがとうございます。解決しそうです。 ベストアンサーに選びたいので同じ内容を回答欄に投稿いただけますでしょうか?
can110

2024/06/06 08:22

解決おめでとうございます! 解決方法をまとめて、「自己解決」として回答してください! 同じように困っている人の貴重な情報になると思います。
guest

回答1

0

ベストアンサー

(コメントのやりとりのまとめ)

https://bellcurve.jp/statistics/course/9129.html
質問にすでに書かれているこちらの内容がそのまま使えます。
(事前の母集団の分布が不明な場合はワーストケースになる 0.5 を使います)

内容を確認すると2項分布の話なので今回の件では使用できないと考えています。(結果が2つしかない試行ではないため)

「どこの製品を使用しているか」の回答は「A社」「B社」「C社」... になるとおもいますが、「A社 / それ以外」と考えれば結果が二つのアンケートです。(B社, C社についても同様に考えればいいです)
なので、上記リンク先がそのまま使えます。

母集団のサイズについては、上記リンク先は無限母集団を想定していますが、有限母集団の場合は標本誤差に sqrt((N - n) / (N - 1)) の係数(N: 母集団サイズ、n: サンプルサイズ)がかかってくるので、n の値は解析的には求められず、なんらかの計算ソフトが必要です。(「サンプルサイズ 計算ツール」等で検索すればみつかります)
有限母集団での補正係数については、同一のサイトなら https://bellcurve.jp/statistics/course/8003.html に簡単な記載があります。

投稿2024/06/06 08:56

bsdfan

総合スコア4749

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.39%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問