前提
R言語でパッケージdslabsのheights データセットで、女性の標本平均と不偏分散から95%信頼区間を得て母平均がその中に含まれるかという試行を行っているのですが、母平均が信頼区間内に含まれる割合が低いように思われます。本来は0.95になるのではないでしょうか。
実現したいこと
- 母平均が信頼区間内に含まれる割合を正しく求める
発生している問題・エラーメッセージ
母平均が信頼区間内に含まれる割合が1割2分程度になってしまう
該当のソースコード
R
1install.packages("Rfast") 2library(Rfast) 3N <- 10000 #試行を行う回数 4table <- subset(dslabs::heights, dslabs::heights$sex == "Female") 5data <- replicate(N, sample_n(tbl = table, size = 50)$height) 6ave <- colMeans(data[,1:N]) #標本平均 7s <- Rfast::colVars(data[,1:N]) #不偏分散 8cnt <- 0 9Ave <- mean(ave) 10for (i in 1:N) { 11 left <- ave[i] - qnorm(1-0.05/2) * sqrt(s[i])/sqrt(N) 12 right <- ave[i] + qnorm(1-0.05/2) * sqrt(s[i])/sqrt(N) 13 if (left <= Ave & Ave <= right) { 14 cnt = cnt + 1 15 } 16} 17cnt/N #求める割合
あなたの回答
tips
プレビュー