teratail header banner
teratail header banner
質問するログイン新規登録

回答編集履歴

2

追記

2020/10/13 04:44

投稿

jeanbiego
jeanbiego

スコア3966

answer CHANGED
@@ -48,4 +48,22 @@
48
48
  plt.savefig("test.png",dpi=100)
49
49
  ```
50
50
 
51
- ![イメージ説明](9905318df9d8633832ac9db871a9a469.png)
51
+ ![イメージ説明](9905318df9d8633832ac9db871a9a469.png)
52
+
53
+
54
+ あ、もしかして単にデータ全体の信頼区間を求めたいということであれば下記のようにもできます。
55
+ ```python3
56
+ from scipy import stats
57
+ import math
58
+ import statistics
59
+
60
+ data = [26.037666140460175, 26.035329693820763, 26.03250951997295, 26.034479896627285, 26.03071502375869, 25.8991498669353]
61
+ n = len(data) #サンプルサイズ
62
+ mean = statistics.mean(data)
63
+ variance = statistics.variance(data)
64
+ se = math.sqrt(variance/n) #標準誤差
65
+
66
+ bottom, up = stats.norm.interval(alpha=0.95, loc=mean, scale=se)
67
+ print('{:.2f} < x < {:.2f}'.format(bottom, up))
68
+ # 25.97 < x < 26.06
69
+ ```

1

修正

2020/10/13 04:44

投稿

jeanbiego
jeanbiego

スコア3966

answer CHANGED
@@ -1,7 +1,7 @@
1
1
  > とくに何も設定しなくても、値が複数ある場合は、信頼区間つき線グラフとなると考えられる。
2
2
 
3
3
  参考にされたサイトにも上のように書いてあるとおり、同じタイミング(時間)に複数のデータがあれば信頼区間がつきます。
4
- これは信頼区間の定義からして当然で、信頼区間とは「母集団の真の値が含まれることが信頼できる区間」です。同じタイミングにデータが複数あれば信頼区間を計算できますが、1個ずつしかないのであればそもそも信頼区間という考え方をしません。
4
+ これは信頼区間の定義からして当然で、信頼区間とは「母集団の真の値が含まれることが信頼できる区間」です。同じタイミングにデータが複数あればその平均や分散から信頼区間を計算できますが、1個ずつしかないのであればそもそも信頼区間という考え方をしません。
5
5
  信頼区間についてはググれば親切なサイトがたくさんあるので、探してみてください。
6
6
 
7
7
  貼られたデータを元に、乱数でデータを増やしてみました。このように同時刻に複数のデータがあれば信頼区間が描画されます。