質問編集履歴

4

追記

2018/11/05 08:11

投稿

_hh
_hh

スコア79

test CHANGED
File without changes
test CHANGED
@@ -495,3 +495,71 @@
495
495
  x9 NaN
496
496
 
497
497
  dtype: float64]]
498
+
499
+
500
+
501
+ 【デバッグ】
502
+
503
+ ```python
504
+
505
+ コード
506
+
507
+ ``
508
+
509
+
510
+
511
+ ちなみに、出力の差分としましては、うまくいっているデータの時は、
512
+
513
+ 関数Mahala2の中でデバッグ表示しているベクトルについて、
514
+
515
+
516
+
517
+ vec is [[-0.40788125]
518
+
519
+ [ 0.00139516]
520
+
521
+ [ 0.00359367]
522
+
523
+ [ 0.00180594]
524
+
525
+ [ 0.00321283]]
526
+
527
+
528
+
529
+ となっているのですが、NGの時は以下の様になっております。
530
+
531
+
532
+
533
+ vec is [[x1_E 0.000891
534
+
535
+ dtype: float64]
536
+
537
+ [x3_I 0.002092
538
+
539
+ dtype: float64]
540
+
541
+ [x2_K 0.000432
542
+
543
+ dtype: float64]
544
+
545
+ [x4 0.011538
546
+
547
+ dtype: float64]
548
+
549
+ [x1_F 0.000403
550
+
551
+ dtype: float64]
552
+
553
+ [x1_D 0.002242
554
+
555
+ dtype: float64]
556
+
557
+ [x9 0.010253
558
+
559
+ dtype: float64]
560
+
561
+ [-1.0186953967441772]
562
+
563
+ [x1_C 0.001979
564
+
565
+ dtype: float64]]`

3

変更

2018/11/05 08:11

投稿

_hh
_hh

スコア79

test CHANGED
File without changes
test CHANGED
@@ -8,9 +8,11 @@
8
8
 
9
9
  【環境】Window10 64bit, chrome
10
10
 
11
+
12
+
13
+
14
+
11
- 【コード】
15
+ ```Python
12
-
13
-
14
16
 
15
17
 
16
18
 
@@ -354,6 +356,10 @@
354
356
 
355
357
  plt.grid()
356
358
 
359
+ ```
360
+
361
+
362
+
357
363
 
358
364
 
359
365
  【出力】

2

修正

2018/11/05 06:35

投稿

_hh
_hh

スコア79

test CHANGED
File without changes
test CHANGED
@@ -156,14 +156,6 @@
156
156
 
157
157
  df2 = pd.get_dummies(d)
158
158
 
159
- #print(df2)
160
-
161
- #df2['x6'].unique()
162
-
163
- #df2.head()
164
-
165
- #df2.columns
166
-
167
159
  model = step_aic(smf.ols,['x4','x5','x6','x7','x8','x9','x10','x1_B','x1_C','x1_D','x1_E','x1_F','x1_H','x2_A','x2_H','x2_K','x2_R','x2_S','x2_X','x3_C','x3_I','x3_O','x3_X'],['y1'],data=df2)
168
160
 
169
161
 
@@ -292,8 +284,6 @@
292
284
 
293
285
  for hl in hl_l:
294
286
 
295
- #X = sp.array([1, hl, ml, wl, prw, ppl, gw])
296
-
297
287
  X = sp.array([1,x1_E, x3_I, x2_K, x4, x1_F, x1_D, x9, hl, x1_C])
298
288
 
299
289
  hat_y.append(X.dot(res.params))
@@ -326,8 +316,6 @@
326
316
 
327
317
  D2 = sp.array(D2)
328
318
 
329
- #print(D2.shape)
330
-
331
319
 
332
320
 
333
321
 

1

追記

2018/11/05 06:33

投稿

_hh
_hh

スコア79

test CHANGED
File without changes
test CHANGED
@@ -1,4 +1,4 @@
1
- Pythonのjupyter notebookで、UCI machine learning repositoryのあるデータ('flare.data2.txt')を重回帰分析すると、エラーが出ます。同じ手順で、"abalone.data.txt"というデータを分析した際には全く問題が無いのですが、なぜかわからずにおります。
1
+ Pythonのjupyter notebookで、UCI machine learning repositoryのあるデータ('flare.data2.txt')を重回帰分析しておりま。自作関数によりStepAICで変数選択を行ったのち、信頼区間・予測区間を求めようとすると、エラーが出ます。同じ手順で、"abalone.data.txt"というデータを分析した際には全く問題が無いのですが、なぜかわからずにおります。
2
2
 
3
3
  エラーが出ているのは、マハラノビスの距離を求めるところで、分散共分散行列の逆行列がNANになってしまっている(下記の"mahara is..."以下の出力)ためなのですが、なぜそのようになるのかが分かりません。
4
4