質問編集履歴
4
追記
test
CHANGED
File without changes
|
test
CHANGED
@@ -495,3 +495,71 @@
|
|
495
495
|
x9 NaN
|
496
496
|
|
497
497
|
dtype: float64]]
|
498
|
+
|
499
|
+
|
500
|
+
|
501
|
+
【デバッグ】
|
502
|
+
|
503
|
+
```python
|
504
|
+
|
505
|
+
コード
|
506
|
+
|
507
|
+
``
|
508
|
+
|
509
|
+
|
510
|
+
|
511
|
+
ちなみに、出力の差分としましては、うまくいっているデータの時は、
|
512
|
+
|
513
|
+
関数Mahala2の中でデバッグ表示しているベクトルについて、
|
514
|
+
|
515
|
+
|
516
|
+
|
517
|
+
vec is [[-0.40788125]
|
518
|
+
|
519
|
+
[ 0.00139516]
|
520
|
+
|
521
|
+
[ 0.00359367]
|
522
|
+
|
523
|
+
[ 0.00180594]
|
524
|
+
|
525
|
+
[ 0.00321283]]
|
526
|
+
|
527
|
+
|
528
|
+
|
529
|
+
となっているのですが、NGの時は以下の様になっております。
|
530
|
+
|
531
|
+
|
532
|
+
|
533
|
+
vec is [[x1_E 0.000891
|
534
|
+
|
535
|
+
dtype: float64]
|
536
|
+
|
537
|
+
[x3_I 0.002092
|
538
|
+
|
539
|
+
dtype: float64]
|
540
|
+
|
541
|
+
[x2_K 0.000432
|
542
|
+
|
543
|
+
dtype: float64]
|
544
|
+
|
545
|
+
[x4 0.011538
|
546
|
+
|
547
|
+
dtype: float64]
|
548
|
+
|
549
|
+
[x1_F 0.000403
|
550
|
+
|
551
|
+
dtype: float64]
|
552
|
+
|
553
|
+
[x1_D 0.002242
|
554
|
+
|
555
|
+
dtype: float64]
|
556
|
+
|
557
|
+
[x9 0.010253
|
558
|
+
|
559
|
+
dtype: float64]
|
560
|
+
|
561
|
+
[-1.0186953967441772]
|
562
|
+
|
563
|
+
[x1_C 0.001979
|
564
|
+
|
565
|
+
dtype: float64]]`
|
3
変更
test
CHANGED
File without changes
|
test
CHANGED
@@ -8,9 +8,11 @@
|
|
8
8
|
|
9
9
|
【環境】Window10 64bit, chrome
|
10
10
|
|
11
|
+
|
12
|
+
|
13
|
+
|
14
|
+
|
11
|
-
|
15
|
+
```Python
|
12
|
-
|
13
|
-
|
14
16
|
|
15
17
|
|
16
18
|
|
@@ -354,6 +356,10 @@
|
|
354
356
|
|
355
357
|
plt.grid()
|
356
358
|
|
359
|
+
```
|
360
|
+
|
361
|
+
|
362
|
+
|
357
363
|
|
358
364
|
|
359
365
|
【出力】
|
2
修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -156,14 +156,6 @@
|
|
156
156
|
|
157
157
|
df2 = pd.get_dummies(d)
|
158
158
|
|
159
|
-
#print(df2)
|
160
|
-
|
161
|
-
#df2['x6'].unique()
|
162
|
-
|
163
|
-
#df2.head()
|
164
|
-
|
165
|
-
#df2.columns
|
166
|
-
|
167
159
|
model = step_aic(smf.ols,['x4','x5','x6','x7','x8','x9','x10','x1_B','x1_C','x1_D','x1_E','x1_F','x1_H','x2_A','x2_H','x2_K','x2_R','x2_S','x2_X','x3_C','x3_I','x3_O','x3_X'],['y1'],data=df2)
|
168
160
|
|
169
161
|
|
@@ -292,8 +284,6 @@
|
|
292
284
|
|
293
285
|
for hl in hl_l:
|
294
286
|
|
295
|
-
#X = sp.array([1, hl, ml, wl, prw, ppl, gw])
|
296
|
-
|
297
287
|
X = sp.array([1,x1_E, x3_I, x2_K, x4, x1_F, x1_D, x9, hl, x1_C])
|
298
288
|
|
299
289
|
hat_y.append(X.dot(res.params))
|
@@ -326,8 +316,6 @@
|
|
326
316
|
|
327
317
|
D2 = sp.array(D2)
|
328
318
|
|
329
|
-
#print(D2.shape)
|
330
|
-
|
331
319
|
|
332
320
|
|
333
321
|
|
1
追記
test
CHANGED
File without changes
|
test
CHANGED
@@ -1,4 +1,4 @@
|
|
1
|
-
Pythonのjupyter notebookで、UCI machine learning repositoryのあるデータ('flare.data2.txt')を重回帰分析すると、エラーが出ます。同じ手順で、"abalone.data.txt"というデータを分析した際には全く問題が無いのですが、なぜかわからずにおります。
|
1
|
+
Pythonのjupyter notebookで、UCI machine learning repositoryのあるデータ('flare.data2.txt')を重回帰分析しております。自作関数によりStepAICで変数選択を行ったのち、信頼区間・予測区間を求めようとすると、エラーが出ます。同じ手順で、"abalone.data.txt"というデータを分析した際には全く問題が無いのですが、なぜかわからずにおります。
|
2
2
|
|
3
3
|
エラーが出ているのは、マハラノビスの距離を求めるところで、分散共分散行列の逆行列がNANになってしまっている(下記の"mahara is..."以下の出力)ためなのですが、なぜそのようになるのかが分かりません。
|
4
4
|
|