質問編集履歴

3

2020/02/11 09:58

投稿

watzkang98
watzkang98

スコア8

test CHANGED
File without changes
test CHANGED
@@ -12,9 +12,11 @@
12
12
 
13
13
  エラーメッセージから、yの値がstr型ではできないアルゴリズムを試行している感じはあるのですが...
14
14
 
15
- このエラーの回避はどうすればいいのでしょうか?
15
+ ~~このエラーの回避はどうすればいいのでしょうか?
16
+
16
-
17
+ ~~
18
+
17
-
19
+ 追)エラー回避ができました。そうなると、そもそもなぜこのエラーが起こったかが問題になります。試したことのところに記載してあります。
18
20
 
19
21
  ### 発生している問題・エラーメッセージ
20
22
 

2

細部

2020/02/11 09:58

投稿

watzkang98
watzkang98

スコア8

test CHANGED
File without changes
test CHANGED
@@ -418,8 +418,12 @@
418
418
 
419
419
  ```
420
420
 
421
- 見た感じ、書籍や参考URLからClassfierの件数が多くなっていることがわかりますこれは、
421
+ 見た感じ、書籍や参考URLからClassfierの件数が多くなっていることがわかります。例えばCategoricalNB など。
422
+
423
+ これは、
422
424
 
423
425
  all_estimators(type_filter="classifier")
424
426
 
425
427
  のclasssfierでフィルタされる、そもそものアルゴリズムが増えたという認識であっているでしょうか?
428
+
429
+ それとも、フィルタが間違っていたのでしょうか?

1

色々

2020/02/11 09:57

投稿

watzkang98
watzkang98

スコア8

test CHANGED
@@ -1 +1 @@
1
- python sklearnのall_estimators()でのエラー
1
+ python sklearnのall_estimators(type_filter="classifier")での識別機の件数について
test CHANGED
@@ -317,3 +317,109 @@
317
317
 
318
318
 
319
319
  ```
320
+
321
+
322
+
323
+ ###試したこと
324
+
325
+ 該当部分をいかに変更しました。これにより、エラー無視で処理が行なえます。
326
+
327
+ ```
328
+
329
+ for (name, algorithm) in allAlgorithms:
330
+
331
+ try:
332
+
333
+ clf = algorithm()
334
+
335
+ clf.fit(x_train, y_train)
336
+
337
+ y_pred = clf.predict(x_test)
338
+
339
+ print(name,"の正解率=", accuracy_score(y_test, y_pred))
340
+
341
+ except:
342
+
343
+ pass
344
+
345
+ ```
346
+
347
+ その結果が、以下となります。
348
+
349
+ ```
350
+
351
+ AdaBoostClassifier の正解率= 0.7666666666666667
352
+
353
+ BaggingClassifier の正解率= 0.9666666666666667
354
+
355
+ BernoulliNB の正解率= 0.3
356
+
357
+ CalibratedClassifierCV の正解率= 0.9
358
+
359
+ CategoricalNB の正解率= 1.0
360
+
361
+ ComplementNB の正解率= 0.6666666666666666
362
+
363
+ DecisionTreeClassifier の正解率= 0.8666666666666667
364
+
365
+ DummyClassifier の正解率= 0.36666666666666664
366
+
367
+ ExtraTreeClassifier の正解率= 0.8333333333333334
368
+
369
+ ExtraTreesClassifier の正解率= 0.9666666666666667
370
+
371
+ GaussianNB の正解率= 0.9666666666666667
372
+
373
+ GaussianProcessClassifier の正解率= 1.0
374
+
375
+ GradientBoostingClassifier の正解率= 0.9666666666666667
376
+
377
+ HistGradientBoostingClassifier の正解率= 0.8666666666666667
378
+
379
+ KNeighborsClassifier の正解率= 1.0
380
+
381
+ LabelPropagation の正解率= 1.0
382
+
383
+ LabelSpreading の正解率= 1.0
384
+
385
+ LinearDiscriminantAnalysis の正解率= 1.0
386
+
387
+ LinearSVC の正解率= 0.9333333333333333
388
+
389
+ LogisticRegression の正解率= 1.0
390
+
391
+ LogisticRegressionCV の正解率= 1.0
392
+
393
+ MLPClassifier の正解率= 1.0
394
+
395
+ MultinomialNB の正解率= 0.9666666666666667
396
+
397
+ NearestCentroid の正解率= 1.0
398
+
399
+ NuSVC の正解率= 1.0
400
+
401
+ PassiveAggressiveClassifier の正解率= 0.8666666666666667
402
+
403
+ Perceptron の正解率= 0.6666666666666666
404
+
405
+ QuadraticDiscriminantAnalysis の正解率= 1.0
406
+
407
+ RadiusNeighborsClassifier の正解率= 1.0
408
+
409
+ RandomForestClassifier の正解率= 0.9333333333333333
410
+
411
+ RidgeClassifier の正解率= 0.8666666666666667
412
+
413
+ RidgeClassifierCV の正解率= 0.8666666666666667
414
+
415
+ SGDClassifier の正解率= 0.6666666666666666
416
+
417
+ SVC の正解率= 1.0
418
+
419
+ ```
420
+
421
+ 見た感じ、書籍や参考URLからClassfierの件数が多くなっていることがわかりますが、これは、
422
+
423
+ all_estimators(type_filter="classifier")
424
+
425
+ のclasssfierでフィルタされる、そもそものアルゴリズムが増えたという認識であっているでしょうか?