teratail header banner
teratail header banner
質問するログイン新規登録

質問編集履歴

1

csvファイルの代わりとなる図の添付、各コードの追加掲載

2019/12/10 06:14

投稿

SHS
SHS

スコア7

title CHANGED
File without changes
body CHANGED
@@ -10,7 +10,19 @@
10
10
  y.shape #(20,)
11
11
  #X, yともにバイナリ
12
12
  ```
13
+ ファイルの載せ方がわからなかったので図を載せます。????
14
+ X????
15
+ ![イメージ説明](b7977e1d2fec9c0a94eac59cd9f656a9.png)
13
16
 
17
+ y????
18
+ ![イメージ説明](7379cbfb013658d8aa5cfda0f124aac8.png)
19
+
20
+ ### エラー発生コード
21
+ ```python
22
+ selector = SelectKBest(score_func=f_regression, k=num_select)
23
+ selector.fit(X, y)
24
+ ```
25
+
14
26
  ### 該当エラー
15
27
  ```
16
28
  /usr/local/Caskroom/miniconda/base/lib/python3.7/site-packages/sklearn/feature_selection/univariate_selection.py in fit(self, X, y)
@@ -43,6 +55,17 @@
43
55
  ```
44
56
  も書くことにしましたが、すると、"typeはdではなくlでないといけない"と、更にエラーが発生しました。
45
57
 
58
+ ちなみに、特徴量の分散や同じ特徴量が存在するのかを確認してみたところ、
59
+ ```python
60
+ #特徴量の分散や同じ特徴量が存在するのかを確認
61
+ from sklearn.feature_selection import VarianceThreshold
62
+ sel = VarianceThreshold(threshold=0)
63
+ sel.fit(X)
46
64
 
65
+ # get_supportで保持するデータのみをTrue値、そうでないものはFalse値を返します
66
+ print(sum(sel.get_support())) #20
67
+ ```
68
+ となり、同じ特徴量は存在しないことが確認できています。
69
+
47
70
  ### 謝辞
48
71
  自分では埒が明かないように感じ、今回質問させていただきました。どうかよろしくお願いいたします。