質問編集履歴

1

csvファイルの代わりとなる図の添付、各コードの追加掲載

2019/12/10 06:14

投稿

SHS
SHS

スコア7

test CHANGED
File without changes
test CHANGED
@@ -19,6 +19,30 @@
19
19
  y.shape #(20,)
20
20
 
21
21
  #X, yともにバイナリ
22
+
23
+ ```
24
+
25
+ ファイルの載せ方がわからなかったので図を載せます。????
26
+
27
+ X????
28
+
29
+ ![イメージ説明](b7977e1d2fec9c0a94eac59cd9f656a9.png)
30
+
31
+
32
+
33
+ y????
34
+
35
+ ![イメージ説明](7379cbfb013658d8aa5cfda0f124aac8.png)
36
+
37
+
38
+
39
+ ### エラー発生コード
40
+
41
+ ```python
42
+
43
+ selector = SelectKBest(score_func=f_regression, k=num_select)
44
+
45
+ selector.fit(X, y)
22
46
 
23
47
  ```
24
48
 
@@ -88,6 +112,28 @@
88
112
 
89
113
 
90
114
 
115
+ ちなみに、特徴量の分散や同じ特徴量が存在するのかを確認してみたところ、
116
+
117
+ ```python
118
+
119
+ #特徴量の分散や同じ特徴量が存在するのかを確認
120
+
121
+ from sklearn.feature_selection import VarianceThreshold
122
+
123
+ sel = VarianceThreshold(threshold=0)
124
+
125
+ sel.fit(X)
126
+
127
+
128
+
129
+ # get_supportで保持するデータのみをTrue値、そうでないものはFalse値を返します
130
+
131
+ print(sum(sel.get_support())) #20
132
+
133
+ ```
134
+
135
+ となり、同じ特徴量は存在しないことが確認できています。
136
+
91
137
 
92
138
 
93
139
  ### 謝辞