質問編集履歴
1
csvファイルの代わりとなる図の添付、各コードの追加掲載
test
CHANGED
File without changes
|
test
CHANGED
@@ -19,6 +19,30 @@
|
|
19
19
|
y.shape #(20,)
|
20
20
|
|
21
21
|
#X, yともにバイナリ
|
22
|
+
|
23
|
+
```
|
24
|
+
|
25
|
+
ファイルの載せ方がわからなかったので図を載せます。????
|
26
|
+
|
27
|
+
X????
|
28
|
+
|
29
|
+
![イメージ説明](b7977e1d2fec9c0a94eac59cd9f656a9.png)
|
30
|
+
|
31
|
+
|
32
|
+
|
33
|
+
y????
|
34
|
+
|
35
|
+
![イメージ説明](7379cbfb013658d8aa5cfda0f124aac8.png)
|
36
|
+
|
37
|
+
|
38
|
+
|
39
|
+
### エラー発生コード
|
40
|
+
|
41
|
+
```python
|
42
|
+
|
43
|
+
selector = SelectKBest(score_func=f_regression, k=num_select)
|
44
|
+
|
45
|
+
selector.fit(X, y)
|
22
46
|
|
23
47
|
```
|
24
48
|
|
@@ -88,6 +112,28 @@
|
|
88
112
|
|
89
113
|
|
90
114
|
|
115
|
+
ちなみに、特徴量の分散や同じ特徴量が存在するのかを確認してみたところ、
|
116
|
+
|
117
|
+
```python
|
118
|
+
|
119
|
+
#特徴量の分散や同じ特徴量が存在するのかを確認
|
120
|
+
|
121
|
+
from sklearn.feature_selection import VarianceThreshold
|
122
|
+
|
123
|
+
sel = VarianceThreshold(threshold=0)
|
124
|
+
|
125
|
+
sel.fit(X)
|
126
|
+
|
127
|
+
|
128
|
+
|
129
|
+
# get_supportで保持するデータのみをTrue値、そうでないものはFalse値を返します
|
130
|
+
|
131
|
+
print(sum(sel.get_support())) #20
|
132
|
+
|
133
|
+
```
|
134
|
+
|
135
|
+
となり、同じ特徴量は存在しないことが確認できています。
|
136
|
+
|
91
137
|
|
92
138
|
|
93
139
|
### 謝辞
|