質問編集履歴

csvファイルの代わりとなる図の添付、各コードの追加掲載

2019/12/10 06:14

投稿

スコア7

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -10,7 +10,19 @@
 y.shape #(20,)
 #X, yともにバイナリ
 ```
+ファイルの載せ方がわからなかったので図を載せます。????
+X????
+![イメージ説明](b7977e1d2fec9c0a94eac59cd9f656a9.png)
+y????
+![イメージ説明](7379cbfb013658d8aa5cfda0f124aac8.png)
+### エラー発生コード
+```python
+selector = SelectKBest(score_func=f_regression, k=num_select)
+selector.fit(X, y)
+```
 ### 該当エラー
 ```
 /usr/local/Caskroom/miniconda/base/lib/python3.7/site-packages/sklearn/feature_selection/univariate_selection.py in fit(self, X, y)
@@ -43,6 +55,17 @@
 ```
 も書くことにしましたが、すると、"typeはdではなくlでないといけない"と、更にエラーが発生しました。
+ちなみに、特徴量の分散や同じ特徴量が存在するのかを確認してみたところ、
+```python
+#特徴量の分散や同じ特徴量が存在するのかを確認
+from sklearn.feature_selection import VarianceThreshold
+sel = VarianceThreshold(threshold=0)
+sel.fit(X)
+# get_supportで保持するデータのみをTrue値、そうでないものはFalse値を返します
+print(sum(sel.get_support())) #20
+```
+となり、同じ特徴量は存在しないことが確認できています。
 ###　謝辞
 自分では埒が明かないように感じ、今回質問させていただきました。どうかよろしくお願いいたします。