質問編集履歴

コード全体の記述を行いました。

2020/05/12 01:38

投稿

scienceman

スコア8

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -1,4 +1,4 @@
-Kaggleコンペ　住宅価格予想について、エラーの原因が特定できません。
+```Kaggleコンペ　住宅価格予想について、エラーの原因が特定できません。
 AIacademyと言うサイトのコード、カリキュラムを参考にしてます。
@@ -8,7 +8,215 @@
+```ここに言語を入力　Python
+コード
+#データの読み込み
+import numpy as np
+import pandas as pd
+train= pd.read_csv("/kaggle/input/house-prices-advanced-regression-techniques/train.csv")
+test = pd.read_csv("/kaggle/input/house-prices-advanced-regression-techniques/test.csv")
+train.head()
+train.info()
+print(train.shape,test.shape)
+#欠損地の多いデータを消す
+train = train.drop('Alley',axis=1).drop('FireplaceQu',axis=1).drop('PoolQC',axis=1).drop('Fence',axis=1).drop('MiscFeature',axis=1)
+test =test.drop('Alley',axis=1).drop('FireplaceQu',axis=1).drop('PoolQC',axis=1).drop('Fence',axis=1).drop('MiscFeature',axis=1)
+train_id = train['Id']
+test_id = test['Id']
+y_train = train['SalePrice']
+x_train = train.drop(['Id','SalePrice'],axis=1)
+x_test = test.drop('Id',axis=1)
+#欠損値を中央値で補完
+x_train = x_train.fillna(x_train.median())
+x_test = x_test.fillna(x_test.median())
+x_train.info()
+#object型の欠損値をmodeで埋める
+for i in range(x_train.shape[1]):
+    if x_train.iloc[:,i].dtype == object:
+        mode = x_train.mode()[x_train.columns.values[i]].values
+        for j in range(x_train.shape[0]):
+            if x_train.isnull().iloc[j,i]==True:
+                x_train.iloc[j,i] =mode
+for i in range(x_test.shape[1]):
+    if x_test.iloc[:,i].dtype == object:
+        mode = x_test.mode()[x_test.columns.values[i]].values
+        for j in range(x_test.shape[0]):
+            if x_test.isnull().iloc[j,i]==True:
+                x_test.iloc[j,i] = mode
+x_train.isnull().sum().sum()
+#ラベルエンコーディング
+from sklearn.preprocessing import LabelEncoder
+le = LabelEncoder()
+#ラベルエンコーダー(訓練セット）
+for i in range(x_train.shape[1]):
+    if x_train.iloc[:,i].dtypes == object:
+        le.fit(list(x_train[x_train.columns.values[i]].values))
+        x_train[x_train.columns.values[i]] = le.transform(list(x_train[x_train.columns.values[i]].values))
+#ラベルエンコーダー(テストセット）
+for i in range(x_test.shape[1]):
+    if x_test.iloc[:,i].dtypes == object:
+        le.fit(list(x_test[x_test.columns.values[i]].values))
+        x_test[x_test.columns.values[i]] = le.transform(list(x_test[x_test.columns.values[i]].values))
+x_train.info()
+#特徴量の削減
+from sklearn.feature_selection import SelectKBest,f_regression
+selector = SelectKBest(score_func=f_regression,k=5)
+selector.fit(x_train,y_train)
+print(selector.get_support())
+x_train_selected =pd.DataFrame({'OverallQual':x_train['OverallQual'],'ExterQual':x_train['ExterQual'],'GrLivArea':x_train['GrLivArea'],'GarageCars':x_train['GarageCars'],'GarageArea':x_train['GarageArea']})
+x_test_selected = pd.DataFrame({'OverallQual':x_test['OverallQual'],'ExterQual':x_test['ExterQual'],'GrLivArea':x_test['GrLivArea'],'GarageCars':x_test['GarageCars'],'GarageArea':x_test['GarageArea']})
+x_train_selected.head()
+#訓練セットを分ける
+from sklearn.model_selection import train_test_split
+xp_train,xp_test,yp_train,yp_test = train_test_split(x_train_selected,y_train,test_size=0.3,random_state=1)
+#ランダムフォレストとサポートベクター回帰（SVR）を読み込み、グリッドサーチを行う
+from sklearn.svm import SVR
+from sklearn.ensemble import RandomForestRegressor
+forest = RandomForestRegressor
+svr =SVR()
+parameters_forest = {'n_estimators':[100,500,1000,3000],'max-depth':[3,6,12]}
+parameters_svr = {'C':[0.1,10,1000],'epsilzon':[0.01,0.1,0.5]}
+#グリッドサーチを行う（エラー発生）
 from sklearn.model_selection import GridSearchCV
@@ -84,6 +292,8 @@
-初心者で対処の仕方など、よくわかってないので試したことは特にありません。コードのスペルミスはないか２度コード全体のスペルチェックはしてます。
+初心者で対処の仕方など、よくわかってないので試したことは特にありません。
+コードのスペルミスはないか２度コード全体のスペルチェックはしてます。
 このエラーはどんな意味で、対応法をを知っている方いましたら、解答よろしくお願いします。