Pythonで、ロジスティック回帰分析を行う際に、変数の標準化をしようと思っているのですが、
エラーがでてしまいます。
どなたか解消方法をご存知の方がいらっしゃれば教えていただけますか。
まず、
目的変数と、説明変数を定義。
Python
1 2columnList = list(train_query.columns) 3 4columnList.remove('num_orders') 5 6X = train_query.loc[:,columnList] 7y = train_query.loc[:, ['num_orders']] 8 9# モデル構築用データ、モデル検証用データに分割(80:20に分割) 10X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) 11 12print(X_train.shape) 13print(X_test.shape) 14 15print(y_train.shape) 16print(y_test.shape) 17
そのあと標準化しようとすると下記のエラーがでてしまします。
TYPE_Aという、エラーがでますが、データフレームの変数にTYPE_Aはなく、
(ダミー変数化されているため)
train_queryのカラム名は下記のようになっており、
TYPE_Aはありません。
Python
1Index(['week', 'checkout_price', 'base_price', 'emailer_for_promotion', 2 'homepage_featured', 'num_orders', 'op_area', 'TYPE_B', 'TYPE_C', 3 'Biryani', 'Desert', 'Extras', 'Fish', 'Other Snacks', 'Pasta', 'Pizza', 4 'Rice Bowl', 'Salad', 'Sandwich', 'Seafood', 'Soup', 'Starters', 5 'Indian', 'Italian', 'Thai', 'B', 'C', 'D', 'E'], 6 dtype='object')
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/10/20 09:12