前提・実現したいこと
機械学習(深層学習)をしようと思って、30列あるCSVファイルを学習用と検証用に分け、Pandasで、ある列に存在する質的データをonehot表現に変更したつもりだったのですが、なぜかエラーが出てしまいました。
発生している問題・エラーメッセージ
could not convert string to float
該当のソースコード
#学習用データのラベルを決める。 train = pd.read_csv("train.csv", encoding = "utf-8" ,sep = ",", header = None) X_train = train[[1, 2, 3, 4, 5, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 , 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29]] y_train = train[6] #検証用データのラベルを決める。 test = pd.read_csv("test.csv" , encoding = "utf-8" ,sep =",", header = None) X_test = test[[1, 2, 3, 4, 5, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 ,18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29]] y_test = test[6] #学習用データと検証用データにある質的データ(17列目,28列目,29列目)をonehot表現に。 pd.get_dummies(X_train,columns=[17]) pd.get_dummies(X_train,columns=[28]) pd.get_dummies(X_train,columns=[29]) pd.get_dummies(X_test,columns=[17]) pd.get_dummies(X_test,columns=[28]) pd.get_dummies(X_test,columns=[29]) . . . . . .
補足
pd.get_dummiesの使い方が間違っているのですかね・・・・?
回答1件
あなたの回答
tips
プレビュー