知りたいこと
現在、機械学習のチュートリアルとして家賃を予測する回帰問題に取り組んでいるのですが、
欠損値の処理(drop)をしたところで訓練データの特徴数が62個、テストデータの特徴数が47個となりました。学習データにある特徴がテストデータでは抜け落ちているような状態です。
そこで質問なのですが、特徴の数が一致していない状態で学習に取り掛かっても良いのでしょうか。
また、各特徴でデータ数が異なる状態でも学習・予測をして良いのかということも知りたいです。
該当のソースコード
Python
1#欠損値処理前のデータサイズ 2訓練データ 3print(train.shape) 4(1460, 81) 5 6テストデータ 7print(test.shape) 8(1459, 80) 9 10 11#欠損値処理後のデータサイズ 12訓練データ 13print(train.shape) 14(1460, 62) 15 16テストデータ 17print(test.shape) 18(1459, 47)
何卒、ご回答の程よろしくお願いいたします。

バッドをするには、ログインかつ
こちらの条件を満たす必要があります。