機械学習をしていて、説明変数がたくさんあります。
下記のソースコードで説明変数全体をオートスケーリングして内容を確認したところ、すべてのサンプルでnanと出てきてしまう変数がいくつかあります。
X = (OriginalX - OriginalX.mean(axis=0)) / OriginalX.std(axis=0, ddof=1)
元のcsvファイルを確認したところ、欠損値はないようですが、0, 0, 0, 1, 0, 0,...みたいなスパースな変数は割りとあります。例えば半数以上が同じ数字の説明変数などは削った方がよいでしょうか。よろしくお願いいたします。

回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/04/02 21:20