pythonを用いた機械学習において、量的変数を質的変数に変換する方法に苦慮しています!
course distance difference baba horse_weight 2 1600 -0.6 3 512 2 2400 0.3 5 486 1 1600 2.3 3 454 1 1600 0.4 3 494 2 1800 -0.2 5 494 1 1600 2 3 474
上記の、競馬関連情報のcsvファイルの内容は、以下のとおりでございます。
course(コース) : コースの状態を表す、1または2の カテゴリー変数
distance(距離) : 1600メートルや、2400メートル等の メートルを意味する 量的変数
difference(着差): 1着の馬がゴールしてから、何秒かかってゴールしたかの 秒数を意味する 量的変数
baba (馬場) : 馬場の状態を表す、1から5の カテゴリー変数
horse_weight(馬体重): 馬の体重を表す、kgを意味する 量的変数
#######################################
これらのデータを用いて、機械学習を行おうとする場合に、標準化を行いますが、その前に、量的変数を質的変数に変換する
必要が有ると思います。
量的変数と質的変数が混在すると、うまく機械学習が出来ないと成書では学びました。
今更ながらではございますが、本当なのでしょうか?
小生の出来る範囲で、量的変数を質的変数に変換する方法を探したのですが、なかなか見つかりません。
先輩方の御教示、よろしくお願いいたします。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2017/06/24 19:31