前提・実現したいこと
pythonのpandasでダミー変数を作成したい。
tensorflowを使ってJリーグの観客数を予測しようとしているのですが、入力値としてnumpy.arrayを使いたいためダミー変数化する必要がある部分があります。
データはあるサッカーの試合の(日付、対戦チーム名、天気、スタジアム、...観客数)からできているのですが、対戦チームをそのまま入力にはできないためダミー変数を使いたいです。
ダミー変数はサッカーのチーム名なのですが、訓練用データと検証用データで含まれるチームが異なりデフォルトのget_dummy()では二つのデータで列数が変わってしまいtensorflowで学習させれないです。
そこで、例えばですがチーム名のリスト[A,B,C,...Z]の26チームですべてのチームを網羅しているとして、訓練データ、検証用データ両方ともにこの列で分類しようとしていますが方法がわかりませんでした。
発生している問題・エラーメッセージ
なし
該当のソースコード
python
試したこと
ここに問題に対して試したことを記載してください。
補足情報(FW/ツールのバージョンなど)
ここにより詳細な情報を記載してください。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/10/12 09:29