機械学習モデルを完成させたのですが、それをtest用データに適用する方法が分からなくて質問させていただきます。
まず機械学習モデルの挙動についてですが、
Python
1predict(data["description"].values[ID]) 2 3>>> 3
と言うものになっています。そして、1-4までの4つの数字のどれかが帰ってきます。
そしてデータは、以下のようなものになっています。
"ID" "description" 0 executes and writes portions of testing plans,... 1 maintain network performance by assisting with... 2 supports the regional compliance manager with ... 3 keep up to date with local and national busine... 4 assist with service organization control (soc)... ... ... ... ... 2926 preparation of reports for operational and man... 2927 line and/or indirect management of up to... 2928 partner with external agencies as needed 2929 design, implement and test software for embedd... 2930 undertake to preprocess of structured and unst...
理想はこのような形にすることです。
"ID" "description" "jobflag" 0 executes and writes portions of testing plans,... 2 1 maintain network performance by assisting with... 3 2 supports the regional compliance manager with ... 4 3 keep up to date with local and national busine... 1 4 assist with service organization control (soc)... 4 ... ... ... ... 2926 preparation of reports for operational and man... 3 2927 line and/or indirect management of up to... 3 2928 partner with external agencies as needed 1 2929 design, implement and test software for embedd... 3 2930 undertake to preprocess of structured and unst... 2
forループで回してjobflagの数字だけが入ったnumpyの配列を作り、つなげたら良いかなと思うのですが、もっと良い方法を教えて欲しいです。
あなたの回答
tips
プレビュー