機械学習のプロジェクトに参加することになり質問です。
scikit-learnを使います。
アイリスの種類をrandomforestで判別する部分まで理解ができました。
このようなデータは分かりやすく、1行1行が独立しています。
iris.csv
iris.csv
1hanabira,kuki,shurui 25,5,A 36,5,B 47,3,B 54,4,A 63,3,? // ? => A
しかし行同士が関係している場合はどうアプローチしたらいいか分かりません。
2020年10月は3名の参加、2020年11月は2名の参加となってますが、scikit-learnは何名の参加者がいるか多分わからないでしょう。
そんな中2022年の結果が1位か2位かわからず3とか5とか作るんではないでしょうか。
この部分をどうしたらいいかコードを教えてもらえないでしょうか。
sugaku_orinpic.csv
1kaisai.month,rank,name 2202010,1,A 3202010,3,C 4202010,2,B 5202011,2,B 6202011,1,A 7202012,1,B 8202201,?,A // ? => 9202201,?,B // ? =>
過去の実績から予測したら
1位:Cさん
2位:Bさん
となるけど、「何らかの事情」でその時はCさんは参加できず、Bさんが繰り上がって1位になる
的なことを予測したい、ということでしょうか?
年月の数=参加者の数なので、その中でのランクを予想したいというイメージです。
よろしくお願いします!!!
「sugaku_orinpic.csv」が数学の問題を解いた順位で、参加者がA, B, Cさん三名以外はいないなら、下記のようにするとか
・機械学習では、実際に参加するかどうかは無視して、A, B, Cさん三名の問題を解いた得点を予測する
・上記得点予測結果と、実際には誰が参加したかのデータを照合して、参加した人だけで1位から順番に順位を決める
機械学習 順位 予測
でググったら、競馬の順位を機械学習で予測するのがたくさん見つかるので、そういうのを参考にしたらいいかも
直接順位を予測するのではなく、レースに参加する馬毎に「1位になりやすさ」みたいな数値を予測して、それの順番に並べるみたい
たとえば、タイムを予測して、タイムが短い順に並べるとか
参加する相手が分からないので順位を予想すること自体ができないと思いましたが機械学習ならできるのでしょうか?Aさんが出るとBさんは負けやすい、というのが集計されないとおもいましたが機械学習なら分かるんですか?
理解するのが難しいですね。コメントで色々と勉強になります。
ありがとうございます。
「sugaku_orinpic.csv」が数学の問題を解いた順位なら、順位を予測するのではなくて、問題を解いた得点を予測したらいいのではないですかね
> Aさんが出るとBさんは負けやすい
Bさんの予測得点よりもAさんの予測得点の方が高いなら、Aさんの方が上の順位になると予測できます
ほお!確かに!です。考え方を工夫してうまくツールに合わせることが解決法だったのか。
大変勉強になります。
ここで納得のいく方法たのですがBA差し上げたいです。どうしたらいいのだろう
同内容を回答に書いてます
回答2件
あなたの回答
tips
プレビュー