現状
0 1 2 3
0 339.0 106.0 0.632479 2.0
1 407.0 115.0 0.906053 3.0
2 458.0 115.0 0.910999 4.0
3 314.0 221.0 0.572901 8.0
4 149.0 252.0 0.131463 8.0
5 385.0 260.0 0.891231 9.0
6 216.0 257.0 0.106395 10.0
7 335.0 317.0 0.640136 10.0
8 367.0 67.0 0.950752 14.0
9 346.0 72.0 0.909803 16.0
所望の出力
0 1 2 3
0 339.0 106.0 0.632479 2.0
1 407.0 115.0 0.906053 3.0
2 458.0 115.0 0.910999 4.0
3 314.0 221.0 0.572901 8.0
5 385.0 260.0 0.891231 9.0
7 335.0 317.0 0.640136 10.0
8 367.0 67.0 0.950752 14.0
9 346.0 72.0 0.909803 16.0
行いたいこと
・3列目(ラベル)を参照する
・同じもの(同ラベル)があれば2列目(確率)を参照する
・値(確率)が低い方を削除する
行ったこと
pandasのduplicated()を用いました。
data_last=data_3.drop_duplicates(subset=[3])
しかし、この場合だと、データフレームの3、4行目には対応できるのですが、6、7行目には対応しません。
お願い
__行いたいこと__で記述したような手順、もしく簡易的な手順があればご教示していただければ幸いです。
よろしくお願いいたします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/06/16 04:22
2020/06/16 04:36