前提
以下のようなdfを保持しているとします。
vehicleID | GPS_class_info | time |
---|---|---|
1 | 12 | 2020-04-24 16:08:09.070 |
1 | 12 | 2020-04-24 16:08:09.180 |
1 | 12 | 2020-04-24 16:08:09.280 |
1 | 12 | 2020-04-24 16:08:09.390 |
1 | 12 | 2020-04-24 16:08:09.390 |
2 | 1 | 2020-04-24 16:10:09.390 |
3 | 1 | 2020-04-24 16:12:09.280 |
3 | 1 | 2020-04-24 16:12:09.390 |
3 | 1 | 2020-04-24 16:12:09.490 |
##実現したい形
vehicleIDごとのカウント数が1以下の物を外れ値として消去したい。
vehicleID | GPS_class_info | time |
---|---|---|
1 | 12 | 2020-04-24 16:08:09.070 |
1 | 12 | 2020-04-24 16:08:09.180 |
1 | 12 | 2020-04-24 16:08:09.280 |
1 | 12 | 2020-04-24 16:08:09.390 |
1 | 12 | 2020-04-24 16:08:09.390 |
3 | 1 | 2020-04-24 16:12:09.280 |
3 | 1 | 2020-04-24 16:12:09.390 |
3 | 1 | 2020-04-24 16:12:09.490 |
### 発生している問題・エラーメッセージ | ||
一行列を追加してvehicleIDが持つ数が1以下であればフラグを立てるような処理をして消去しようとしているのですが、 | ||
方法が思いつきません。 |
vehicleID | GPS_class_info | time | outliers |
---|---|---|---|
1 | 12 | 2020-04-24 16:08:09.070 | |
1 | 12 | 2020-04-24 16:08:09.180 | |
1 | 12 | 2020-04-24 16:08:09.280 | |
1 | 12 | 2020-04-24 16:08:09.390 | |
1 | 12 | 2020-04-24 16:08:09.390 | |
2 | 1 | 2020-04-24 16:10:09.390 | |
3 | 1 | 2020-04-24 16:12:09.280 | |
3 | 1 | 2020-04-24 16:12:09.390 | |
3 | 1 | 2020-04-24 16:12:09.490 |
試したこと
vehicleIDごとのカウントはできたのですが、先に進めていません。
良い方法があればご教示お願いします。
python
1df.groupby('vehicleID').count()["GPS_class_info"]
補足情報(FW/ツールのバージョンなど)
python3.7
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/09/17 06:29