DataFrameのohe_id列のユニーク値の個数がn個以上のものを抜き出して、新しくdataframeを作る
というコードを、pythonで書きたいです。
やりたいことのイメージ
[変更前]
|id|ohe_id||
|:--|:--:||
|1|20|
|2|20|
|3|20|
|4|30|
|5|30|
|6|30|
|7|40|
|8|40|
例えば、このohe_id列のユニーク値の個数が3個以上のもので新しくDataFrameを作れるようなコードが知りたいです。以下のような感じです。
|id|ohe_id||
|:--|:--:||
|1|20|
|2|20|
|3|20|
|4|30|
|5|30|
|6|30|
「前提」
実際のデータは、ohe_idのユニーク値の個数が2000個以上あるので、できるだけohe_idのデータ値(20など)を直接参照しないやり方をご教授頂きたいです。
めんどくさい質問で大変恐縮ですが、どうぞよろしくお願いいたします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2017/12/22 03:07