回答編集履歴

追記

2022/06/06 08:31

投稿

スコア38352

answer CHANGED Viewed

@@ -5,7 +5,10 @@
 とあるように、両者に何らかの制約条件があるなら、その条件で絞る（さらに重複していたらdrop_する）とよいです。
+あるいは、同じ`year`が複数存在するID（複数）行全体を削除することもできます。
 ```Python
 import pandas as pd
 from io import StringIO
@@ -29,6 +32,7 @@
 df2 = df.drop_duplicates('year')
 print(df2)
 """
+        year
 ID age
 1  10   2012
    11   2011
@@ -46,4 +50,17 @@
    11   2011
 2  22   2000
 """
+# yearが重複しているID（複数）行全体を削除したいなら
+df_g1 = (df.groupby(['ID','year']).size() <= 1) # yearが重複していなければTrue
+df_g2 = (df_g1.groupby('ID').sum() >= 1)        # yearが重複していないID行ならTrue
+df_g3 = df_g2[df_g2] # 条件に一致するIDを抽出
+filter = (df.index.get_level_values(0).isin( df_g3.index)) # ID値で抽出
+df2 = df[filter]
+print(df2)
+"""
+ID age
+1  10   2012
+   11   2011
+"""
 ```