pandas 2列間で同じ要素を削除する

Question

"source"と"target"の値が重複している行を削除したいです．

```python
import pandas as pd

df = pd.DataFrame(
    {   "id":[0,1,2,3,4,5],
        "name":["A","B","C","D","E","F"],
        "source": [0,0,1,0,3,2],
        "target": [1,2,1,2,5,0],
    }
)
print(df)
"""
   id name  source  target
0   0    A       0       1
1   1    B       0       2
2   2    C       1       1
3   3    D       0       2
4   4    E       3       5
5   5    F       2       0
"""
# 上のデータフレームを次のようにしたい
"""
   id name  source  target
0   0    A       0       1
1   1    B       0       2
2   2    C       1       1
3   4    E       3       5
"""
```

### やってみたこと
```python
df = df.drop_duplicates(subset=['source','target'])
print(df)
"""
   id name  source  target
0   0    A       0       1
1   1    B       0       2
2   2    C       1       1
4   4    E       3       5
5   5    F       2       0
"""
```
この方法だと"name" ="F" の行が残ってしまいます．
単純な重複の削除ではなく，source=0,target=2とsource=2,target=0も同じものと判断したいです．

### 解決方法(これよりもっといい方法が知りたい)
データフレームをリストに変換し，集合を用いて"source"と"target"の重複を取り除き，
再びリストをデータフレームに再変換することでやりたいことが実現できました．
```python
df = pd.DataFrame(
    {   "id":[0,1,2,3,4,5],
        "name":["A","B","C","D","E","F"],
        "source": [0,0,1,0,3,2],
        "target": [1,2,1,2,5,0],
    }
)

l = []
new_df = []
for _,(name_id,name,source,target) in df.iterrows():
    if not {source,target} in l:
        l.append({source,target})
        new_df.append([name_id,name,source,target])

df = pd.DataFrame(new_df,columns=['id', 'name', 'source', 'target'])
print(df)
"""
   id name  source  target
0   0    A       0       1
1   1    B       0       2
2   2    C       1       1
3   4    E       3       5
"""
```

わざわざデータフレームをリストに変換することなくできる方法があれば教えていただけますか．

Accepted Answer

applyでsourceとtargetを集合化したSeriesを作り、それから重複を取り除いたindexで元のdfを絞ればよいです。
```Python
import pandas as pd

df = pd.DataFrame(
    {   "id":[0,1,2,3,4,5],
        "name":["A","B","C","D","E","F"],
        "source": [0,0,1,0,3,2],
        "target": [1,2,1,2,5,0],
    }
)
s = df.apply( lambda r: set((r['source'], r['target'])), axis=1)
df = df.loc[s.drop_duplicates().index]
print(df)
"""
   id name  source  target
0   0    A       0       1
1   1    B       0       2
2   2    C       1       1
4   4    E       3       5
"""
```

Answer

```python
dfx = (
  df.groupby(df[['source', 'target']].apply(frozenset, axis=1),
             sort=False, as_index=False)
    .first())

print(dfx)

#
   id name  source  target
0   0    A       0       1
1   1    B       0       2
2   2    C       1       1
3   4    E       3       5
```

やってみたこと

解決方法(これよりもっといい方法が知りたい)

関連した質問