pandasを利用して部分重複情報を除外してリストを整理したいと考えていますが、
空白情報を無視して処理する方法を模索しております。
重複処理したい情報
name | tel | |
---|---|---|
mike | us@gmail.com | 03-1111-2222 |
taro | japan@gmail.com | 03-2222-2222 |
hanako | 03-3333-3333 | |
takeshi | 03-4444-4444 | |
taro | japan@gmail.com | |
mike | 03-1111-2222 |
# emailを指定して重複情報を確認 print(df.drop_duplicates(['email'])) # NaNも重複として認識されてしまう。。。これを無視して処理をしたい。 out: name email tel 0 mike us@gmail.com 03-1111-2222 1 taro japan@gmail.com 03-2222-2222 2 hanako NaN 03-3333-3333
処理後の完成イメージ
name | tel | |
---|---|---|
mike | us@gmail.com | 03-1111-2222 |
taro | japan@gmail.com | 03-2222-2222 |
hanako | 03-3333-3333 | |
takeshi | 03-4444-4444 |
初歩的な質問かとは存じますが、自己解決できなかったのでご教示いただけましたら幸甚です。
参考になるwebページを紹介いただくだけも構いません。
何卒よろしくお願い申し上げます。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/03/07 21:38