データフレームdf1(7976 rows × 167 columns)があります。
df2=df1.drop_duplicates()でdf2(6439 rows × 167 columns)を得ます。
ここでdf1から削除された行の中で特定のインデックスに対応する行(これらのインデックスはindex_listに入っているとします。12個のインデックスです。)と重複しており、df2に残ったもののインデックスを取り出したいです。わかりにくいかもしれませんが、削除された行の中でindex_listに含まれるインデックスを持った行と重複していながらも重複一番目だけを残す条件(keep=first)により残ったもののインデックスを知りたいです。
なお重複している場合はすべてのコラムの値が重複しています。
下を実行し以下のエラーが出ました。
python
1 2get_index=[] 3for i in index_list: 4 for j in df2.index: 5 if df1.loc[i, :]==df2.loc[j,:]: 6 get_index.append(j) 7 8get_index 9 10 11--------------------------------------------------------------------------- 12 13ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all(). 14
どうぞよろしくお願いします。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/06/11 10:25
2018/06/11 10:47
2018/06/11 10:48
2018/06/11 10:48
2018/06/11 11:12