前提・実現したいこと
Python初心者です。pandasを使い、2つのデータフレームを2つのキーによりouterで結合しました。この時、以下のような状態になりました。
元データフレーム2つの行数の合計:450
2キーによりouterで結合した後のデータフレームの行数:448
このように結合後は2行減っています。この時、減った2行を確認するにはどうすればいいでしょうか。また、減った理由としては、結合時に使った2つのキーが重複していたからと考えてよいでしょうか。
試したこと
減った2行を確認するため、以下のコードを書きました。しかし、出力された行が多く、上記の結果とは合致しません。
Python
1# 2つのデータフレームを縦方向に結合する 2import pandas as pd 3 4df_inspect = pd.concat([df1, df2], join='outer') 5 6# 重複行の抽出 7df_inspect_dup = df_inspect[df_inspect.duplicated(subset=['hoge1', 'hoge2'], keep=False)] 8display(df_inspect_dup)
環境
GoogleColaboratoryを使っています。