Python のPandasを使用したグループ集計について教えてほしいです
途中までソースを記載しているのもありましてそちらもここに記載させて頂きます。
<やりたいこと>
AとBの2つのCSVファイルがある
それらを下記の条件で結合させたい
結合の際下記の状況を示すラベルを追加
ラベルカラムに
| 条件 | ラベルの内容 |
|---|---|
| AとBに同じ内容があった場合 | int(回数)+ "連続" |
| Aが新規ラベル且つBに同じ内容があった場合 | "2回連続" |
| Bだけにあった場合 | "新規" |
| Aだけにあった場合 | "解決" |
上記のようなカラムを加えてAとBの結合ファイルを作成したい
お手数おかけしますが、
よろしくお願い致します。
ファイルA
| 列1 | 列2 | 列3 | ラベル |
|---|---|---|---|
| 1 | 2 | 3 | 新規 |
| 1 | 2 | 4 | 5回連続 |
| 1 | 2 | 5 | 新規 |
| 1 | 2 | 6 | 新規 |
| 1 | 2 | 9 | 4回連続 |
ファイルB
| 列1 | 列2 | 列3 |
|---|---|---|
| 1 | 2 | 3 |
| 1 | 2 | 4 |
| 1 | 2 | 7 |
結合ファイル
| 列1 | 列2 | 列3 | ラベル |
|---|---|---|---|
| 1 | 2 | 3 | 2回連続 |
| 1 | 2 | 4 | 6回連続 |
| 1 | 2 | 5 | 解決 |
| 1 | 2 | 6 | 解決 |
| 1 | 2 | 9 | 解決 |
| 1 | 2 | 7 | 新規 |
あなたの回答
tips
プレビュー