回答編集履歴

修正

2024/07/03 03:28

投稿

スコア4963

answer CHANGED Viewed

@@ -1,6 +1,6 @@
 追記の追記
 --------
-コメントにて、並べ替えの方法が提示されましたが、想定している並べ替え方と違うため、下記回答ではできません。
+コメントにて、並べ替えの方法が提示されましたが、想定している並べ替え方と違うため、下記回答ではできないケースがあるかもしれません。
 追記
 ----

修正の修正

2024/07/03 03:22

投稿

スコア4963

answer CHANGED Viewed

@@ -1,7 +1,23 @@
+追記の追記
+--------
+コメントにて、並べ替えの方法が提示されましたが、想定している並べ替え方と違うため、下記回答ではできません。
 追記
 ----
-コメントにて、並べ替えの方法が提示されましたが、想定している並べ替え方と違うため、下記回答ではできません。
+もとのdfがちゃんと並んでいるわけではなく、こちらで整列の方法も考える必要があるみたいです。できるだけ連番ができるようにしてみました。
+```python
+df['n'] = df.groupby(['居住地', '勤務地', 'day']).cumcount()
+df = df.sort_values(['居住地', '勤務地', 'n', 'day']).drop(columns='n')
+consecutive = ((df['居住地'] == df['居住地'].shift(1))
+               & (df['勤務地'] == df['勤務地'].shift(1))
+               & (df['day'] - df['day'].shift(1) == 1))
+df['uniqueid'] = (~consecutive).cumsum()
+```
+元の回答とは、ソートの方法を変えただけです。(コード省略のため、uniquid は連番のままです)
 元の回答
 ---------
 質問やコメントにある、同じ uniqueid を割り振る条件がちょっと曖昧なので、勝手な想像で

修正

2024/07/03 02:35

投稿

スコア4963

answer CHANGED Viewed

@@ -1,21 +1,7 @@
 追記
 ----
-もとのdfがちゃんと並んでいるわけではなく、こちらで整列の方法も考える必要があるみたいです。
+コメントにて、並べ替えの方法が提示されましたが、想定している並べ替え方と違うため、下記回答ではできません。
-できるだけ連番ができるようにしてみました。
-```python
-df['n'] = df.groupby(['居住地', '勤務地', 'day']).cumcount()
-df = df.sort_values(['居住地', '勤務地', 'n', 'day']).drop(columns='n')
-consecutive = ((df['居住地'] == df['居住地'].shift(1))
-               & (df['勤務地'] == df['勤務地'].shift(1))
-               & (df['day'] - df['day'].shift(1) == 1))
-df['uniqueid'] = (~consecutive).cumsum()
-```
-元の回答とは、ソートの方法を変えただけです。(コード省略のため、uniquid は連番のままです)
 元の回答
 ---------
 質問やコメントにある、同じ uniqueid を割り振る条件がちょっと曖昧なので、勝手な想像で

ソートの変更

2024/07/03 02:28

投稿

スコア4963

answer CHANGED Viewed

@@ -1,3 +1,23 @@
+追記
+----
+もとのdfがちゃんと並んでいるわけではなく、こちらで整列の方法も考える必要があるみたいです。
+できるだけ連番ができるようにしてみました。
+```python
+df['n'] = df.groupby(['居住地', '勤務地', 'day']).cumcount()
+df = df.sort_values(['居住地', '勤務地', 'n', 'day']).drop(columns='n')
+consecutive = ((df['居住地'] == df['居住地'].shift(1))
+               & (df['勤務地'] == df['勤務地'].shift(1))
+               & (df['day'] - df['day'].shift(1) == 1))
+df['uniqueid'] = (~consecutive).cumsum()
+```
+元の回答とは、ソートの方法を変えただけです。(コード省略のため、uniquid は連番のままです)
+元の回答
+---------
 質問やコメントにある、同じ uniqueid を割り振る条件がちょっと曖昧なので、勝手な想像で
 - もとの df を [居住地, 勤務地] で stable なソートをしたデータで、
 - 居住地、勤務地が同じで、day が連番になっているかたまり