位置情報データを扱っています。
データ量は約数千万レコードです。
"千代田区"に滞在したユーザを対象に、
2つの列を追加したいのですが、苦戦しています。
・千代田区の滞在時間列(時刻差分)
・千代田区の滞在時間(時刻差分)の合計列
時刻差分を計算する際、千代田区の起時を都度、0にしたいのですが、うまくいきません。
知見のある方、ご教示いただけないでしょうか。
宜しくお願い致します。
【df】
Index| id | Timestamp | citycode(=市区町村コード) ※適当です
0 AA1 2022/06/10 11:07 001(千代田区)
1 AA1 2022/06/10 11:22 001(千代田区)
2 AA1 2022/06/10 12:10 003(新宿区)
3 AA1 2022/06/10 14:04 001(千代田区)
4 AA1 2022/06/10 14:41 001(千代田区)
5 AA1 2022/06/10 16:24 005(渋谷区)
6 AA1 2022/06/10 19:54 001(千代田区)
7 BB4 2022/06/11 06:06 001(千代田区)
8 BB4 2022/06/11 07:58 006(目黒区)
9 BB4 2022/06/11 08:37 001(千代田区)
10 BB4 2022/06/11 17:50 001(千代田区)
11 BB4 2022/06/11 20:25 001(千代田区)
12 BB4 2022/06/11 22:33 006(目黒区)
↓
【列追加後(イメージ)】
Index| id | Timestamp | citycode | diff | diff_sum
0 AA1 2022/06/10 11:07 001(千代田区) 0 112
1 AA1 2022/06/10 11:22 001(千代田区) 15 112
2 AA1 2022/06/10 12:10 003(新宿区) 0 112
3 AA1 2022/06/10 14:04 001(千代田区) 0 112
4 AA1 2022/06/10 15:41 001(千代田区) 97 112
5 AA1 2022/06/10 16:24 005(渋谷区) 0 112
6 AA1 2022/06/10 19:54 001(千代田区) 0 112
7 BB4 2022/06/11 06:06 001(千代田区) 0 747
8 BB4 2022/06/11 07:58 006(目黒区) 0 747
9 BB4 2022/06/11 08:37 001(千代田区) 39 747
10 BB4 2022/06/11 17:50 001(千代田区) 553 747
11 BB4 2022/06/11 20:25 001(千代田区) 155 747
12 BB4 2022/06/11 22:33 006(目黒区) 0 747
回答2件
あなたの回答
tips
プレビュー