pandas dfで経過日数におけるユーザーの状態を取得

テーブル集計はじめたばかりなのですが、

画像のような、来店、購入履歴があるデータテーブルにおいて、

下のような、基準日(例えば2021/4/1)からの経過日数におけるユーザーの状態を取りたいです。

# データについて
import pandas as pd
df = pd.DataFrame({'ユーザー名':['田中さん', '佐藤さん','本間さん','佐藤さん','本間さん','田中さん','田中さん',],
                   '来店時':['2021-04-1 04:1:47','2021-04-4 04:13:47','2021-04-2 10:10:47','2021-04-1 22:13:47','2021-04-3 22:13:47','2021-04-2 22:13:47','null'],
                   '購入時':['null','2021-04-4 04:13:47','2021-04-3 10:10:47','null','2021-04-3 22:13:47','null','null']
                   })

ndf = df.groupby('ユーザー名').min()

groupbyにより、初回来店、初回購入時は集計できたのですが、経過日数（n日）における
ユーザーの状態を取得するにはどうすればいいのかわからず、悩んでおります。
どのようにしたら一括処理で実現できますか？

SQLでいうWindow関数？を使えば実現できますか？

非常に拙い説明で恐縮ですが、よろしくお願いします。

行動規範の内容に同意します

回答1件

ベストアンサー

こんな感じです。

python
1>>> import pandas as pd
2>>> df = pd.DataFrame({'ユーザー名':['田中さん', '佐藤さん','本間さん','佐藤さん','本間さん','田中さん','田中さん',],
3...                    '来店時':['2021-04-1 04:1:47','2021-04-4 04:13:47','2021-04-2 10:10:47','2021-04-1 22:13:47','2021-04-3 22:13:47','2021-04-2 22:13:47','null'],
4...                    '購入時':['null','2021-04-4 04:13:47','2021-04-3 10:10:47','null','2021-04-3 22:13:47','null','null']
5...                    })
6>>>
7>>> ndf = df.groupby('ユーザー名').min()
8>>> ndf2 = ndf.mask(ndf=='null', '2050-01-01 0:0:0')
9>>> ndf2['来店時'] = pd.to_datetime(ndf2['来店時'])
10>>> ndf2['購入時'] = pd.to_datetime(ndf2['購入時'])
11>>> start = pd._libs.tslibs.timestamps.Timestamp(2021,4,1)
12>>> def check(row, start, days):
13...     if (row['来店時']-start).days >= days:
14...         return '未来店_未購入'
15...     elif (row['購入時']-start).days < days:
16...         return '来店済み_購入済み'
17...     else:
18...         return '来店済み_未購入'
19...
20>>> for i in range(1,4):
21...     ndf2[f'{i}日目状態'] = ndf2.apply(lambda row: check(row, start, i), axis=1)
22...
23>>> print(ndf2)
24                      来店時                 購入時     1日目状態     2日目状態      3日目状態
25ユーザー名
26佐藤さん  2021-04-01 22:13:47 2021-04-04 04:13:47  来店済み_未購入  来店済み_未購入   来店済み_未購入
27本間さん  2021-04-02 10:10:47 2021-04-03 10:10:47   未来店_未購入  来店済み_未購入  来店済み_購入済み
28田中さん  2021-04-01 04:01:47 2050-01-01 00:00:00  来店済み_未購入  来店済み_未購入   来店済み_未購入