テーブル集計はじめたばかりなのですが、
下のような、基準日(例えば2021/4/1)からの経過日数におけるユーザーの状態を取りたいです。
# データについて import pandas as pd df = pd.DataFrame({'ユーザー名':['田中さん', '佐藤さん','本間さん','佐藤さん','本間さん','田中さん','田中さん',], '来店時':['2021-04-1 04:1:47','2021-04-4 04:13:47','2021-04-2 10:10:47','2021-04-1 22:13:47','2021-04-3 22:13:47','2021-04-2 22:13:47','null'], '購入時':['null','2021-04-4 04:13:47','2021-04-3 10:10:47','null','2021-04-3 22:13:47','null','null'] })
ndf = df.groupby('ユーザー名').min()
groupbyにより、初回来店、初回購入時は集計できたのですが、経過日数(n日)における
ユーザーの状態を取得するにはどうすればいいのかわからず、悩んでおります。
どのようにしたら一括処理で実現できますか?
SQLでいうWindow関数?を使えば実現できますか?
非常に拙い説明で恐縮ですが、よろしくお願いします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。