標題の通り、dataframeに対して、更新日時情報以外同じ値を持つレコードに対して最新のレコードのみを保持するためにはどのような操作を行うべきでしょうか?
具体的には以下の様なid, 使命, 入場時刻を保持したDataFrameについて、同じid, 指名を持つレコードについて最新の入場時刻のレコードのみを保持したものへと変換を行いたいです。
inputDF
1# id name entry_time 2#0 0 John 2021-08-09 15:18:00 3#1 1 Ben 2021-08-09 17:14:36 4#2 2 Lisa 2021-08-09 19:18:52 5#3 3 Mike 2021-08-10 10:23:32 6#4 1 Ben 2021-08-10 11:18:32 7#5 3 Mike 2021-08-11 15:18:32 8#6 0 John 2021-08-12 11:43:06 9#7 1 Ben 2021-08-12 15:18:32 10#8 0 John 2021-08-13 08:30:21 11#9 2 Lisa 2021-08-13 12:10:55
outputDF
1# id name entry_time 2#0 0 John 2021-08-13 08:30:21 3#1 1 Ben 2021-08-12 15:18:32 4#2 2 Lisa 2021-08-13 12:10:55 5#3 3 Mike 2021-08-11 15:18:32
1行ずつレコードを取り出して、同じid, nameを持つものに対して比較を行うというのが思い浮かびはしましたが、計算量的にもっとスマートなやり方があるのではないかと思い起票させていただきました。
有識者の方がいらっしゃいましたらご教授いただければ幸いです、どうぞよろしくお願いいたしますmm
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/08/21 12:27