データフレーム内のデータを統合する方法を教えていただきたいです。
addressという列に、同じ番地のデータが1つずつバラバラにあるのですが、これをまとめて1つのデータ
として扱えるようにしたいです。
イメージとしては、
このような形で、1つの番地のデータのなかに、それぞれのid、Day⓵、Day⓶のデータが含まれているといったイメージです。
【このデータ処理後の方針】
このデータから、居住者が変化している番地がどれだけあるかを年代ごとにカウントしたいと考えています。(最終目的)
id:居住者を表すナンバー, Day⓵:住み始めた日, Day⓶:出ていった日, address:番地
をそれぞれ表しています。
例えば2枚目の画像のように、「10番地の12」という番地では、
id=11568,118627という2つの世帯が、異なる時期に住んでいるため、居住者が入れ替わっていることがわかります。
今回質問したデータの処理後としては、
⓵データ統合後、1つの番地データの中に、異なるidが複数含まれているもののみを抽出
⓶Day⓵、Day⓶から、居住者が入れ替わった年月を取得?
居住者が入れ替わっている番地がどれだけあるか、時系列変化をとらえる
という流れで進めていきたいと考えています。
分かりにくくて大変申し訳ありませんが、どなたか教えていただけないでしょうか?
質問内容だけでなく、アプローチ方法が適切でない場合も含め
アドバイスをいただければ幸いです。
よろしくお願いします。
回答1件
あなたの回答
tips
プレビュー