同じIDごとで欠損値以外の値をまとめる

同じIDごとで欠損値以外の値をまとめるというプログラムを書きたいです。
→値があるセルをまとめて、一行にするというイメージです。

データフレームのイメージとしては、以下の通りです。
NaN = 欠損値

例えば、Bの患者はNaNだけなので、NaNだけの1行になる
Eの患者は、SBP178, HR72, SpO2 98, RR18のデータで1行になる
のような形です。

書いたコードはこちらです。

'ID'で括る
df_g = df.groupby('ID')

'ID'でくくられたデータフレームの中で'Vital_time'に最小値を含む行を抜き出す
def select(xx):
'PcrKey'に最小値を含む行を抜き出す
Key_r = xx[xx['time'] == min(xx['time']) ]

return Key_r

df_ture = df_g.apply(select)

→
TIMEで重複行があった場合は削除
Key_r = Key_r.drop_duplicates(subset='TIME')

このコードを追加したところ、上段にあるデータが採用され、他にデータあっても無視されてしまうので不都合です。
ご教授ください。

行動規範の内容に同意します

回答1件

ベストアンサー

求めるものはこうですか。

投稿2021/08/16 13:49

総合スコア24670

2021/08/16 14:35

すごいですね、、できました。。。！いつもありがとうございます。

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問